Sunteți pe pagina 1din 8

PRELEGEREA XI

STATISTIC MATEMATIC

I. Testarea ipotezelor statistice


I. Asupra testrii ipotezelor statistice
Am vzut c, pentru determinarea parametrului unei populaii se parcurg urmtoarele
etape:
- se extrage un eantion aleator din populaia cercetat;
- se strng informaii despre eantionul respectiv;
- se calculeaz valoarea unei statistici, cel mai adesea o medie sau o proporie;
- se trag concluzii asupra parametrului corespunztor pe baza statisticii calculate.
O alt parte dintre prelucrrile statistice, chiar principal, se execut pentru
verificarea ipotezelor statistice fcute de ctre cercettori, asupra parametrilor unei
populaii, deci tot o problematic de inferen statistic. n majoritatea cazurilor vor
exista diferene ntre cele dou valori., iar metodele de testare statistic permit s se
decid dac diferena este att de mare nct s se resping presupunerea fcut asupra
parametrului populaiei de referin, care, n cele mai multe cazuri trebuie s
ndeplineasc condiia de normalitate. De aceea, testele din aceast categorie se numesc
teste parametrice. Alte materiale denumesc teste parametrice, doar cele care se aplic
asupra verificrii ipotezelor privitoare la distribuii continue. Nu exist o linie de
demarcaie rigid ntre cele dou categorii de teste, parametrice i nonparametrice, unele
teste nonparametrice fiind acceptate n locul celor parametrice atunci cnd distribuia
continu cercetat nu se comport ca o distribuie normal.
Algoritmul de rezolvare a unei probleme de acest gen cuprinde:
- formularea unei ipoteze asupra populaiei de interes studiat;
- obinerea unui eantion aleator;
- verificarea ipotezei pe baza informaiilor culese despre eantion, prin utilizarea
unui test statistic corespunztor.
Ipoteza supus verificrii pe baza unui test statistic poart denumirea de ipoteza nul
(sau ipoteza de nul), iar contrara ei este ipoteza alternativ. Notaia utilizat pentru
ipoteza nul este (H 0 ), iar pentru ipoteza alternativ, (H 1 ).
Prin statistica unui test se nelege formula a crei aplicare n testul respectiv
permite obinerea unei valori pe baza creia se ia o decizie asupra ipotezei nule:
respingerea acesteia n favoarea ipotezei alternative sau acceptarea ei n detrimentul
ipotezei alternative. Dac intereseaz sensul diferenelor n formularea ipotezei
alternative, atunci se poate alege un test bilateral (sau non-direcional) sau un test
unilateral (sau direcional).
Pentru unui nivel de semnificaie considerat, valoarea calculat a testului aplicat
se compar cu valoarea tabelat din distribuia de eantionare respectiv a valorilor
tuturor eantioanelor posibile, pentru stabilirea zonei critice sau a zonei de respingere
necesar n verificarea ipotezei de nul. Deci, zona critic sau zona de respingere se
refer la o plaj de valori din distribuia de eantionare corespunztoare rezultatului
statisticii, care conduce la luarea deciziei de respingere a ipotezei de nul. Cu foarte puine
excepii, respingerea ipotezei de nul se statueaz prin urmtoarea regula de decizie:

Se respinge H 0 ,
- pentru un test bilateral, dac (valoarea calculat a testului) > +(valoarea critic)
sau (valoarea calculat a testului) < -(valoarea critic);
- pentru un test unilateral, n funcie de sensul diferenelor n formularea
ipotezei alternative:
- dac (valoarea calculat a testului) > (valoarea critic);
- dac (valoarea calculat a testului) < -(valoarea critic).
Observaie. Valorile critice ale diverselor teste diferite de cele ale testelor uzuale, Z,
Student, 2, F sau Kolmogorov-Smirnov care se gsesc n orice material de statistic, se
vor prezenta acolo unde este cazul.
Alegerea unui test n verificarea unei ipoteze de nul depinde de nivelul de msur
a datelor, de mrimea eantioanelor, de enunul ipotezei sau de condiiile pe care le
ndeplinete populaia de referin. Urmtoarele trei tabele prezint, n mod succint, lista
testelor statistice nonparametrice i parametrice.
Nivelul
Teste statistice nonparametrice
de
Pentru un Pentru
dou Pentru k eantioane
msur eantion
eantioane
a
DepenIndepen- DepenIndedatelor
dente
dente
dente
pend.
Nominal 1.Testul
1.Testul
1.Testul
1.Testul
1.Testul
binomial
McNemar Fisher
Cochran
2
2
2.Testul
(Q)
2.Testul
2
de
de
concordan.
independ.
Ordinal 1.Testul
1.Testul
1.Testul
1.Testul
1.Testul
KolmigoWilcoxon medianei Friedman Kruskalrov2.Testul
Wallis
Smirnov
ManWhitney
pentru un
(U)
eantion
2.Testul
iteraiilor
3.Testul
KolmogorovSmirnov
4.Testul
Moses
Interval
1.Testul
1.Testul
Walsh
de
2.Testul
randode
mizare
randomizare
Tabelul 11.1.1. Teste statistice nonparametrice
Majoritatea testele nonparametrice snt prezentate n partea de anexe.

Teste statistice parametrice pentru medie


Pentru un eantion
Pentru dou eantioane
Pentru k eantioane
1.Testul Z,
- cunoscut
2.Testul t,
- necunoscut,
eantion
mic
(volum sondaj30)
2.Testul Z,
- necunoscut,
eantion
mare
(volum sondaj>30)

1. Testul Z, pentru
1. Testul ANOVA
eantioane
mari, (pe o cale), pentru
independente
i populaii
cu
populaii cu dispersii dispersii egale
egale
2.Testul
ANOVA
(pe
dou
ci),
2.Testul t, pentru
eantioane
mici, pentru populaii cu
independente
i dispersii egale
populaii cu dispersii 3.Testul MANOVA,
pentru populaii cu
egale
dispersii egale
3. Testul t, pentru
eantioane
mici,
independente
i
populaii cu dispersii
diferite
4. Testul t, pentru
eantioane dependente
Tabelul 11.1.2. Teste statistice parametrice pentru medie
Tipul
Alte teste parametrice
param.
Pentru un eantion
Pentru dou eantioane
Dispersie
1. Testul Fisher
Proporie 1.Testul
Z
pentru 1.Testul Z, pentru
eantioane mari
eantioane
mari
i
2. Testul binomial, pentru independente
eantioane mici
2. Testul
Z pentru
3. Testul
Z pentru eantioane dependente
eantioane dependente
Valori de 1.Testul Dixon
sondaj
2.Testul Grubbs
aberante
3. Testul Irwin
4. Testul Romanovschi
Tabelul 11.1.3. Alte teste statistice parametrice
Observaie. Pentru testarea normalitii unei distribuii empirice se pot utiliza testele
Lilliefors, testele bazate pe coeficienii beta, testul Sarkady i testul Shapiro-Wilk.
Testele parametrice se aplic datelor msurate la nivel interval sau de aparat, n
condiii de normalitate, altfel se utilizeaz un test non-parametric, aa cum am spus, deja,
mai sus. O parte din testele parametrice pentru un eantion snt prezentate n paragrafele
urmtoare, alt parte n anexe, iar testele de tip ANOVA vor constitui subiectul unui
capitol separat.

II. Teste parametrice


11.2.1 Teste statistice pentru medii
Am vzut mai sus c, noiunile fundamentale privitoare la testele statistice, n general, i
deci, la cele parametrice, n particular, snt: ipoteza nul (sau ipoteza de nul), ipoteza
alternativ, statistica unui test i regula de decizie.
Fie X caracteristica privitoare la o populaie de referin i fie H valoarea
presupus a mediei pentru populaia studiat.
Ipotezele se enun astfel:
- ipoteza nul: H 0 : = H . Aceasta se poate formula i sub forma, H 0 : - H
= 0, de unde justificarea denumirii de ipotez nul;
- ipoteza alternativ: H 1 : H sau H 1 : - H 0.
Ipoteza nul enun c nu exist nici o diferen semnificativ ntre valoarea
presupus a parametrului ( H ) i cea obinut din date experimentale (). Dac ipoteza
nul este adevrat, atunci diferena dintre media eantionului i cea a populaiei, din care
provine eantionul, nu este semnificativ, ea fiind atribuit ntmplrii. Dac ipoteza
alternativ este adevrat, atunci se respinge ipoteza nul. Dac sensul diferenei ntre
media eantionului i cea a populaiei este important, atunci ipoteza alternativ poate lua
una din formele:
H 1 : > H sau H 1 : < H .
n situaia cnd ipoteza alternativ este sub forma H 1 : H , testul este de tip
bilateral sau non-direcional, iar n celelalte dou cazuri, testul este de tip unilateral
sau direcional.
Exist dou situaii: a. valoarea este cunoscut i b. valoarea este
necunoscut, fiind abaterea standard a populaiei.
a) Dac abaterea standard, , este cunoscut, se folosete testul Z, gsit n
literatura de specialitate si sub denumirea de testul erorii standard a mediei. Statistica
testului Z o constituie formula:
x H
Z=
, adic formula de transformare a unei valori normale

n
n una standard pentru distribuia de eantionare. Valoarea obinut prin acest test
exprim distana n abateri standard a mediei eantionului, x , fa de cea presupus a
populaiei.
Aplicaie. Un cercettor presupune c media punctajului obinut de absolveni la
examenul de master este de 800 puncte. Deci, ipoteza nul este: H 0 : = 800, iar
ipoteza alternativ se poate formula sub forma:
H 1 : 800, dac nu ne intereseaz
un sens al diferenei. Pentru a testa ipoteza nul, se alctuiete un eantion aleator de 130
absolveni care au susinut examenul de master i se constat c media punctajului
obinut este de 755 puncte. n plus, se tie abaterea standard a populaiei de interes, =
152.
Dup aplicarea testului Z, se obine:
x H
755 800 45
Z=
=
= -3.36.
=

152
13.4
130
n

Conform teoremei limit centrale, cu ct x este mai aproape de centru (adic, cu ct


diferena dintre media populaiei i cea a eantionului este mai mic) cu att mai mult nu
trebuie s respingem ipoteza nul.
Semnificaia vocabulei aproape sau departe se precizeaz prin fixarea unui
nivel de semnificaie sau a unei sigurane statistice (nivel de ncredere) 1 - . n mod
obinuit, se alege un nivel de ncredere de 90%, 95% sau 99%.
Dac testul este bilateral, atunci nivelul de ncredere se mparte n mod egal n
cele dou extremiti ale distribuiei de eantionare, dup cum se vede n figura 10.2.1.1.
f(z)
1 - /2

-z 1-/2
+z 1-/2
Figura 11.2.1.1. Testul Z
Aria de sub z 1-/2 i aria de peste +z 1-/2 reprezint aria critic. Adic, dac
valoarea Z obinut cade n una din aceste zone, atunci media eantionului considerat are
prin definiie o probabilitate de apariie mai mic dect . Valorile -z 1-/2 i +z 1-/2 se
numesc valori critice.
Revenind la aplicaia de mai sus i fixnd = 0.05 (de regul, acesta se consider
un indicator bun al unui rezultat semnificativ), atunci z 1-/2 = 1.96. Valoarea Z
calculat, 3.36, fiind mai mic dect 1.96, ipoteza nul se poate respinge, deoarece
probabilitatea de apariie a mediei aritmetice a eantionului considerat este mai mic dect
0.05, deci nu poate fi atribuit ntmplrii.
Ca atare, diferena ntre media presupus pentru populaie i cea a eantionului
este semnificativ i deci ipoteza nul se respinge.
n concluzie, se respinge H 0 ,
- pentru un test bilateral, dac Z obinut > +z 1-/2 (critic) sau Z obinut < -z 1/2 (critic);
- pentru un test unilateral (H 1 : > H ), dac Z ob > z 1- ;
- pentru un test unilateral (H 1 : < H ), dac Z ob <-z 1- .
Un test unilateral este de preferat unui test bilateral, deoarece zona critic este
adus mai aproape de medie, mrind probabilitatea de a respinge ipoteza nul.
Este posibil ca decizia luat s fie greit n situaia cnd eantionul considerat nu
este reprezentativ pentru populaia studiat. Probabilitatea ca decizia luat s fie greit n
exemplul nostru este de 0.05, adic n situaia repetrii acestui test de o infinitate de ori,
vom respinge greit ipoteza nul de 5 ori la fiecare 100 de repetri.
Pe scurt, rezultatul unui test al ipotezelor se poate urmri n tabelul de mai jos:
H 0 adevrat
H 0 fals
Se respinge H 0
Eroare de tipul I Decizie corect
Nu se respinge H 0 Decizie corect
Eroare de tipul II
Tabelul 11.2.1.1. Rezultatul unui test al ipotezelor
Cu alte cuvinte, dou decizii snt corecte:
1) respingerea unei ipoteze de nul fals;
2) nerespingerea unei ipoteze de nul adevrat.

Probabilitatea de a comite o eroare de tipul I este desemnat prin nivelul de


semnificaie , iar probabilitatea de a comite o eroare de tipul II este desemnat prin .
Cu ct nivelul de semnificaie este mai mic, cu att este mai mare zona necritic, deci cu
att este mai mare probabilitatea de a comite o eroare de tipul II (este mai puin probabil
ca rezultatul obinut pe eantion s cad n zona critic). Deci, cele dou probabiliti snt
invers proporionale: minimizarea probabilitii de a comite o eroare de tipul I duce la
creterea probabilitii de a comite o eroare de tipul II i invers. Practic, s-a constat c
prima situaie este de dorit, adic se urmrete minimizarea probabilitii de a comite o
eroare de tipul I.
Tabelul urmtor sintetizeaz valorile Z critice, pentru diferite niveluri de
semnificaie :
Nivelul pentru Nivelul pentru Valori Z critice
testul bilateral
testul unilateral
0.20
0.10
1.29
0.10
0.05
1.65
0.05
0.025
1.96
0.01
0.005
2.58
Tabelul 11.2.1.2. Valori Z critice
b) Dac abaterea standard, , este necunoscut, atunci trebuie s se in cont de
dimensiunea eantionului, n > 30 i n 30.
n prima situaie, se folosete testul Z, unde se nlocuiete cu abaterea standard a
eantionului avut n vedere, s, iar n cu n 1:
x H
Z=
.
s
n 1
Dac n 30, atunci n testarea ipotezei nule se utilizeaz testul Student:
x H
t=
, cu n 1 grade de libertate. Regulile de luare a unei decizii coincid cu cele
s
n
prezentate la testul Z:
Se respinge H 0 ,
- pentru un test bilateral, dac t obinut > +t 1-/2, (critic) sau t obinut < -t 1(critic);
/2,
- pentru un test unilateral (H 1 : > H ), dac t ob > t 1-, ;
- pentru un test unilateral (H 1 : < H ), dac t ob <-t 1-, .
n final, se poate prezenta algoritmul rafinat privitor la testarea ipotezelor statistice:
- formularea unei ipoteze asupra unei populaii de referin:
in) ipoteza nul:
H0 : = H,
ia) ipoteza alternativ: H 1 : H sau una din cele dou forme, H 1 : > H sau
H1 : < H;
- obinerea unui eantion aleatoriu;
- fixarea unui nivel de semnificaie (de obicei, = 0.05);

- verificarea ipotezei pe baza informaiilor culese despre eantion: dac abaterea


x H
standard pentru populaia studiat, , se cunoate atunci se aplic testul Z =
,

n
altfel dac n > 30, atunci se aplic testul Z =

x H
x H
, altfel se aplic testul t =
,
s
s

n 1
n
cu =n1 grade de libertate;
- se calculeaz statistica testului selecionat;
- luarea unei decizii, dup urmtoarele reguli:
Se respinge H 0 ,
db) pentru un test bilateral, dac valoarea obinut a testului aplicat >
+(valoarea critic a testului aplicat) sau valoarea obinut a testului aplicat < (valoarea critic a testului aplicat);
du+) pentru un test unilateral (H 1 : > H ), dac valoarea obinut a testului
aplicat > +(valoarea critic a testului aplicat);
du-) pentru un test unilateral (H 1 : < H ), valoarea obinut a testului
aplicat < -(valoarea critic a testului aplicat).
11.2.2. Testul Z pentru proporii
Dac variabila cercetat nu este de interval sau de aparat, atunci, n formula testului Z se
nlocuiete media aritmetic a eantionului, x , prin proporia cazurilor de succes, p,
caracteristic avut n vedere fiind modelat printr-o variabil distribuit binomial, Bi(n;
p). n plus, se impune ca dimensiunea eantionului s respecte condiiile np 5 i n(1
p) 5.
S presupunem c proporia populaiei studiat este P H . Se extrage aleator din
aceast populaie un eantion de volum n n care proporia cazurilor de succes este p.
Se noteaz cu P proporia cazurilor de succes n populaia adevrat din care
provine eantionul.
n mod similar, se formuleaz ipotezele:
- ipoteza de nul:
H 0 : p = P H sau, n mod echivalent:
H 0 : p - P H = 0;
- ipoteza alternativ: H 1 : p p H sau, n mod echivalent:
H 1 : p - P H 0.
Dac sensul diferenei ntre proporia eantionului i cea a populaiei este
important, atunci ipoteza alternativ poate lua una din formele: H 1 : p > P H sau H 1 : p <
PH.
Se aplic formula de calcul pentru testul Z (sau, testul erorii standard a unei
proporii):

p PH
.
P(1 P)
n
Dac nu se cunoate valoarea P, atunci se poate estima P prin p:
p PH
Z=
.
p(1 p)
n
n rest, etapele prezentate n algoritmul rafinat de verificare a unei ipoteze statistice, n
paragraful precedent, rmn neschimbate.
n situaia n care volumul de sondaj al eantionului, n, este suficient de mic, n locul
statisticii testului Z se utilizeaz formula de calcul a probabilitii critice a testului:

Z=

PH =

C P (1 P)
i
n

i=s

PH =

n i

C P (1 P)
i =1

i
n

sau

n i

unde s este frecvena cazurilor de

succes n eantionul respectiv.


Probabilitatea calculat nsumeaz probabilitile de apariie a evenimentelor
caracterizate de un numr de succese mai mare sau egal cu s sau, respectiv, mai mic
sau egal cu s, conform cu enunul ipotezei alternative: H 1 : p > P H sau respectiv H 1 : p <
PH.
Regula de decizie este similar celei aplicat la distribuia normal.

S-ar putea să vă placă și