Documente Academic
Documente Profesional
Documente Cultură
- eroarea de genul II- eroarea comis la acceptarea eronat a ipotezei nule cnd
aceasta este fals.
Ca urmare, n testrile de ipoteze apar 2 riscuri:
- riscul de gradul I- probabilitatea de a respinge ipoteza nul cnd aceasta este
adevrat
- riscul de gradul II- probabilitatea de a accepta ipoteza nul cnd aceasta este
fals.
Riscul de gradul II este mult mai grav, n consecin pentru a avea un nivel sczut
al acestuia ne fixm un risc de gradul I mai mare.
Exist dou explicaii de baz pentru observarea diferenei dintre
valoarea ipotetic i un rezultat particular din cercetare: fie ipoteza e adevrat i
diferena observat se poate datora erorilor de eantionare, fie ipoteza este fals i
valoarea real, adevrat este o alt valoare.
n funcie de ipoteza ce trebuie testat, de natura i volumul datelor, se
alege un anumit test statistic. Sintetic, procedeul general de testare a unei ipoteze
statistice presupune rezolvarea urmtoarelor probleme1:
Stabilirea ipotezei. Ipotezele se stabilesc folosind dou forme de baz: ipoteza
nul H0 i ipoteza alternativ H . Ipoteza nul H0 (uneori denumit hypothesis of
the status quo) este ipoteza testat mpotriva complementului su, ipoteza
alternativ H (uneori denumit research hypothesis of interest). Trebuie
menionat c ipoteza nul i ipoteza alternativ trebuie stabilite n aa fel nct s
nu poat fi adevrate ambele, n acelai timp. Ideea este de a folosi o eviden
disponibil pentru a stabili care ipotez este mai probabil.
Alegerea testului statistic potrivit. Analistul trebuie s aleag cel mai potrivit test
statistic n funcie de caracteristicile situaiei care se investigheaz. Dezvoltarea
unei reguli de decizie. O astfel de regul este necesar pentru a determina
respingerea ipotezei nule sau, dimpotriv, acceptarea ei. Statisticienii stabilesc
reguli de decizie n funcie de nivelele de semnificaie. Nivelul de semnificaie
(q) este critic n procesul de alegere ntre ipoteza nul i ipoteza alternativ.
Nivelul de semnificaie reprezint probabilitatea care este considerat prea redus
- de exemplu 0,10; 0,15 sau 0,01 - pentru a justifica acceptarea ipotezei nule.
Considernd o situaie n care ne decidem s testm o ipotez la un nivel de
semnificaie de 0,05, acest lucru nseamn c vom respinge ipoteza nul dac
testul indic faptul c probabilitatea realizrii rezultatului observat (de exemplu,
diferena dintre media eantionului i valoarea sa ateptat) datorit ansei sau
erori de eantionare este mai mic de 5%. Respingerea ipotezei nule este
echivalent cu acceptarea ipotezei alternative.
Calcularea valorii statistice a testului. n aceast etap vom:folosi formula
adecvat pentru a calcula valoarea statistic pentru testul ales; compara valoarea
calculat anterior cu valoarea critic (din tabelul adecvat) n funcie de regula de
decizie aleas;pe baza comparaiei, stabilim rezultatul, fie respingnd, fie
acceptnd ipotezanul ( HO ).Stabilirea concluziei. Se stabilete o declaraie privind
concluzia desprins, caresfac un sumar al rezultatelor testului. Concluzia se
stabilete din perspectiva ntrebrii originale privind cercetarea.n funcie de
ipoteza ce trebuie testat, de natura i volumul datelor, se alege un anumit test
statistic.
.2 Tipologia testrilor de ipoteze
Testele statistice pot fi clasificate dup mai multe criterii, cele mai importante
fiind urmtoarele:
dac n aplicarea testului este nevoie sau nu s se tie dac variabila de prelucrat
urmeaz o distribuie predeterminat:
-teste parametrice - se bazeaz pe ipoteze distribuionale
-teste neparametrice - sunt independente de aceste ipoteze n
funcie de modul de formulare a ipotezei alternative:
-teste unilaterale - alternativa este formulat ca o inegalitate
-teste bilaterale - alternativa este formulat ca o egalitate n raport
cu numrul de eantioane folosite
CX - X f
cu f ( X ) - 2 a
crV2TT
Din populaia univers A se constituie un eantion aleator de volum n ( n
>100), cruia i se asociaz vectorul aleator (X 1 , X 2,..., X n).
Repartiia valorilor variabilei X este de forma urmtoare:
^K;xi) x2) ..
R
X
X:
*2
/
Notm cu Fn ( x .) frecvena relativ cumulat sau valorile funciei empirice de
nE
repartiie.
Vn i
F (xi) = F f z
Xj X f
4-
F M ) = ~ ?,(*,) = -------------1
=1
n
n
Se tie c variabilaRz = _________ <= N(0,1) urmeaz o lege normal normat, a
X
F ( X R )= F
crei valori sunt tabelate, aa nct din tabelul funciei Laplace vom obtine
valorile urmtore:
Se calculeaz diferenele:
l = \Fn(Xl)-F(Xl)\
= Wm ) =
R = \Fn(XR)~F(XR)
maX F
| n
0) - ^0)|
= j= =^> H0acceptata . y j f l
In mod asemantor acest test poate fi folosit i pentru testarea altor distribuii
cum ar fi: Poisson, uniform, exponenial.
Testul x2
Pentru testarea uniformitii unei distribuii se poate folosi i testul x1 Astfel
formulm ipoteza nul:
H 0 : X e N ( X , < J x)
Hp.XzNiX,^)
Pentru a verifica aceast ipotez presupunem ca dispunem de un eantion de
valori particulare (n>100), de forma:
i)
X:
Kni
[x
n
i;
***
[*R-T>XR]
n
x (x-X) 2
2CT
Z
dx
<j^2U
unde F0 este funcia de repartiie corespunztoare lgii normale.
Numrul mediu de valori aparinnd intervalului I este determinat din relaia npt.
Condiia ce trebuie respectat este ca npj > 5, n caz contrar se grupeaz
intervalele pentru ndeplinirea acestei restricii.
Pentru testarea ipotezei H0 se calculeaz statistica %2 unde:
i=i nP;
2 _ y ( P i - n P t y
i=l npt
pentru un q fixat va rezulta un %lb ,iar dac j2 < zL C<7,v ) => H0acceptata .
n cazul n care eantionul este de voum mic se recomand aplicarea Testului lui
Massey (Florea, I.,..., Statistic inferenial, 2000, p. 268-270).
X :
2.
i ...
statisticile rezultate
X2..X1... XR^
din
observarea
Rj
ini-n1)2
Z calc
Pentru testarea unei astfel de ipoteze se poate folosi att testul %2, ct i testul lui
Kolmogorov-Smirnov. n cazul testului %2 se compar
cu zL {<l,v =
Dac Xc - Ztab
acceptat.
.4 Teste de semnificaie
Fie o populaie A n care variabila X este distribuit conform unei legi normale,
de medie X i abatere <JX vom testa ipoteza H0 cu privire la semnificaia unei
medii, de forma :
H0 . X = x0
Hx : X x0
_2_
in
unde X
i=
= ~Y/X1, Xe N(X,ax )
-X < 7
E { X ) = X i V ( X ) =
n
Se ntlnesc dou cazuri:
a) < 7 X -cunoscut
b) <J2X -necunoscut
N(0,1)
z n
= acest caz variabila centrat
a)
i redus Z este:
X-E(X) X-X
X :
calc
tab
<
z
<
7^
X
X-x0
cu o probabilitate 1-q.
Regula de decizie pentru acest test se formuleaz astfel:
- daca zcalc e {-ztab; ztab) => H0 acceptata - daca zcalc (~ztab; ztab) => H0 respinsa
2 2 1=
Xf
2=1
n-l
n
V() V ( ) =
b)Deoarece a2x nu se cunoate, aceasta se va aproxima cu
s2x
X-E(X) X-X
= t e S ( v = n - 1)
4n
Se consider un prag de semnificaie q < 0,05 , iar din tabelele relativ la repatiia
Student, la un q dat i o = n - 1 grade de libertate, va rezulta un ttab. Dac ipoteza
nul este adevrat, atunci X x0
c
vn
Este tot o variabil Student, a crei valori, pentru eantionul format, vor fi situate
n intervalul (~ttab ',+ttab)
Gradele de libertate
n general, prin numr de grade de libertate al unei mrimi se nelege
numrul variabilelor independente a cror variaie nu sufer nici o restricie i
care definesc mrimea considerat. Altfel spus, numrul gradelor de libertate este
egal cu numrul variabilelor independente, care definesc mrimea
+X
2 +---
n
cu E ( p ) = p i V ( p ) = -
n
p - p N(0,1)
z=
P(1~P)
Vn
La un nivel al riscului
fixat q < 0,05, va rezulta un z lL!h. Dac ipoteza nul
0
calc
este
adevrat, atunci
( Ztab U Ztab )
p-p
jPoQPo)
n
Testarea semnificaiei unei variante
Fie o populaie univers A n care variabila X urmeaz o lege normal de medie X
i abatere < J X . Un eantion aleator de volum n va fi extras din aceast
populaie prin extrageri independente.
Ipotezele pot fi formulate astfel:
H, ^ = <rl
H, .a2 * al
n-
T
'
^-
2=1
)
2
ca
i
variabila
{n-\)s2
dac
4 Teste de comparare
n cazul aplicrii unor teste statistice, trebuie s se fac distincie ntre eantioane
independente i eantioane dependente (perechi), astfel: dou eantioane sunt
independente dac selecia unitilor unui eantion nu depinde de selecia
unitilor celuilalt eantion;
dou eantioane sunt dependente dac selecia unitilor unui grup determin
selecia unitilor altui grup. Un exemplu frecvent de grupuri dependente apare
atunci cnd se urmrete efectul unui experiment pe acelai eantion,
nregistrndu-se reacia indivizilor ninte i dup experiment. Aceste grupuri se
mai numesc i grupuri perechi.
Testarea egalitii a dou medii, cazul eantioanelor independente
Cnd testm o iptez asupra a dou medii ncercm s determinm, cu ajutorul a
dou eantioane dac exist o diferen semnificativ statistic, ntre mediile celor
dou populaii. Ipoteza nul este formulat astfel: nu exist diferene
semnificative ntre mediile celor dou populaii, respective populaiile sunt
identice n raport cu parametrul medie.
H0:X1=X2
Fie
H pdou
. X ^ Xpopulaii
,
x \ X x - X 2 *0
A, e N ( X ^ c j \)
A1
distribuite
H
X 2 e N ( X 2 , a 2 ) din care se extrag independent dou
normal
2 i=l
^
. 2TT
V
) = ^ + ^X,( X
e 1N- (XX
cr,x ,-X.) X2 e X(X2,
n
^ , cr2 cr2
CT
nn
n
n2
In aplicarea acestor teste apar urmtoarele situaii cu privire la cele dou
variane:
\ 2
a)
&1
"se cunosc
{X,-X2)-{X,-X2)
l
l
N{ 0,1)
CT 2
x\x2
cr,
n,
acceptata
^2 ^s2 = Pl ~ 1K + P2
~ 1)S'2 n \ + n 2 ~ ^2 2
^l2 =
s2 = ^2
1
-T{xu-x2
'
i=l
11
cr(Xi X2 ) = s( \ + )
(X, - X 2 ) -v(1X - X 2 )
0/.
t = -1------------------2Z e sy
=
+ n2 - 2)
OJ + )
Y nx n2
pentru q < 0.05 => tto6 ((7, v)
O=
i P6 ] => O, acceptata
c) Dac <T,2 , (T22 -nun se cunosc i sunt diferite, cele dou varine vor fi
estimate,
n2
2 2
Si
s2
i
(X1-X2) =
n2
, (1-g)2
Wj -1
2 -1
s
n
c
=n- n 2
22
( X ,2 - S2 e
2
i-Kab ;'*&]=> H 0 acceptata
X2)
s*1 2
In situaia n caren nu ndispunem de informaii referitoare la variane (sunt egale
sau sunt diferite), va trebuie s testm ipoteza privind egalitate a dou variane.
Testarea
Fie
dou egalitii
populaii a dou varianeA1
distribuite
normal
A
i
5
2
- ' L i X h - X l f s l = T ( X h - X , ) 1
n 22
S
F = ~ Y : 7 e F ( v x = n , -l;v2 = n 2 -1)
<Jl <72
22Xi . X2
F = n x -1 n 2 -1 pentru q < 0.05 => Ftab ( q , v x , v 2 )
2/
2 _ _ ( 2 . 2
<A
1(2)
1(2)
H 0 acceptata
d,=XAl-XBl
unde X A i X B i sunt valorile variabilei X
pentru cuplu i . Astfel vom obine n valori pentru d , aferente fiecrui cuplu z,
/=!,. Ca urmare se poate calcula
Yn
|
_2_
media acestor valori, d = 'S\di i varianta s2d =-------V(f - d ) 2 .
n i =i
'
n -1 i=j
S(v =
n-\)
4n
Urmeaz o distribuie Student cu n-1 grade de libertate. Astfel putem formula
ipoteza nul c
:H 0 : d
O H1 : d ^
O
Se va aplica testul t, unde
d -d
t =------s
T = mm{T+-T)
din tabelul distribuiei T (Wilcoxon) se gsete valoarea teoretic a lui T,
TtA^n)
dac T < Ttab atunci se respinge ipoteza nul i se accept alternativa, respective
exist diferene ntre rezultatele obinute nainte i dup aplicarea experimentului;
dac n>25, distirbuia T sepoate aproxima cu o distribuie normal, de medie
i abatere tr, H" + 1>(2" + D
f=
4
M 24
1
,
P 2 ='
2
X2
21
Xi
eB
( P i ) x2 e B ( p 2 )
PiQP i )n
e N
IP1Q--P1)
(Pi -P2I
, P2O--P2
11
conform H0 rezulta ( p 1 p 2 ) < z N ( 0, p ( l p ) ( -------------------1- - -)
p
^ p _ P\n\ + P2n2
nY + n2
f=
(-A)-(A-P2)SiS(t,=
daCCl
P(l-P)( + )
1
. 2^
P1-P2
^ calc =
2)
CT(-P2)
q < 0.05 =>
p n0
\-ttab;
] => ^0 acceptata