Teste Statistic e

I.
TESTE PARAMETRICE (DE COMPARATIE)
One sample Z – TEST for the mean

(Testul erorii standard a mediei)
x−m0
Z=
σ0
 Test de comparatie √n .
o Variabila X continua;
o Se compara media cunoscuta a unei populatii
m0 cu media unui esantion x (ales eventual dintr-o
sunpopulatie);
o Se testeaza daca esantionul este din populatie;
o Se testeaza daca
m0 =M [ X ] ;
X ~ N ( m0 , σ 0 )
 Stim ca distributia de esantionare este normala ( SAU n≥30 (daca
X ~ N ( m 0 , σ 0 ) si n<30
testul este orientativ)) ;
 Daca n mare X poate avea orice distributie;
¿

σ 0 =σ [ X ] cunoscut sau estimatorul σ 0 ≃s ;
α α
1−
2
2( ) ( )
z α =F−1 1− =Φ−1 1− sau z 1−α =F−1 (1−α )=Φ−1 (1−α ) sau z α =F−1 (α )=Φ−1 ( α )
2
x−m0
si z c = ;
σ0
 √n ;
p=1−F (|z c|)=F ( −|z c|) =1−Φ (|z c|) =Φ ( −|z c|)


a ) ¿
¿¿ ¿
Two independent samples Z-TEST for the means
x 1 −x2 −( m1 −m2 )
⏟
de obicei =0
Z=
σ 12 σ 22
 Test de comparatie √ n1
+
n2 ;
o Variabilele X1, X2 continue;
o se compara mediile necunoscute a doua populatii M [ X 1 ]=m1 =m 2 =M [ X 2 ] ;
o se testeaza daca mediile a doua esantione sunt egale;
o se testeaza daca esantioanele fac parte din aceeasi populatie – eventual diferenta mediilor)
X 1 ~ N ( m 1 , σ 1 ) , X 2 ~ N ( m2 , σ 2 )
 Stim ca distributia de esantionare este normala ( SAU
( n1 ≥30 si n2 ≥30 ) si esantione independente;
 Daca n1 , n 2 mari X 1 si X 2 pot avea orice distributie;

 σ 1 =σ [ X 1 ] si σ 2=σ [ X 2 ]
cunoscute sau estimatorii
σ 1 =s¿1 , σ 2=s ¿2 ;
x 1 −x2 −( m1 −m2 )
⏟
α α
z
1−
α =F
−1
( )
1− =Φ−1 1−
2 2 ( )
sau z 1−α =F−1 ( 1−α )=Φ−1 (1−α ) si z c=
σ 21
de obicei =0
σ 22

2
p=1−F (|z c|)=F ( −|z c|) =1−Φ (|z c|) =Φ ( −|z c|)
√ +
n1 n2 ;


¿
a ) ¿¿ ¿ ¿
 ¿
One sample T – TEST (student) for the mean
x −m0
T= ¿
s
 Test de comparatie √n
o Variabila X continua;
o Se compara media cunoscuta unei populatii cu media unui esantion (ales eventual dintr-o subpopulatie);;
o Se testeaza daca esantionul este din populatie;
o Se testeaza daca
m0 =M [ X ] ;
n<30( nu obligatoriu ), X ~ N ( m0 , σ )
 Stim ca distributia de esantionare este normala ( (daca
X≈ N ( m 0 , σ )
testul este orientativ);
 Daca n mare X poate avea orice distributie;
 df =n−1 ;
α α x −m0
t
df , 1−
2
−1
( )
α =F df 1−
2 2 ( )
=T . INV df 1− sau t df , 1−α =F−1 df (1−α)=T . INV df ( 1−α ) si t c =
s
¿
 √n ;
p=1−F df (|t c|)=F df (−|tc|)=1−T . DIST df (|t c|)=T . DIST df (−|t c|)


 σ =σ [ X ] necunoscut;
¿
a )¿ ¿ ¿ ¿
 ¿
Two independent samples T - TEST (la dispersii necunoscute dar egale)
for the means
x 1−x 2 −( m1 −m 2 )
x 1 −x 2−( m1−m2 )
⏟
de obicei=0
T= → ( pooled formula )
¿ 2 ¿ 2 1 1
 Test de comparatie √ ( s1) ( s 2)

n1
+
n2
s p⋅
√ +
n1 n2
, unde
¿ 2 ¿ 2
n1 s 21 +n 2 s 22
s p=
√
n1 + n2 −2
=
√
X1, X2
( n1 −1 ) ( s1 ) + ( n2 −1 ) ( s2 )
n1 +n2 −2 ;
o Variabilele continue;
o se compara mediile necunoscute a doua populatii M [ X 1 ]=m1 =m 2 =M [ X 2 ] – (eventual diferenta
mediilor);
n , n <30 , X 1 ~ N ( m 1 , σ 1 ) , X 2 ~ N ( m2 , σ 2 )
 Stim ca distributia de esantionare este normala ( 1 2 SAU
X 1 −X 2 ~ N ( m0 , σ 0 )
si esantione independente;
2
( s¿1)
test Fisher 0,5< ¿ 2 <2
 σ 1 =σ [ X 1 ] si σ 2=σ [ X 2 ]
necunoscute dar egale ( σ 1= σ 2 =σ ) , ( s2) ;
 df =n1 +n 2−2 ;

t
df , 1−
α
2
=F−1 ( α2 )=T . INV (1−α2 ) sau
df 1− df
x1 −x 2 −( m1 −m2 )
x 1 −x2 −( m1 −m 2 )
⏟
de obicei=0
t df , 1−α =F−1 −1
df (1−α )=T . INV df ( 1−α ) si t c= → ( pooled formula),
¿ 2 ¿ 2 1 1
√ ( s1 )
n1
+
( s2 )
n2 √
s p⋅ +
n1 n 2
¿ 2 ¿ 2
n1 s12 +n2 s22
unde s p =
√
n1 +n2 −2
=
√
( n1−1 ) ( s 1 ) + ( n2−1 ) ( s 2 )
n1 +n2 −2
;

¿
a )¿ ¿ ¿
Two independent samples T –TEST (la dispersii necunoscute si inegale)
for the means
x 1 −x 2− ( m1−m2 )
⏟
de obicei 0
T=
2 2
 Test de comparatie
n1
⏟ √
n2
( s ¿1 )
+
unpooled formula( Welch)

( s ¿2 )
o se compara mediile necunoscute a doua populatii M [ X 1 ]=m1 =m 2 =M [ X 2 ] – (eventual diferenta

mediilor);
 Stim ca distributia de esantionare este normala (
n1 , n2 <30( nu obligatoriu ) , X 1 ~ N ( m 1 , σ 1 ) , X 2 ~ N ( m 2 , σ 2 )
;
2 2
( s¿1) ( s ¿1 )
test Fisher ¿ 2
≤0,5 SAU ¿ 2 ≥2
σ 1 =σ [ X 1 ] si σ 2=σ [ X 2 ] ( σ 1≠σ 2 ) s
( 2) ( s2)
 necunoscute si inegale , ;
2
( s¿1 )2 ( s ¿2 ) 2

df =
t
[ α
(¿ 4
n1
( s2 )
+
+
n2
( s2)
n21 ( n1 −1 ) n 22 ( n2 −1 )
=F−1
df 1− ( ) α
)
¿ 4
]
α
;
( )
=T . INV df 1− sau t df , 1−α =F−1
df (1−α )=T . INV df (1−α) sau
df , 1−
2
2 2
x 1− x2 −( m1 −m2 )
t df , α =F −1
df (α )=T . INV df (α ), si t c = ;
¿ 2 ¿ 2
( s1 ) ( s 2)

√
n
⏟ 1
+
n2
unpooled


¿
a )¿ ¿ ¿ ¿
 ¿
Two paired samples T-TEST – (la dispersii necunoscute si inegale)
for the means
d−( m 1 −m 2 )
T=
sd
¿
¿ 2 ∑ ( di −d ) 2
d=x 1 −x 2 , ( sd ) =
 Test de comparatie √n , unde n−1
o se compara mediile necunoscute ale aceleiasi populatii la momente diferite de timp (before and after)
M [ X 1 ]=m1 =m 2 =M [ X 2 ]
– (eventual diferenta mediilor);
o se testeaza daca mediile unui acelasi esantion (la momente diferite de timp ) sunt egale;
 Stim ca distributia de esantionare este normala ( n<30( nu obligatoriu ), D=X 1 −X 2 ~ N ( m, σ ) ;
 σ 1 =σ [ X 1 ] si σ 2=σ [ X 2 ]
necunoscute s i inegale ( σ 1≠σ 2 ) ;
 df =n−1 ;
t
df , 1−
−1
α =F df
2
(1− α2 )=T . INV (1−α2 ) sau t
df df , 1−α =F df (1−α )=T .
−1
INV df (1−α) sau
d −( m 1−m2 ) ¿ 2 ∑ ( d i −d )2
t df , α =F −1
df (α )=T . INV df (α ), si t c = , unde d =x1 −x 2 , ( s d ) = ;
s¿d n−1
 √n ;


¿
a )¿ ¿ ¿ ¿


¿
One sample Z-TEST pentru proportia de succese intr-o populatie binomiala
^p −p 0
P=
p0 ( 1− p0 )
 Test de comparatie √ n
p0 ;
o se testeaza daca procentul de succese din populatie este
o Se poate face pe date calitative;
o Se compara procentul de succese cunoscut unei populatii
p
0 cu cu procentul de succese ^p din
esantion;
np≥5 , n(1− p )≥0 , X ~ N ( m0 , σ ) (n mare ) ;

α α
z α =F−1 1− =Φ−1 1−
1−
2
2 ( ) 2 ( )
sau z 1−α =F−1 ( 1−α )=Φ−1 (1−α ) sau z α =F−1 (α )=Φ−1 ( α )
^p− p 0
si pc = ;
p 0 ( 1−p 0 )
 √
p0 cunoscut;
n ;

p=1−F (|z c|)=F ( −|z c|) =1−Φ (|z c|) =Φ ( −|z c|)


¿
a) ¿ ¿¿
¿
 ¿
Two independent samples Z-TEST
pentru proportia de succese intr-o populatie binomiala
 Test de comparatie
^
¿
p
¿^ −
2
1 1
P=
√ p^ ( 1− p^ )
p1
( 1
+
n n
2 )
, unde p^ =
x 1+ x 2
=procentul comun de succese din cele doua esantioane; ¿ ¿
n1 + n2
o se compara procentele de succese necunoscute p1 , p2 a doua populatii;

o Se poate face pe date calitative;
o se testeaza procentele de succese a doua esantioane sunt egale;
n1 p1 , n1 ( 1− p1 ) , n 2 p 2 , n2 ( 1− p 2 ) ≥5 , X 1 ~ N ( m1 , σ 1 ) , X 2 ~ N ( m2 , σ 2 ) ( n1 ,n 2 mari )
 si esantioane
independente;
 p1 , p2 necunoscute;
¿^
p
¿^−
2
1 1
α −1 α
√ ( )
^p (1− ^p ) +
n n
1 2 x1+x2

1−
2
−1
2 ( ) ( )
2
−1 −1
z α =F 1− =Φ 1 − sau z1−α =F (1−α)=Φ (1−α) si pc = p1 , ¿unde p^ =
n1 +n2
=procentul comun de succese din cele doua esantioane; ¿
;
p=1−F (|z c|)=F ( −|z c|) =1−Φ (|z c|) =Φ ( −|z c|)


¿
a ) ¿¿ ¿ ¿
 ¿
Chi squared TEST (pentru dispersie)
2
(n−1 ) ( s ¿ )
χ 2c = 2 2 2
 Test de comparatie σ0 (se testeaza daca
σ [ X ]=σ 0 )
X ~ N ( m0 , σ )
 ;

α α α α
χ 2α == F−1
2
df
, df () ()
2
=F−1
n−1
2 () 2 ()
=CHISQ. INV df =CHISQ . INV n−1
2
,
¿ 2
α α α α (n−1) ( s )
χ 2
α =F (1− )=F ( 1− )=CHISQ . INV (1− )=CHISQ . INV (1− ) si χ =
−1
df
−1
n−1 df n−1; 2
c 2
1− ,df
2
2 2 2 2 σ 0 ;
 σ =σ [ X ] necunoscut;
 df =n−1 ;
p=1−F ()=1−F (|z c|)=F ( −|z c|) =1−Φ (|z c|) =Φ ( −|z c|)


¿
a )¿ ¿ ¿
F(Fisher-Snedecor) - TEST (pentru compararea a doua dispersii)
2
( s¿1) ¿ ¿
F c= ¿ , s 1 > s2
 Test de comparatie ( s2)
(se testeaza daca σ 1 =σ [ X 1 ]=σ [ X 2 ]=σ 2 );
o se compara dispersiile necunoscute a doua populatii;
o este nevoie la testul – t sa stim daca σ 1 =σ 2 ;

X 1 ~ N ( m 1 , σ 1 ) si X 2 ~ N ( m 2 , σ 2 ) obligatoriu
 ;
α α α
F
df 1 , df 2 ,
−1
α =Fdf 1 , df 2
2
()2
=F−1 ()
n1−1 , n2−1
2 ()
=F . INV df , df
1 2 2
,
2
¿
α α α ( s1 )

F
df 1 , df 2 , 1−
α =F
2
−1
( 2)
1−
df 1 , df 2 =F ( 2 ) =F . INV
1− −1
n1−1 , n2−1 n1−1 , n2 −1 ( )
1− si F c = ¿ ;
2 ( s2 ) ;
 σ 1 =σ [ X 1 ] , σ 1 =σ [ X 1 ] necunoscute;
 df 1 =n1 −1 , df 2 =n2 −1 ;
¿
a )¿ ¿ ¿
II.TESTE NEPARAMETRICE
 Testele neparametrice se aplica in urmatoarele situatii:
o Datele cantitative nu indeplinesc conditii (de normalitate, dispersii egale, etc);
o Date calitative ordonate (variabila raspuns este ordinal – de tip rang));
o
 Compara mai degraba medianele decat mediile;
 La multe dintre ele nu se fac presupuneri asupra repartitiei datelor de esantionare (la esantioane de volum mic);
 Sunt mai robuste decat testele parametrice dar cu putere mai mica de a detecta falsitatea ipotezei nule;
 Multe teste neparametrice inlocuiesc datele initiale cu ranguri sau semn (rangurile – putin probabil sa satisfaca
conditia de normalitate);
 Sunt folosite atunci cand sunt dubii asupra normalitatii datelor statistice;
 Se pot construi teste neparametrice corespunzatoare fiecarui test parametric;
II.1.TESTE DE CONCORDANTA (DE POTRIVIRE, GOOD – FITTING)
Chi squared good – fitting TEST (de potrivire)

(testul lui Pearson)
n 2
(O−E )
2
( f −np )
χ 2c = ∑ E = ∑ k np k
 Test de concordanta k =1 k ;
 Este in general neparametric dar poate fi si parametric (in cazul in care se estimeaza anumiti parametrii) ;
o Masoara de fapt cat de mult difera datele observate de datele asteptate;
o Se foloseste cand avem o singura variabila, X ;
o Se lucreaza cu date nominale si ordinale (de aceea apar frecvente si nu medii sau variante);
o In cazul datelor continue, acestea se impart in clase (categorii, bins- tabele de contingenta);
o Se testeaza daca esantionul are o anumita distributie (binomiala, normala, etc ) – test de potrivire;
o Se testeaza daca un esantion provine sau nu dintr-o presupusa populatie;
o Este un test neparametric (poate fi utilizat cu esantioane formate din seturi de date care nu sunt normal
distribuite)
o Se testeaza daca s-au schimbat valorile expectate;
o Este adesea folosit pentru a stabili daca esantionul este reprezentativ pentru populatie;
n(nr. clase)≥30; 50; npk ≥5 , ∀ k=1, n sau pentru 80% din k−uri ( pentru tabele mari)
 (altfel testul exact al kui Fisher );

np k≥10, ∀ k=1, n daca df =1 ;
χ 21−α , df =F−1 −1
df ( 1−α )=F n−1 ( 1−α )=CHISQ . INV df ( 1−α )=CHISQ . INV n−1 ( 1−α ) si
n f −np 2
(O−E)2 ( k k)
χ 2c = ∑E =∑ ;
 k =1 npk
 df =n−1 SAU df =n−1− p , p=numarul de parametrii estimati; ;


¿ ¿ ¿
¿
Kolmogorov-Smirnov good – fitting TEST (de potrivire)
 Test neparametric;
 Variabilele trebuie sa fie continue (se adapteaza pentru variabile discrete sau mixte);
 Se bazeaza pe distributia Kolmogorov;
 Este un test exact (neasimptotic)
 Avantaj:poate fi folosit pentru esantioane mici si foarte mici;
 Este testul cel mai puternic pentru esantioane de volum intermediar;
o Verifica daca un esantion urmeaza o distributie de referinta presupusa (normala, uniforma, etc.);
o Masoara distanta dintre functia de distributie teoretica F si functia de distributie empirica
Fn ,
i
unde
{
Fn (x)=¿ {0 , x<x1 ¿ ,x∈[xi , xi+1 ),i=1,n−1 ¿ ¿¿¿
n ;
o Parametrii distributiei teoretice trebuie cunoscuti (altfel testul Lilliefors);
Dn =sup| F n (x )−F( x )|
o x ;
o n≥50 (altfel mai indicat Shapiro-Wilk);
a )¿ ¿
¿ ¿
Two samples Kolmogorov-Smirnov TEST
 Test neparametric si “distribution free”;

o Verifica daca doua esantioane provin din aceeasi populatie;
o Verifica daca doua populatii au aceeasi lege de repartitie ( F=G) (fara a preciza natura repartitiilor);
o Masoara distanta dintre functiile de distributie empirica
Fm si G n ale celor doua esantioane unde
i
m {
Fm ( x)=¿ {0, x<x1 ¿ , x ∈[ x i , xi+1 ), i=1,m−1 ¿ ¿¿¿
;
Dm , n =sup| F m ( x )−Gn ( x )| ( D m , n=sup ( F m ( x )−Gn ( x ) ) sau Dm , n =sup ( G n ( x )−F m (x ) ) )
o x x x ;
k 1−α=K . INV (1−α )− din tabele ;
m+n
d critic =d m , n, 1−α =k 1−α⋅
√ mn
;
mn
o
d calculat =d c=sup | F m (x )−Gn (x )|, k c =
x √ d ;
m+n c ;
¿
a )¿ ¿ ¿
¿
¿
Shapiro – Wilk goodness of fit test (de testare a normalitatii)
 Conditii de aplicare:
o Se poate aplica si pentru esantioane mici, 3≤n≤50 ( Kolmogorov – Smirnov se poate aplica
numai pentru n≥50 );
o Pentru esantioane 3≤n≤50 se aplica Shapiro – Wilk originar;
o Pentru esantioane 12 ≤n ≤ 5000 se aplica Shapiro – Wilk extins (o varianta modificata pentru
3 ≤ n≤ 11;
 Este cel mai puternic test de normalitate, urmat de Anderson – Darling, Lilliefors, Kolmogorov – Smirnov
( dupa unii statisticieni);
 Este un test de normalitate cu medie si varianta ( m si σ 2 ) neprecizate (spre deosebire de Kolmogorov –
Smirnov);
2
b
W c =W calculat =
 SS - statistica testului;
o
x 1 < x 2 <. .. .< x 2n sau x 1 < x 2 <. . ..< x 2 n+1 (sortare);
b=a1 ( x 2n −x 1 ) + a2 ( x 2 n−1 −x 2 ) +. .. .+a n ( x n+1−x n ) SAU
b=a1 ( x 2n+1 −x 1 ) +a 2 ( x 2n −x 2 ) + .. ..+ an ( x n+2 −x n ) ( fara x n+1 )
o ( a1 , a 2 ,. .. . , an din tabele in functie de n ) ;
2n 2n+1
SS= ∑ ( x k− x ) SAU SS= ∑ ( x k −x ) 2
2
o k=1 k =1 ;

 Testul Anderson – Darling
Testul Kruskal – Wallis (echivalent ANOVA)

Testul Friedman (echivalent ANOVA)
II.2. Alte teste
Testul semnelor (Single sample)
 Test neparametric pentru date ordinale;
x=( x 1 , x 2 ,. . .. . , x n )
 Variabila dependenta trebuie sa fie cel putin “ordinal-scaled” (sa aiba mediana);
 Este un test foarte general dar de putere mica (testul Wicoxon bazat pe ranguri de semn este mai puternic);
 Testeaza daca mediana unei colectii de date este egala cu o anumita valoare;
 Daca datele sunt numerice si normale se foloseste testul t;
 Singura conditie:
x
o Datele ( i )1≤i≤n aleatoare si independente
;
∑ ¿ 1≤k≤n¿¿¿¿rbra¿¿¿⇒Nc=Ncalculat =max{N+,N−}¿
¿
xk−Me<0¿
 (statistica testului);

X ~ Binom(n, 0.5)⇒ N α =F−1
n , 0 .5 (α )=BINOM . INV (n, 0.5, α )
 Pentru n mare ( np≥5 , n(1− p )≥5 ) se aproximeaza statistica N cu

N ~N ( n2 , √2n )⇒
n
Nc−
2
Z=
√n
2 ;
n
N c −0 . 5−
2
Z= =corectie de continuitate
√n
o 2 ;
¿
a )¿ ¿ ¿
Testul semnelor (two paired samples)
 Test neparametric pentru date ordinale;
x− y , unde x=( x 1 , x 2 ,. . .. . , x n ) si y=( y 1 , y 2 ,. . .. . , y n )
 Variabila trebuie sa fie cel putin “ordinal-scaled” (sa
aiba mediana);
 Este un test foarte general dar de putere mica (testul Wilcoxon bazat pe ranguri de semn este mai puternic);
 Testeaza daca e M [ X−Y ]=0 ( e M [ X−Y ]
este o presupusa mediana a diferentei X −Y ;
 Daca sunt indeplinite conditiile testulului t pentru esantioane perechi, se aplica acest test;
 Singura conditie:
x − yi )1≤i ≤n
o Diferentele ( i aleatoare si independente
;
∑ ¿ 1≤k≤n¿¿¿¿rbra¿¿¿⇒Nc =Ncalculat =max{N+,N−}¿

z =x −y <0¿
 i i i

X −Y ~ Binom(n, 0.5)⇒ N α =F−1
n , 0 .5 (α )=BINOM . INV (n, 0.5, α )
 Pentru n mare ( np≥5 , n(1− p )≥5 ) se aproximeaza statistica N cu

N ~N ( n2 , √2n )⇒
n
Nc−
2
Z=
√n
2 ;
n
N c −0 . 5−
2
Z= =corectie de continuitate
√n
o 2 ;
¿
a )¿ ¿ ¿
Testul Wilcoxon bazat pe ranguri cu semn (Single sample)
 Test neparametric pentru date cantitative;
x=( x 1 , x 2 ,. . .. . , x n )
 Variabila dependenta trebuie sa fie cel putin “interval-scaled” (sa aiba mediana si sa i se
poata atribui ranguri);
 Este mai puternic decat testul de semn;
 Este o alternativa pentru testul t (nu sunt indeplinite conditiile testului t - datele nu sunt normale, esantion mic,
etc.)
 Se aplica pentru:
x=( x i )1≤i≤n
o distributie simetrica (sau cu asimetrie mica) a lui
¿ ¿ ¿
 Se ordoneaza crescator valorile
|x 1−M e| , |x 2−M e|,.......,|x n−M e|
si se acorda ranguri de la 1 la n (
M ¿e
mediana populatiei cunoscuta);
n(n+1)
o Suma rangurilor 2 ;
o La valori egale rangul se inlocuieste cu media aritmetica a rangurilor corespunzatoare;
∑ ¿ 1≤k≤n¿¿¿¿rbra¿¿¿⇒Tc=Tcalculat =min {T+,T−}¿

¿
xk−Me<0¿
n(n+1)
T α +T 1−α =
 2 (din tabele);
n( n+1) n(n+1 )(2 n+1 )
 Pentru n mare ( n>20 ) se aproximeaza statistica T cu
T~N ( 4
,
√24
⇒ )
n( n+1)
T c−
4
Z=
n( n+1 )(2 n+1 )
√
24 (si chiar statisticile T + si T − );
n( n+1) n(n+1)(2 n+1 ) 1 k 3
 Corectie cand exista “tied ranks”:
T~N (
4
,
24 √ − ∑ ( t i −t i )
48 i=1 ) , unde
{ti=numbers of subject sharing rank i ¿ ¿¿¿

n (n+1)
T c− −0 . 5
4
Z=
n(n+1)(2 n+1 )
 Corectie de continuitate 24 √ ;

¿
a )¿ ¿ ¿
Testul Wilcoxon bazat pe ranguri cu semn (two paired samples)
 Test neparametric pentru date cantitative;
x− y , unde x=( x 1 , x 2 ,. . .. . , x n ) si y=( y 1 , y 2 ,. . .. . , y n )
 Variabila trebuie sa fie cel putin “interval-scaled” (sa
aiba mediana si sa i se poata atribui ranguri);
 Este mai puternic decat testul de semn;
 Este o alternativa pentru testul t pentru esantione perechi (nu sunt indeplinite conditiile testului t - datele nu
sunt normale, esantion mic, etc. sau sunt ordinale);
 Se aplica pentru:
z=( x 1 − y 1 , x2 − y 2 , . .. .. , x n − y n )
o Distributia simetrica (sau cu asimetrie mica);
o X si Y sunt continue si difera doar prin valorile medii X −Y simetrica;
¿ ¿ ¿
 Se ordoneaza crescator valorile
|z1−M ed| , |z 2−M ed|,.......,|zn−M ed| si se acorda ranguri de la 1 la n (
¿
M ed =M e [ X−Y ] o presupusa mediana a diferentei X −Y - in general 0 );
n(n+1)
o La valori egale rangul se inlocuieste cu media aritmetica a rangurilor corespunzatoare;
∑ ¿ 1≤k≤n¿¿¿¿rbra¿¿¿⇒Tc =Tcalculat=min{T+,T−}¿
¿
z k−M ed <0¿
n(n+1)
T α +T 1−α =
 2 (din tabele);
n( n+1) n(n+1 )(2 n+1 )
 Pentru n mare ( n>20 ) se aproximeaza statistica T cu
T~N ( 4
,
√
24
⇒ )
n( n+1)
T c−
4
Z=
n( n+1 )(2 n+1 )
24 √ (si chiar statisticile T + si T − );
n( n+1) n(n+1)(2 n+1 ) 1 k 3
T~N
4( ,
24 √ − ∑ ( t i −t i )
48 i=1 ) , unde
{t i=numbers of subject sharing rank i ¿ ¿¿¿

n (n+1)
T c−
−0 . 5
4
Z=
n(n+1)(2 n+1 )
 Corectie de continuitate 24 √ ;

¿
a )¿ ¿ ¿ ¿
¿ Testul Wilcoxon bazat pe suma rangurilor (two independent samples)
sau testul Mann-Whitney
 Comditii de aplicare:
o Variabila dependenta ordinala sau continua, de exemplu:
 Scara Likert;
 7-point scale;
 Timpul de revizie, IQ-ul, nota la un examen, greutatea, tensiunea arteriala;
o Variabila independenta consta in doua grupuri categoriale si independente, de exemplu:
 Barbati – Femei;
 Angajat – Somer;
 Fumator – Nefumator;
 Tratement placebo – tratament efectiv;
o Observatii independente;
o Variabilele X ,Y nu sunt normale (deci nu se poate folosi testul t);
o Variabilele X ,Y au aceeasi forma;
 Test neparametric pentru date cantitative continue;
x , y , unde x=( x 1 , x 2 , .. .. . , x m ) si y=( y 1 , y 2 , .. . .. , y n )
 Variabilele trebuie sa fie cel putin “interval-scaled” (sa
aiba mediana si sa i se poata atribui ranguri);
 Se testeaza daca selectiile independente provin din aceeasi populatie;
 Este o alternativa pentru testul t pentru esantione independente (nu sunt indeplinite conditiile testului t - datele
nu sunt normale, esantion mic, etc.);
¿ ¿ ¿ ¿
 Se ordoneaza crescator datele:
x 1−M ed ,...., x m−M ed , y 1 −M ed , ...., y n−M ed ( m≤n ) si se acorda
¿
ranguri (
M ed =M e [ X−Y ] o presupusa mediana a diferentei X −Y - in general 0);
( m+ n)(m+n+1 )
 La valori egale rangul se inlocuieste cu media aritmetica a rangurilor corespunzatoare;
m(m+1)

U 1=nm+
2
U 1 +U 2=mn ;
1≤k≤m
}
− ∑ rang (|xk −M ¿ed|) ¿ ¿¿⇒U c =U calculat =min {U 1 , U 2 }¿
(statistica testului);

 Pentru m ,n mare ( m , n>20 ) se aproximeaza statistica U c cu
nm
U c−
2
Z=
n(n+ m+1 ) nm(n+ m+1 )
Uc ~ N (2
,
12
⇒
√ ) √ nm( n+m+ 1)
12 (poate chiar statisticile U 1 si U 2 );
k

T~N
4 (
n( n+m+1) nm(n+m+1 )
,
12
−
√
nm
∑
12(n+m)(n+m−1) i=1
( t 3i −t i ) ) ,
unde
{ti=numbers of subject sharing rank i ¿ ¿¿¿
o
( n+m)( n+ m+1 )
U m , n , α +U m , n , 1−α =
 2 (din tabele)

¿
a )¿ ¿ ¿
¿
¿
II.TESTE DE INDEPENDENTA
Chi squared TEST (de independenta/asociere/omogenitate)

2
(O−E )
χ 2c =∑ =∑ ¿ ¿ ¿ ¿ ¿
 Test de concordanta
E i, j ;
o Masoara de fapt cat de mult difera datele observate de datele asteptate;
o Se foloseste cand avem doua variabile, X si Y ;
o Se testeaza daca doua sau mai multe esantioane provin din aceeasi populate “mama” presupusa;
o Se lucreaza cu date nominale si ordinale (de aceea apar frecvente si nu medii sau variante);
o In cazul datelor continue, acestea se impart in clase (categorii, bins- tabele de contingenta);
o Indica daca variabilele X si Y sunt independente dar nu cuantifica puterea asocierii dintre ele;
¿^ ≥1 , ∀i=1 , r , ∀ j=1 , s

n(nr . clase )≥30 ; nij ≥5 , n⋅ pij ¿ (altfel se aplica testul exact al lui Fisher);

χ 21−α ,df =F−1

df ( 1−α ) =F −1
n−1 ( 1−α )=CHISQ. INV df ( 1−α )=CHISQ. INV n−1 ( 1−α ) si
(O−E)2 ¿
χ 2c = ∑ E =∑ ¿¿¿¿
i, j
 ¿
 df =(r−1 )(s−1 ) ;

¿ ¿ ¿
¿
Testul exact al lui Fisher (de independenta/asociere/omogenitate)
Y→
O= a b ( ) Y1 Y2 Total
c d X↓
X1 a b a+b
C aa+b⋅C cc+d
p(O)= a+c = X2 c d c+d
Cn
C aa+c⋅Cbb+d Total a+c
b+
n=a+c+b+d
d
C a+b
n
pi qi Y→
E i=
( ri ti ) X↓
X1 pi
Y1
qi
Y2 Total
a+b
pi r
C a+b i
⋅C c+d X2 ri ti c+d
p( Ei )= =
C a+c
n
p q b+
C a i+c ¿ C b+d
i
Total a+c n=a+c+b+d
d
C an +b
 Constrangere:frecventele marginale sunt cele observate;
 Grupurile trebuie sa fie independente;
 Se bazeaza pe distributia hipergeometrica;
 Se poate aplica si pentru tabele mai mari dar calculele sunt foarte complicate;
 Date categoriale;
o a<5 sau b<5 sau c<5 sau d <5 ;
( a+b )! (c+d )!(a+c )! (b+d )! (a+b )!(c +d )!( a+c )!(b+d )!
p(O)= =
o a ! b !c !d ! n ! a ! b !c ! d !(a+b+c+d )! ;
∑ ¿ P ( Ei)≤P(O) ¿¿
 (more extreme than O)¿ ;

pcritic =α= pragul de semnificatie ;
¿ ¿ ¿
¿
FUNCTII EXCEL
BINOM . DIST (k ,n, p,true )=F n , p (k )= ∑ C kn p k (1−p)n−l ;

0≤l≤k
1.
BINOM . INV (n, p, α )=F −1
n , p ( α );
( x−m)2
−
1 2σ 2
f m, σ ( x)=f ( x)= 2
e
√2πσ
x x
NORM . DIST( x , m, σ , true )=F ( x)= ∫ f m, σ (t )dt ; NORM . S. DIST =F( x)= ∫ f 0 , 1 (t )dt
−∞ −∞
−1 −1
NORM . INV ( p , m, σ )=NORM . DIST ( p, m, σ , true )=F ( p);
NORM .S. INV ( p)=NORM . S. DIST −1 ( p)=F−1 ( p);
¿ s¿
CONFIDENCE. NORM (α , s ,n)=z α ⋅
1− √ n
2. 2
df +1
Γ ( 2 ) x 2 − df +1
f df ( x)=f ( x)=
df
√df⋅π⋅Γ ( )
( 1+ )
df
2
2
x
T . DIST ( x , df , true)=F df ( x)= ∫ f df (t )dt ; T . INV ( p , df )=T . DIST −1 ( p , df , true )=F−1
df ( p);
−∞
∞
T . DIST . RT ( x,df )=1−T . DIST ( x, df , true )=1−F df ( x)=∫ f df (t )dt ;
x
∞
T . DIST .2 T (x ,df )=2∗T . DIST . RT ( x ,df )=2
σ ( 1−F
−1 df ( x)
α =2⋅σ f (t )dt ;
CONFIDENCE . NORM ( α , σ , n )=z α⋅ =Φ 1− ) ⋅ ∫x df( )
1− √ n 2 √n
3. 2
p
T . INV . 2T ( p,df )=T . DIST .2T −1 ( p,df )=F df 1− ;
¿
2 ( )
¿ s
CONFIDENCE . T ( α , s ,n )=t α⋅
n−1,1− √ n
2
4. MWDIST ( x, m ,n , tails , Mw )  x=numerical value at which you want to evaluate the
Returns Mann-Whitney exact test distribution Mann_Whitney exact test distribution;
value  m=sample 1 size;
 n=sample 2 size;
 Mw=true - pentru Mann-Whitney version;
 Mw= false – pentru Wilcoxon Ranked Sum version;
MWINV ( p , m ,n , tails , Mw )  p=probability associated with the Mann_Whitney
Returns the inverse of Mann-Whitney exact exact test distribution
test distribution value  m=sample 1 size;
 n=sample 2 size;
 Mw=true - pentru Mann-Whitney version;
 Mw= false – pentru Wilcoxon Ranked Sum version;
MW EXACT (array 1 , array 2 ,Tails ) 
Returns p-value for Mann-Whitney test
MWTEST (array 1, array 2 , Tails, Ties ,Cont )  Ties= corectie ties;

Returns p-value for Mann-Whitney test using  Cont= corectie continuitate;
normal aproximation

Teste Statistic e

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Teste Statistic e

Încărcat de

Drepturi de autor:

Formate disponibile

I.

TESTE PARAMETRICE (DE COMPARATIE)

One sample Z – TEST for the mean

 Test de comparatie √ ( s1) ( s 2)

unpooled formula( Welch)

o se compara mediile necunoscute a doua populatii M [ X 1 ]=m1 =m 2 =M [ X 2 ] – (eventual diferenta

o se compara procentele de succese necunoscute p1 , p2 a doua populatii;

II.1.TESTE DE CONCORDANTA (DE POTRIVIRE, GOOD – FITTING)

Chi squared good – fitting TEST (de potrivire)

 df =n−1 SAU df =n−1− p , p=numarul de parametrii estimati; ;

 Test neparametric si “distribution free”;

Testul Kruskal – Wallis (echivalent ANOVA)

 Pentru n mare ( np≥5 , n(1− p )≥5 ) se aproximeaza statistica N cu

∑ ¿ 1≤k≤n¿¿¿¿rbra¿¿¿⇒Nc =Ncalculat =max{N+,N−}¿

 Pentru n mare ( np≥5 , n(1− p )≥5 ) se aproximeaza statistica N cu

∑ ¿ 1≤k≤n¿¿¿¿rbra¿¿¿⇒Tc=Tcalculat =min {T+,T−}¿

{ti=numbers of subject sharing rank i ¿ ¿¿¿

{t i=numbers of subject sharing rank i ¿ ¿¿¿

 Corectie cand exista “tied ranks”:

Chi squared TEST (de independenta/asociere/omogenitate)

χ 21−α ,df =F−1

BINOM . DIST (k ,n, p,true )=F n , p (k )= ∑ C kn p k (1−p)n−l ;

MWTEST (array 1, array 2 , Tails, Ties ,Cont )  Ties= corectie ties;

S-ar putea să vă placă și