Sunteți pe pagina 1din 28

I.

TESTE PARAMETRICE (DE COMPARATIE)

One sample Z – TEST for the mean


(Testul erorii standard a mediei)
x−m0
Z=
σ0
 Test de comparatie √n .
o Variabila X continua;
o Se compara media cunoscuta a unei populatii
m0 cu media unui esantion x (ales eventual dintr-o
sunpopulatie);
o Se testeaza daca esantionul este din populatie;
o Se testeaza daca
m0 =M [ X ] ;
X ~ N ( m0 , σ 0 )
 Stim ca distributia de esantionare este normala ( SAU n≥30 (daca
X ~ N ( m 0 , σ 0 ) si n<30
testul este orientativ)) ;
 Daca n mare X poate avea orice distributie;
¿

σ 0 =σ [ X ] cunoscut sau estimatorul σ 0 ≃s ;
α α
1−
2
2( ) ( )
z α =F−1 1− =Φ−1 1− sau z 1−α =F−1 (1−α )=Φ−1 (1−α ) sau z α =F−1 (α )=Φ−1 ( α )
2
x−m0
si z c = ;
σ0
 √n ;
p=1−F (|z c|)=F ( −|z c|) =1−Φ (|z c|) =Φ ( −|z c|)

a ) ¿
¿¿ ¿
Two independent samples Z-TEST for the means
x 1 −x2 −( m1 −m2 )

de obicei =0
Z=
σ 12 σ 22
 Test de comparatie √ n1
+
n2 ;
o Variabilele X1, X2 continue;
o se compara mediile necunoscute a doua populatii M [ X 1 ]=m1 =m 2 =M [ X 2 ] ;
o se testeaza daca mediile a doua esantione sunt egale;
o se testeaza daca esantioanele fac parte din aceeasi populatie – eventual diferenta mediilor)
X 1 ~ N ( m 1 , σ 1 ) , X 2 ~ N ( m2 , σ 2 )
 Stim ca distributia de esantionare este normala ( SAU
( n1 ≥30 si n2 ≥30 ) si esantione independente;
 Daca n1 , n 2 mari X 1 si X 2 pot avea orice distributie;

 σ 1 =σ [ X 1 ] si σ 2=σ [ X 2 ]
cunoscute sau estimatorii
σ 1 =s¿1 , σ 2=s ¿2 ;
x 1 −x2 −( m1 −m2 )

α α
z
1−
α =F
−1
( )
1− =Φ−1 1−
2 2 ( )
sau z 1−α =F−1 ( 1−α )=Φ−1 (1−α ) si z c=
σ 21
de obicei =0

σ 22

2

p=1−F (|z c|)=F ( −|z c|) =1−Φ (|z c|) =Φ ( −|z c|)
√ +
n1 n2 ;


¿
a ) ¿¿ ¿ ¿
 ¿
One sample T – TEST (student) for the mean
x −m0
T= ¿
s
 Test de comparatie √n
o Variabila X continua;
o Se compara media cunoscuta unei populatii cu media unui esantion (ales eventual dintr-o subpopulatie);;
o Se testeaza daca esantionul este din populatie;
o Se testeaza daca
m0 =M [ X ] ;
n<30( nu obligatoriu ), X ~ N ( m0 , σ )
 Stim ca distributia de esantionare este normala ( (daca
X≈ N ( m 0 , σ )
testul este orientativ);
 Daca n mare X poate avea orice distributie;
 df =n−1 ;
α α x −m0
t
df , 1−
2
−1
( )
α =F df 1−
2 2 ( )
=T . INV df 1− sau t df , 1−α =F−1 df (1−α)=T . INV df ( 1−α ) si t c =
s
¿

 √n ;
p=1−F df (|t c|)=F df (−|tc|)=1−T . DIST df (|t c|)=T . DIST df (−|t c|)


 σ =σ [ X ] necunoscut;

¿
a )¿ ¿ ¿ ¿
 ¿
Two independent samples T - TEST (la dispersii necunoscute dar egale)
for the means
x 1−x 2 −( m1 −m 2 )
x 1 −x 2−( m1−m2 )

de obicei=0
T= → ( pooled formula )
¿ 2 ¿ 2 1 1

 Test de comparatie √ ( s1) ( s 2)


n1
+
n2
s p⋅
√ +
n1 n2
, unde
¿ 2 ¿ 2
n1 s 21 +n 2 s 22
s p=

n1 + n2 −2
=

X1, X2
( n1 −1 ) ( s1 ) + ( n2 −1 ) ( s2 )
n1 +n2 −2 ;
o Variabilele continue;
o se compara mediile necunoscute a doua populatii M [ X 1 ]=m1 =m 2 =M [ X 2 ] – (eventual diferenta
mediilor);
o se testeaza daca mediile a doua esantione sunt egale;
o se testeaza daca esantioanele fac parte din aceeasi populatie – eventual diferenta mediilor)
n , n <30 , X 1 ~ N ( m 1 , σ 1 ) , X 2 ~ N ( m2 , σ 2 )
 Stim ca distributia de esantionare este normala ( 1 2 SAU
X 1 −X 2 ~ N ( m0 , σ 0 )
si esantione independente;
 Daca n1 , n 2 mari X 1 si X 2 pot avea orice distributie;
2
( s¿1)
test Fisher 0,5< ¿ 2 <2
 σ 1 =σ [ X 1 ] si σ 2=σ [ X 2 ]
necunoscute dar egale ( σ 1= σ 2 =σ ) , ( s2) ;
 df =n1 +n 2−2 ;

t
df , 1−
α
2
=F−1 ( α2 )=T . INV (1−α2 ) sau
df 1− df

x1 −x 2 −( m1 −m2 )
x 1 −x2 −( m1 −m 2 )

de obicei=0
t df , 1−α =F−1 −1
df (1−α )=T . INV df ( 1−α ) si t c= → ( pooled formula),
¿ 2 ¿ 2 1 1

√ ( s1 )
n1
+
( s2 )
n2 √
s p⋅ +
n1 n 2
¿ 2 ¿ 2
n1 s12 +n2 s22
unde s p =

n1 +n2 −2
=

( n1−1 ) ( s 1 ) + ( n2−1 ) ( s 2 )
n1 +n2 −2
;

p=1−F df (|t c|)=F df (−|tc|)=1−T . DIST df (|t c|)=T . DIST df (−|t c|)

¿
a )¿ ¿ ¿
Two independent samples T –TEST (la dispersii necunoscute si inegale)
for the means
x 1 −x 2− ( m1−m2 )

de obicei 0
T=
2 2

 Test de comparatie
n1
⏟ √
n2
( s ¿1 )
+

unpooled formula( Welch)


( s ¿2 )

o se compara mediile necunoscute a doua populatii M [ X 1 ]=m1 =m 2 =M [ X 2 ] – (eventual diferenta


mediilor);
o se testeaza daca mediile a doua esantione sunt egale;
o se testeaza daca esantioanele fac parte din aceeasi populatie – eventual diferenta mediilor)
 Stim ca distributia de esantionare este normala (
n1 , n2 <30( nu obligatoriu ) , X 1 ~ N ( m 1 , σ 1 ) , X 2 ~ N ( m 2 , σ 2 )
;
 Daca n1 , n 2 mari X 1 si X 2 pot avea orice distributie;
2 2
( s¿1) ( s ¿1 )
test Fisher ¿ 2
≤0,5 SAU ¿ 2 ≥2
σ 1 =σ [ X 1 ] si σ 2=σ [ X 2 ] ( σ 1≠σ 2 ) s
( 2) ( s2)
 necunoscute si inegale , ;
2
( s¿1 )2 ( s ¿2 ) 2


df =

t
[ α
(¿ 4
n1

( s2 )
+
+
n2

( s2)
n21 ( n1 −1 ) n 22 ( n2 −1 )

=F−1
df 1− ( ) α
)
¿ 4

]
α
;

( )
=T . INV df 1− sau t df , 1−α =F−1
df (1−α )=T . INV df (1−α) sau
df , 1−
2
2 2
x 1− x2 −( m1 −m2 )
t df , α =F −1
df (α )=T . INV df (α ), si t c = ;
¿ 2 ¿ 2
( s1 ) ( s 2)



n
⏟ 1
+
n2
unpooled

p=1−F df (|t c|)=F df (−|tc|)=1−T . DIST df (|t c|)=T . DIST df (−|t c|)

¿
a )¿ ¿ ¿ ¿
 ¿
Two paired samples T-TEST – (la dispersii necunoscute si inegale)
for the means
d−( m 1 −m 2 )
T=
sd
¿
¿ 2 ∑ ( di −d ) 2
d=x 1 −x 2 , ( sd ) =
 Test de comparatie √n , unde n−1
o se compara mediile necunoscute ale aceleiasi populatii la momente diferite de timp (before and after)
M [ X 1 ]=m1 =m 2 =M [ X 2 ]
– (eventual diferenta mediilor);
o se testeaza daca mediile unui acelasi esantion (la momente diferite de timp ) sunt egale;
 Stim ca distributia de esantionare este normala ( n<30( nu obligatoriu ), D=X 1 −X 2 ~ N ( m, σ ) ;
 Daca n1 , n 2 mari X 1 si X 2 pot avea orice distributie;
 σ 1 =σ [ X 1 ] si σ 2=σ [ X 2 ]
necunoscute s i inegale ( σ 1≠σ 2 ) ;
 df =n−1 ;
t
df , 1−
−1
α =F df
2
(1− α2 )=T . INV (1−α2 ) sau t
df df , 1−α =F df (1−α )=T .
−1
INV df (1−α) sau

d −( m 1−m2 ) ¿ 2 ∑ ( d i −d )2
t df , α =F −1
df (α )=T . INV df (α ), si t c = , unde d =x1 −x 2 , ( s d ) = ;
s¿d n−1
 √n ;
p=1−F df (|t c|)=F df (−|tc|)=1−T . DIST df (|t c|)=T . DIST df (−|t c|)

¿
a )¿ ¿ ¿ ¿


¿
One sample Z-TEST pentru proportia de succese intr-o populatie binomiala
^p −p 0
P=
p0 ( 1− p0 )
 Test de comparatie √ n
p0 ;
o se testeaza daca procentul de succese din populatie este
o Se poate face pe date calitative;
o Se compara procentul de succese cunoscut unei populatii
p
0 cu cu procentul de succese ^p din
esantion;
np≥5 , n(1− p )≥0 , X ~ N ( m0 , σ ) (n mare ) ;

α α
z α =F−1 1− =Φ−1 1−
1−
2
2 ( ) 2 ( )
sau z 1−α =F−1 ( 1−α )=Φ−1 (1−α ) sau z α =F−1 (α )=Φ−1 ( α )

^p− p 0
si pc = ;
p 0 ( 1−p 0 )
 √
p0 cunoscut;
n ;

p=1−F (|z c|)=F ( −|z c|) =1−Φ (|z c|) =Φ ( −|z c|)


¿
a) ¿ ¿¿
¿
 ¿
Two independent samples Z-TEST
pentru proportia de succese intr-o populatie binomiala
 Test de comparatie
^
¿
p
¿^ −
2
1 1

P=
√ p^ ( 1− p^ )

p1
( 1
+
n n
2 )
, unde p^ =
x 1+ x 2
=procentul comun de succese din cele doua esantioane; ¿ ¿
n1 + n2

o se compara procentele de succese necunoscute p1 , p2 a doua populatii;


o Se poate face pe date calitative;
o se testeaza procentele de succese a doua esantioane sunt egale;
n1 p1 , n1 ( 1− p1 ) , n 2 p 2 , n2 ( 1− p 2 ) ≥5 , X 1 ~ N ( m1 , σ 1 ) , X 2 ~ N ( m2 , σ 2 ) ( n1 ,n 2 mari )
 si esantioane
independente;
 p1 , p2 necunoscute;
¿^
p
¿^−
2
1 1

α −1 α
√ ( )
^p (1− ^p ) +
n n
1 2 x1+x2


1−
2
−1
2 ( ) ( )
2
−1 −1
z α =F 1− =Φ 1 − sau z1−α =F (1−α)=Φ (1−α) si pc = p1 , ¿unde p^ =
n1 +n2
=procentul comun de succese din cele doua esantioane; ¿
;
p=1−F (|z c|)=F ( −|z c|) =1−Φ (|z c|) =Φ ( −|z c|)

¿
a ) ¿¿ ¿ ¿
 ¿
Chi squared TEST (pentru dispersie)
2
(n−1 ) ( s ¿ )
χ 2c = 2 2 2
 Test de comparatie σ0 (se testeaza daca
σ [ X ]=σ 0 )
X ~ N ( m0 , σ )
 ;

α α α α
χ 2α == F−1
2
df
, df () ()
2
=F−1
n−1
2 () 2 ()
=CHISQ. INV df =CHISQ . INV n−1
2
,

¿ 2
α α α α (n−1) ( s )
χ 2
α =F (1− )=F ( 1− )=CHISQ . INV (1− )=CHISQ . INV (1− ) si χ =
−1
df
−1
n−1 df n−1; 2
c 2
1− ,df
2
2 2 2 2 σ 0 ;
 σ =σ [ X ] necunoscut;
 df =n−1 ;
p=1−F ()=1−F (|z c|)=F ( −|z c|) =1−Φ (|z c|) =Φ ( −|z c|)

¿
a )¿ ¿ ¿
F(Fisher-Snedecor) - TEST (pentru compararea a doua dispersii)
2
( s¿1) ¿ ¿
F c= ¿ , s 1 > s2
 Test de comparatie ( s2)
(se testeaza daca σ 1 =σ [ X 1 ]=σ [ X 2 ]=σ 2 );
o se compara dispersiile necunoscute a doua populatii;
o este nevoie la testul – t sa stim daca σ 1 =σ 2 ;

X 1 ~ N ( m 1 , σ 1 ) si X 2 ~ N ( m 2 , σ 2 ) obligatoriu
 ;
α α α
F
df 1 , df 2 ,
−1
α =Fdf 1 , df 2
2
()2
=F−1 ()
n1−1 , n2−1
2 ()
=F . INV df , df
1 2 2
,
2
¿
α α α ( s1 )

F
df 1 , df 2 , 1−
α =F
2
−1
( 2)
1−
df 1 , df 2 =F ( 2 ) =F . INV
1− −1
n1−1 , n2−1 n1−1 , n2 −1 ( )
1− si F c = ¿ ;
2 ( s2 ) ;
 σ 1 =σ [ X 1 ] , σ 1 =σ [ X 1 ] necunoscute;
 df 1 =n1 −1 , df 2 =n2 −1 ;

¿
a )¿ ¿ ¿
II.TESTE NEPARAMETRICE
 Testele neparametrice se aplica in urmatoarele situatii:
o Datele cantitative nu indeplinesc conditii (de normalitate, dispersii egale, etc);
o Date calitative ordonate (variabila raspuns este ordinal – de tip rang));
o
 Compara mai degraba medianele decat mediile;
 La multe dintre ele nu se fac presupuneri asupra repartitiei datelor de esantionare (la esantioane de volum mic);
 Sunt mai robuste decat testele parametrice dar cu putere mai mica de a detecta falsitatea ipotezei nule;
 Multe teste neparametrice inlocuiesc datele initiale cu ranguri sau semn (rangurile – putin probabil sa satisfaca
conditia de normalitate);
 Sunt folosite atunci cand sunt dubii asupra normalitatii datelor statistice;
 Se pot construi teste neparametrice corespunzatoare fiecarui test parametric;

II.1.TESTE DE CONCORDANTA (DE POTRIVIRE, GOOD – FITTING)

Chi squared good – fitting TEST (de potrivire)


(testul lui Pearson)
n 2
(O−E )
2
( f −np )
χ 2c = ∑ E = ∑ k np k
 Test de concordanta k =1 k ;
 Este in general neparametric dar poate fi si parametric (in cazul in care se estimeaza anumiti parametrii) ;
o Masoara de fapt cat de mult difera datele observate de datele asteptate;
o Se foloseste cand avem o singura variabila, X ;
o Se lucreaza cu date nominale si ordinale (de aceea apar frecvente si nu medii sau variante);
o In cazul datelor continue, acestea se impart in clase (categorii, bins- tabele de contingenta);
o Se testeaza daca esantionul are o anumita distributie (binomiala, normala, etc ) – test de potrivire;
o Se testeaza daca un esantion provine sau nu dintr-o presupusa populatie;
o Este un test neparametric (poate fi utilizat cu esantioane formate din seturi de date care nu sunt normal
distribuite)
o Se testeaza daca s-au schimbat valorile expectate;
o Este adesea folosit pentru a stabili daca esantionul este reprezentativ pentru populatie;
n(nr. clase)≥30; 50; npk ≥5 , ∀ k=1, n sau pentru 80% din k−uri ( pentru tabele mari)
 (altfel testul exact al kui Fisher );

np k≥10, ∀ k=1, n daca df =1 ;
χ 21−α , df =F−1 −1
df ( 1−α )=F n−1 ( 1−α )=CHISQ . INV df ( 1−α )=CHISQ . INV n−1 ( 1−α ) si
n f −np 2
(O−E)2 ( k k)
χ 2c = ∑E =∑ ;
 k =1 npk

 df =n−1 SAU df =n−1− p , p=numarul de parametrii estimati; ;


¿ ¿ ¿
¿
Kolmogorov-Smirnov good – fitting TEST (de potrivire)

 Test neparametric;
 Variabilele trebuie sa fie continue (se adapteaza pentru variabile discrete sau mixte);
 Se bazeaza pe distributia Kolmogorov;
 Este un test exact (neasimptotic)
 Avantaj:poate fi folosit pentru esantioane mici si foarte mici;
 Este testul cel mai puternic pentru esantioane de volum intermediar;
o Verifica daca un esantion urmeaza o distributie de referinta presupusa (normala, uniforma, etc.);
o Masoara distanta dintre functia de distributie teoretica F si functia de distributie empirica
Fn ,

i
unde
{
Fn (x)=¿ {0 , x<x1 ¿ ,x∈[xi , xi+1 ),i=1,n−1 ¿ ¿¿¿
n ;
o Parametrii distributiei teoretice trebuie cunoscuti (altfel testul Lilliefors);
Dn =sup| F n (x )−F( x )|
o x ;
o n≥50 (altfel mai indicat Shapiro-Wilk);
a )¿ ¿
¿ ¿
Two samples Kolmogorov-Smirnov TEST

 Test neparametric si “distribution free”;


o Verifica daca doua esantioane provin din aceeasi populatie;
o Verifica daca doua populatii au aceeasi lege de repartitie ( F=G) (fara a preciza natura repartitiilor);
o Masoara distanta dintre functiile de distributie empirica
Fm si G n ale celor doua esantioane unde

i
m {
Fm ( x)=¿ {0, x<x1 ¿ , x ∈[ x i , xi+1 ), i=1,m−1 ¿ ¿¿¿
;
Dm , n =sup| F m ( x )−Gn ( x )| ( D m , n=sup ( F m ( x )−Gn ( x ) ) sau Dm , n =sup ( G n ( x )−F m (x ) ) )
o x x x ;
k 1−α=K . INV (1−α )− din tabele ;
m+n
d critic =d m , n, 1−α =k 1−α⋅
√ mn
;

mn
o
d calculat =d c=sup | F m (x )−Gn (x )|, k c =
x √ d ;
m+n c ;

¿
a )¿ ¿ ¿
¿
¿
Shapiro – Wilk goodness of fit test (de testare a normalitatii)

 Conditii de aplicare:
o Se poate aplica si pentru esantioane mici, 3≤n≤50 ( Kolmogorov – Smirnov se poate aplica
numai pentru n≥50 );
o Pentru esantioane 3≤n≤50 se aplica Shapiro – Wilk originar;
o Pentru esantioane 12 ≤n ≤ 5000 se aplica Shapiro – Wilk extins (o varianta modificata pentru
3 ≤ n≤ 11;
 Este cel mai puternic test de normalitate, urmat de Anderson – Darling, Lilliefors, Kolmogorov – Smirnov
( dupa unii statisticieni);
 Este un test de normalitate cu medie si varianta ( m si σ 2 ) neprecizate (spre deosebire de Kolmogorov –
Smirnov);
2
b
W c =W calculat =
 SS - statistica testului;
o
x 1 < x 2 <. .. .< x 2n sau x 1 < x 2 <. . ..< x 2 n+1 (sortare);
b=a1 ( x 2n −x 1 ) + a2 ( x 2 n−1 −x 2 ) +. .. .+a n ( x n+1−x n ) SAU
b=a1 ( x 2n+1 −x 1 ) +a 2 ( x 2n −x 2 ) + .. ..+ an ( x n+2 −x n ) ( fara x n+1 )
o ( a1 , a 2 ,. .. . , an din tabele in functie de n ) ;
2n 2n+1
SS= ∑ ( x k− x ) SAU SS= ∑ ( x k −x ) 2
2

o k=1 k =1 ;

 Testul Anderson – Darling

Testul Kruskal – Wallis (echivalent ANOVA)


Testul Friedman (echivalent ANOVA)
II.2. Alte teste
Testul semnelor (Single sample)
 Test neparametric pentru date ordinale;
x=( x 1 , x 2 ,. . .. . , x n )
 Variabila dependenta trebuie sa fie cel putin “ordinal-scaled” (sa aiba mediana);
 Este un test foarte general dar de putere mica (testul Wicoxon bazat pe ranguri de semn este mai puternic);
 Testeaza daca mediana unei colectii de date este egala cu o anumita valoare;
 Daca datele sunt numerice si normale se foloseste testul t;
 Singura conditie:
x
o Datele ( i )1≤i≤n aleatoare si independente
;

∑ ¿ 1≤k≤n¿¿¿¿rbra¿¿¿⇒Nc=Ncalculat =max{N+,N−}¿
¿
xk−Me<0¿
 (statistica testului);


X ~ Binom(n, 0.5)⇒ N α =F−1
n , 0 .5 (α )=BINOM . INV (n, 0.5, α )

 Pentru n mare ( np≥5 , n(1− p )≥5 ) se aproximeaza statistica N cu


N ~N ( n2 , √2n )⇒
n
Nc−
2
Z=
√n
2 ;
n
N c −0 . 5−
2
Z= =corectie de continuitate
√n
o 2 ;

¿
a )¿ ¿ ¿
Testul semnelor (two paired samples)
 Test neparametric pentru date ordinale;
x− y , unde x=( x 1 , x 2 ,. . .. . , x n ) si y=( y 1 , y 2 ,. . .. . , y n )
 Variabila trebuie sa fie cel putin “ordinal-scaled” (sa
aiba mediana);
 Este un test foarte general dar de putere mica (testul Wilcoxon bazat pe ranguri de semn este mai puternic);
 Testeaza daca e M [ X−Y ]=0 ( e M [ X−Y ]
este o presupusa mediana a diferentei X −Y ;
 Daca sunt indeplinite conditiile testulului t pentru esantioane perechi, se aplica acest test;
 Singura conditie:
x − yi )1≤i ≤n
o Diferentele ( i aleatoare si independente
;

∑ ¿ 1≤k≤n¿¿¿¿rbra¿¿¿⇒Nc =Ncalculat =max{N+,N−}¿


z =x −y <0¿
 i i i

X −Y ~ Binom(n, 0.5)⇒ N α =F−1
n , 0 .5 (α )=BINOM . INV (n, 0.5, α )

 Pentru n mare ( np≥5 , n(1− p )≥5 ) se aproximeaza statistica N cu


N ~N ( n2 , √2n )⇒
n
Nc−
2
Z=
√n
2 ;
n
N c −0 . 5−
2
Z= =corectie de continuitate
√n
o 2 ;

¿
a )¿ ¿ ¿
Testul Wilcoxon bazat pe ranguri cu semn (Single sample)
 Test neparametric pentru date cantitative;
x=( x 1 , x 2 ,. . .. . , x n )
 Variabila dependenta trebuie sa fie cel putin “interval-scaled” (sa aiba mediana si sa i se
poata atribui ranguri);
 Este mai puternic decat testul de semn;
 Este o alternativa pentru testul t (nu sunt indeplinite conditiile testului t - datele nu sunt normale, esantion mic,
etc.)
 Se aplica pentru:
x=( x i )1≤i≤n
o distributie simetrica (sau cu asimetrie mica) a lui
¿ ¿ ¿
 Se ordoneaza crescator valorile
|x 1−M e| , |x 2−M e|,.......,|x n−M e|
si se acorda ranguri de la 1 la n (
M ¿e
mediana populatiei cunoscuta);
n(n+1)
o Suma rangurilor 2 ;
o La valori egale rangul se inlocuieste cu media aritmetica a rangurilor corespunzatoare;

∑ ¿ 1≤k≤n¿¿¿¿rbra¿¿¿⇒Tc=Tcalculat =min {T+,T−}¿


¿
xk−Me<0¿
 (statistica testului);
n(n+1)
T α +T 1−α =
 2 (din tabele);
n( n+1) n(n+1 )(2 n+1 )
 Pentru n mare ( n>20 ) se aproximeaza statistica T cu
T~N ( 4
,
√24
⇒ )
n( n+1)
T c−
4
Z=
n( n+1 )(2 n+1 )

24 (si chiar statisticile T + si T − );
n( n+1) n(n+1)(2 n+1 ) 1 k 3
 Corectie cand exista “tied ranks”:
T~N (
4
,
24 √ − ∑ ( t i −t i )
48 i=1 ) , unde

{ti=numbers of subject sharing rank i ¿ ¿¿¿


n (n+1)
T c− −0 . 5
4
Z=
n(n+1)(2 n+1 )
 Corectie de continuitate 24 √ ;

¿
a )¿ ¿ ¿
Testul Wilcoxon bazat pe ranguri cu semn (two paired samples)
 Test neparametric pentru date cantitative;
x− y , unde x=( x 1 , x 2 ,. . .. . , x n ) si y=( y 1 , y 2 ,. . .. . , y n )
 Variabila trebuie sa fie cel putin “interval-scaled” (sa
aiba mediana si sa i se poata atribui ranguri);
 Este mai puternic decat testul de semn;
 Este o alternativa pentru testul t pentru esantione perechi (nu sunt indeplinite conditiile testului t - datele nu
sunt normale, esantion mic, etc. sau sunt ordinale);
 Se aplica pentru:
z=( x 1 − y 1 , x2 − y 2 , . .. .. , x n − y n )
o Distributia simetrica (sau cu asimetrie mica);
o X si Y sunt continue si difera doar prin valorile medii X −Y simetrica;
¿ ¿ ¿
 Se ordoneaza crescator valorile
|z1−M ed| , |z 2−M ed|,.......,|zn−M ed| si se acorda ranguri de la 1 la n (
¿
M ed =M e [ X−Y ] o presupusa mediana a diferentei X −Y - in general 0 );
n(n+1)
o Suma rangurilor 2 ;
o La valori egale rangul se inlocuieste cu media aritmetica a rangurilor corespunzatoare;

∑ ¿ 1≤k≤n¿¿¿¿rbra¿¿¿⇒Tc =Tcalculat=min{T+,T−}¿
¿
z k−M ed <0¿
 (statistica testului);
n(n+1)
T α +T 1−α =
 2 (din tabele);
n( n+1) n(n+1 )(2 n+1 )
 Pentru n mare ( n>20 ) se aproximeaza statistica T cu
T~N ( 4
,

24
⇒ )
n( n+1)
T c−
4
Z=
n( n+1 )(2 n+1 )
24 √ (si chiar statisticile T + si T − );
n( n+1) n(n+1)(2 n+1 ) 1 k 3
 Corectie cand exista “tied ranks”:
T~N
4( ,
24 √ − ∑ ( t i −t i )
48 i=1 ) , unde

{t i=numbers of subject sharing rank i ¿ ¿¿¿


n (n+1)
T c−
−0 . 5
4
Z=
n(n+1)(2 n+1 )
 Corectie de continuitate 24 √ ;

¿
a )¿ ¿ ¿ ¿
¿ Testul Wilcoxon bazat pe suma rangurilor (two independent samples)
sau testul Mann-Whitney
 Comditii de aplicare:
o Variabila dependenta ordinala sau continua, de exemplu:
 Scara Likert;
 7-point scale;
 Timpul de revizie, IQ-ul, nota la un examen, greutatea, tensiunea arteriala;
o Variabila independenta consta in doua grupuri categoriale si independente, de exemplu:
 Barbati – Femei;
 Angajat – Somer;
 Fumator – Nefumator;
 Tratement placebo – tratament efectiv;
o Observatii independente;
o Variabilele X ,Y nu sunt normale (deci nu se poate folosi testul t);
o Variabilele X ,Y au aceeasi forma;
 Test neparametric pentru date cantitative continue;
x , y , unde x=( x 1 , x 2 , .. .. . , x m ) si y=( y 1 , y 2 , .. . .. , y n )
 Variabilele trebuie sa fie cel putin “interval-scaled” (sa
aiba mediana si sa i se poata atribui ranguri);
 Se testeaza daca selectiile independente provin din aceeasi populatie;
 Este o alternativa pentru testul t pentru esantione independente (nu sunt indeplinite conditiile testului t - datele
nu sunt normale, esantion mic, etc.);
¿ ¿ ¿ ¿
 Se ordoneaza crescator datele:
x 1−M ed ,...., x m−M ed , y 1 −M ed , ...., y n−M ed ( m≤n ) si se acorda
¿
ranguri (
M ed =M e [ X−Y ] o presupusa mediana a diferentei X −Y - in general 0);
( m+ n)(m+n+1 )
o Suma rangurilor 2 ;
 La valori egale rangul se inlocuieste cu media aritmetica a rangurilor corespunzatoare;

m(m+1)

U 1=nm+
2
U 1 +U 2=mn ;
1≤k≤m
}
− ∑ rang (|xk −M ¿ed|) ¿ ¿¿⇒U c =U calculat =min {U 1 , U 2 }¿
(statistica testului);

 Pentru m ,n mare ( m , n>20 ) se aproximeaza statistica U c cu
nm
U c−
2
Z=
n(n+ m+1 ) nm(n+ m+1 )
Uc ~ N (2
,
12

√ ) √ nm( n+m+ 1)
12 (poate chiar statisticile U 1 si U 2 );
k

 Corectie cand exista “tied ranks”:


T~N
4 (
n( n+m+1) nm(n+m+1 )
,
12


nm

12(n+m)(n+m−1) i=1
( t 3i −t i ) ) ,

unde
{ti=numbers of subject sharing rank i ¿ ¿¿¿
o
( n+m)( n+ m+1 )
U m , n , α +U m , n , 1−α =
 2 (din tabele)

¿
a )¿ ¿ ¿
¿
¿
II.TESTE DE INDEPENDENTA

Chi squared TEST (de independenta/asociere/omogenitate)


2
(O−E )
χ 2c =∑ =∑ ¿ ¿ ¿ ¿ ¿
 Test de concordanta
E i, j ;
 Test neparametric;
o Masoara de fapt cat de mult difera datele observate de datele asteptate;
o Se foloseste cand avem doua variabile, X si Y ;
o Se testeaza daca doua sau mai multe esantioane provin din aceeasi populate “mama” presupusa;
o Se lucreaza cu date nominale si ordinale (de aceea apar frecvente si nu medii sau variante);
o In cazul datelor continue, acestea se impart in clase (categorii, bins- tabele de contingenta);
o Indica daca variabilele X si Y sunt independente dar nu cuantifica puterea asocierii dintre ele;
¿^ ≥1 , ∀i=1 , r , ∀ j=1 , s


n(nr . clase )≥30 ; nij ≥5 , n⋅ pij ¿ (altfel se aplica testul exact al lui Fisher);

χ 21−α ,df =F−1


df ( 1−α ) =F −1
n−1 ( 1−α )=CHISQ. INV df ( 1−α )=CHISQ. INV n−1 ( 1−α ) si
(O−E)2 ¿
χ 2c = ∑ E =∑ ¿¿¿¿
i, j
 ¿
 df =(r−1 )(s−1 ) ;

¿ ¿ ¿
¿
Testul exact al lui Fisher (de independenta/asociere/omogenitate)

Y→
O= a b ( ) Y1 Y2 Total
c d X↓
X1 a b a+b
C aa+b⋅C cc+d
p(O)= a+c = X2 c d c+d
Cn
C aa+c⋅Cbb+d Total a+c
b+
n=a+c+b+d
d
C a+b
n
pi qi Y→
E i=
( ri ti ) X↓
X1 pi
Y1

qi
Y2 Total

a+b
pi r
C a+b i
⋅C c+d X2 ri ti c+d
p( Ei )= =
C a+c
n
p q b+
C a i+c ¿ C b+d
i
Total a+c n=a+c+b+d
d
C an +b
 Test neparametric;
 Constrangere:frecventele marginale sunt cele observate;
 Grupurile trebuie sa fie independente;
 Se bazeaza pe distributia hipergeometrica;
 Se poate aplica si pentru tabele mai mari dar calculele sunt foarte complicate;
 Date categoriale;
o a<5 sau b<5 sau c<5 sau d <5 ;
( a+b )! (c+d )!(a+c )! (b+d )! (a+b )!(c +d )!( a+c )!(b+d )!
p(O)= =
o a ! b !c !d ! n ! a ! b !c ! d !(a+b+c+d )! ;

∑ ¿ P ( Ei)≤P(O) ¿¿
 (more extreme than O)¿ ;

pcritic =α= pragul de semnificatie ;

¿ ¿ ¿
¿
FUNCTII EXCEL

BINOM . DIST (k ,n, p,true )=F n , p (k )= ∑ C kn p k (1−p)n−l ;


0≤l≤k

1.
BINOM . INV (n, p, α )=F −1
n , p ( α );
( x−m)2

1 2σ 2
f m, σ ( x)=f ( x)= 2
e
√2πσ
x x
NORM . DIST( x , m, σ , true )=F ( x)= ∫ f m, σ (t )dt ; NORM . S. DIST =F( x)= ∫ f 0 , 1 (t )dt
−∞ −∞
−1 −1
NORM . INV ( p , m, σ )=NORM . DIST ( p, m, σ , true )=F ( p);
NORM .S. INV ( p)=NORM . S. DIST −1 ( p)=F−1 ( p);
¿ s¿
CONFIDENCE. NORM (α , s ,n)=z α ⋅
1− √ n
2. 2

df +1
Γ ( 2 ) x 2 − df +1
f df ( x)=f ( x)=
df
√df⋅π⋅Γ ( )
( 1+ )
df
2

2
x
T . DIST ( x , df , true)=F df ( x)= ∫ f df (t )dt ; T . INV ( p , df )=T . DIST −1 ( p , df , true )=F−1
df ( p);
−∞

T . DIST . RT ( x,df )=1−T . DIST ( x, df , true )=1−F df ( x)=∫ f df (t )dt ;
x

T . DIST .2 T (x ,df )=2∗T . DIST . RT ( x ,df )=2
σ ( 1−F
−1 df ( x)
α =2⋅σ f (t )dt ;
CONFIDENCE . NORM ( α , σ , n )=z α⋅ =Φ 1− ) ⋅ ∫x df( )
1− √ n 2 √n
3. 2
p
T . INV . 2T ( p,df )=T . DIST .2T −1 ( p,df )=F df 1− ;
¿
2 ( )
¿ s
CONFIDENCE . T ( α , s ,n )=t α⋅
n−1,1− √ n
2
4. MWDIST ( x, m ,n , tails , Mw )  x=numerical value at which you want to evaluate the
Returns Mann-Whitney exact test distribution Mann_Whitney exact test distribution;
value  m=sample 1 size;
 n=sample 2 size;
 Mw=true - pentru Mann-Whitney version;
 Mw= false – pentru Wilcoxon Ranked Sum version;
MWINV ( p , m ,n , tails , Mw )  p=probability associated with the Mann_Whitney
Returns the inverse of Mann-Whitney exact exact test distribution
test distribution value  m=sample 1 size;
 n=sample 2 size;
 Mw=true - pentru Mann-Whitney version;
 Mw= false – pentru Wilcoxon Ranked Sum version;
MW EXACT (array 1 , array 2 ,Tails ) 
Returns p-value for Mann-Whitney test

MWTEST (array 1, array 2 , Tails, Ties ,Cont )  Ties= corectie ties;


Returns p-value for Mann-Whitney test using  Cont= corectie continuitate;
normal aproximation

S-ar putea să vă placă și