Sunteți pe pagina 1din 17

Testarea diferenei la nivel de set de date (II)

Testul Wilcoxen perechilor legate

sau

testul

Este un test oarecum deosebit fiind caracteristic pentru situaii specifice. Se aplic doar datelor intervale. Constituie o metod statistic util n testarea diferenelor la nivel de serii de date Elemente necesare: Obligatoriu numai date intervale. Cel puin 6 perechi de date.

ntre date trebuie s existe o anume legtur, tendin sau s formeze un anume tip de pereche. Adic? ntre seriile de date sau ntre datele aceleiai variabile trebuie s existe, cel puin aparent, un anume gen de relaie, legtur.

EX 1: Vizitatori europeni n Romnia n anii 1999 i 2000


1999 63,000 18,000 9,000 2000 66,000 19,000 10,000

Austria Belgium Denmark

n acest caz relaia este stabilit de cei 2 ani, caz n care dac pentru o ar numrul de vizitatori a fost redus n 1999 este probabil s fie redus i n 2000. Ex 2 Gradul de ocupare al hotelurile de pe litoralul romnesc al Mrii Negre (%) 2000 25 30 50 2001 20 29 48

Jan Feb March

Dac gradul de ocupare a fost redus n Ianuarie al unui an este foarte probabil s fie redus i n alt an relaia aparent dintre seturile de date, suficient pentru a forma perechi.

Dac a) ntre date nu exist o relaie aparent prin prisma creia ele s poat forma perechi dintr-un anumit PDV sau de un anume tip sau b) Datele sunt nominale sau ordinale

Testul Wilcoxen nu se poate aplica i se apeleaz n schimb la testul Mann-Whitney sau U

Mod de calcul

Studiu de caz: serii de date privind gradul de ocupare (%) al hotelurilor din Bile Herculane i Drobeta Turnu Severin n perioada 1991-2000 Herculane Turnu Severin 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 36 31 38 41 43 35 29 37 41 45 45 30 24 38 32 32 54 49 44 43

Exist relaie aparent ntre datele de aici?

Stadiul 1:
Se formuleaz ipoteza nul (Ho) asupra seriilor de date. ( Atenie!!! Ho ntotdeauna exprim negativul/inversul ipotezei iniiale Hi ) : Ex. Nu exist nici o diferen n gradul de ocupare al hotelurilor din Bile Herculane i Drobeta Turnu Severin n perioada 1991-2000

Stadiul 2:
Construii un tabel cu 6 coloane. n coloanele 1 i respectiv 2 introducei seriile de date (denumite pentru convenien variabile: A=Bile

Herculane i respectiv B=Drobeta Turnu Severin)

A B (Turnu (Herculane) 36 31 38 41 43 35 29 37 41 45 45 30 24 38 32 32 54 49 44 43

Severin)

Stadiul 3
Calculai difeterna dintre A i B (AB). Rezultatul obinut amplasai-l n coloana 3 ignornd semnul (+;-)

A 36 31 38 41 43 35 29 37 41 45

B 45 30 24 38 32 32 54 49 44 43

A - B 9 1 14 3 11 3 25 12 3 2

Stadiul 4

Dac n coloana A-B avem valori egale cu 0, acestea se exclud din analiz (se exclud perechile cu totul, utilizndu-se restul perechilor). Atenie: n acest caz se reduce numrul de perechi luat n calcul! n studiul de caz nu exist astfel de situaii, calculul continundu-se fr alte modificri de condiii.

Stadiul 5
Acordai rang de importan valorilor din coloana A-B pornindu-se de la valoarea

cea mai mic creia i se

atribuie rangul 1. Acetia se nscriu n coloana 4. n cazul procedeaz valorilor identice se

la calcularea mediei rangilor valorilor variabile identice ca valoare indiferent de numrul acestora.
A B A - B Rang de A-B 6 1 9 4 7 4 10 8 4 2
10

36 31 38 41 43 35 29 37 41 45

45 30 24 38 32 32 54 49 44 43

9 1 14 3 11 3 25 12 3 2

Stadiul 6
Comparai pe rnd valorile perechile variabilelor A i B din

Unde valoarea lui A este mai mare dect a lui B nscriei rangul atribuit diferenei A-B n coloana 5. Unde valoarea lui B este mai mare dect a lui A nscriei rangul atribuit diferenei A-B n coloana 6. A B A - B Rang A>B de A-B 9 1 14 3 6 1 9 4 B>A

36 31 38 41

45 30 24 38

6 1 9 4
11

43 35 29 37 41 45

32 32 54 49 44 43

11 3 25 12 3 2

7 4 10 8 4 2

7 4 10 8 4 2

Stadiul 7
Calculai suma rangilor pe fiecare coloan n parte (A>B i B>A din coloanele 5 i 6) A B A - B Rank A>B of AB 9 6 B>A

36

45

6
12

31 38 41 43 35 29 37 41 45

30 24 38 32 32 54 49 44 43

1 14 3 11 3 25 12 3 2

1 9 4 7 4 10 8 4 2

1 9 4 7 4 10 8 4 2

Suma din coloana A>B (5) = 27 SUMA DIN COLOANA B>A (6)= 28

Stadiul 8
Selectaivaloarea cea mai mic dintre cele 2 sume i notai-o cu T T = 27

13

Stadiul 9
Decidei cu ce grad de confiden dorii s lucrai (95% sau 99%) pentru semnificaia rezulatului. Continuai facnd apel la tebelele consacrate, ale valorilor critice pentru testul Wilcoxen. n cazul n care a-i redus numrul de perechi n timpul calcului nu uitai s-l reducei i la interpretare.
Nr perechi A i B P=0.05 6 7 8 9 10 11 12 13 14 15 0 2 4 6 8 11 14 17 21 25 P=0.01 0 2 3 5 7 10 13 16
14

16 17 18 19 20

30 35 40 46 52

20 23 28 32 38

Dac valoarea obinut pentru T este mai mic dect valoarea critic (pentru numrul corect de perechi i la gradul de confiden ales) se respinge ipoteza nul. n orice alt situaie aceasta se accept. Conform studiului de caz T = 27, valoare critic = 8 (95%) sau 3 (99%): IPOTEZA NUL SE ACCEPT

StaDIUL 9
Interpretarea rezultatului obinut:

15

nstudiul de caz de mai sus s-a demonstrat statistic faptul c nu exist nici o diferen, RELAIE n gradul de ocupare al hotelurilor din Bile Herculane i Drobeta Turnu Severin n perioada .... (n ciuda faptului c aparent exista o diferen valoric). De ce?

Stadiul 10
Analiza final: i exprimarea rezultatului

Dac ar fi existat o diferen (relaie) semnificativ analiza ar fi fost exprimat ncepndu-se cu formularea:

16

Exist o diferen (relaie) semnificativ ntre gradul de ocupare din Bile Herculane i Drobeta Turnu Severin; T = 2, p = 0.01. Aceasta se datoreaz......

17

S-ar putea să vă placă și