Sunteți pe pagina 1din 17

TESTE STATISTICE PENTRU DATE ORDINALE Lect.univ. dr. Gh.

Perea Testele statistice pentru date ordinale se utilizeaz n urmtoarele situaii:


a) Atunci cnd variabila dependent este exprimat pe scal de tip ordinal. n acest caz valorile nu au proprieti de interval, dar exprim poziia fiecreia n raport cu cealalt. b) Atunci cnd variabila dependent este msurat pe scal de interval/raport, dar distribuia ei nu respect condiiile impuse de testele parametrice. n aceast situaie se efectueaz transformare de rang, adic nlocuiete fiecare valoare a distribuiei cu poziia pe care o are n cadrul distribuiei, sub aspectul ordinii de mrime. Noua distribuie rezultat poate fi supus analizei statistice cu teste neparametrice ordinale.

Avnd n vedere modelele de cercetare la care ne-am raportat pn acum, vom regsi, pentru fiecare dintre ele, teste statistice pentru date ordinale, dup cum urmeaz:

Testul Mann-Whitney (U) pentru dou eantioane independente1 S lum n considerare urmtoarea problem: un psiholog care lucreaz ntr-o mare banc dorete s vad dac exist o diferen ntre premiile bneti anuale primite de femeile i brbaii angajai ai bncii. n tabelele de mai jos se afl nivelurile primelor i rangurile acestora n raport cu ntreaga distribuie a primelor, indiferent de sex. Problema este una tipic pentru a fi rezolvat cu testul t al diferenei dintre mediile a dou eantioane independente. Avem o variabil independent de tip nominaldihotomic i una dependent, de tip interval/raport. Din pcate, analiza preliminar a variabilei dependente (prim) relev abateri mari de la condiiile de normalitate (un indice de boltire, kurtosys, de peste 7) precum i o slab reprezentativitate a mediei, ambele datorate, mai ales, prezenei unei valori extreme (o prim de 200 mil. lei). Dup ce verificm corectitudinea valorii respective, ajungem la concluzia c ea nu poate fi eliminat i, ca urmare, nu este recomandabil utilizarea unui test parametric. ntr-o situaie de acest gen este aplicabil testul Mann-Whitney U pentru date ordinale. Pe ultima coloan a fiecrui tabel gsim transformarea n ranguri a valorilor variabilei dependente. Atribuirea rangurilor n mod descresctor sau cresctor este nerelevant. Dac toate valorile sunt distincte, fiecare valoare primete un rang distinct. Atunci cnd exist valori identice, valorile respective primesc un rang egal cu media aritmetic a rangurilor cuvenite. Se poate alege i soluia atribuirii tuturor valorilor identice primul rang cuvenit (ranguri ex aequo).

Desemnat uneori i sub numele Wilcoxon-Mann-Withney, sau testul U

Masculin2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 nA=17

Premiu (mil. lei) 9 34 35 43 56 61 62 64 67 67 70 75 80 87 88 110 200

Rang premiu 26 22 21 18.5 14 12 11 10 9 9 7 6 5 4 3 2 1 RA=180.5

Feminin 2 2 2 2 2 2 2 2 2 2 nB=10

Premiu (mil. lei) 3 17 26 32 36 43 44 47 51 59

Rang premiu 27 25 24 23 20 18.5 17 16 15 13 RB= 198.5

astfel: Procedura de calcul: Se calculeaz dou valori U, corespunztoare grupurilor A (masculin) i B (feminin),

respectiv,

unde:

nA i nB reprezint volumul celor dou grupuri independente care compun eantionul RA i RB reprezint suma rangurilor pentru fiecare din cele dou grupuri Vom observa c expresia din mijlocul formulei exprim chiar suma rangurilor de la 1 la nA, respectiv, de la 1 la nB. Dac, de exemplu, toate rangurile grupului A ar fi mai mici dect ale grupului B (fr nici o suprapunere ntre valorile celor dou grupuri), atunci acest termen al formulei ar fi egal cu RA, iar UA ar fi egal cu nA*nB. n acest caz UB ar fi egal cu 0, deoarece
2

Valoarea 1 este un cod numeric convenional asociat genului masculine, iar 2 un cod convenional pentru genul feminine. Utilizarea lor aici are doar scopul de a sugera c genul este variabila independent a cercetrii i primete dou valori. Atunci cnd se va utiliza un program statistic pentru calcularea testului, variabila independent va trebui s fie creat, cu valorile aferente, ca n acest exemplu.

UA+UB=nA*nB. Dac ns rangurile unui grup tind s se grupeze spre zona superioar (sau inferioar), atunci valoarea U a acelui grup va fi cu att mai mare (sau mai mic) dect nA*nB. Pe aceast particularitate se bazeaz evaluarea semnificaiei diferenei dintre rangurile celor dou grupuri. Pentru exemplu nostru:

respectiv,

Valoarea testului Mann-Whitney este dat de valoarea U cea mai mic, n cazul nostru UB (26.5). Decizia statistic se ia prin compararea valorii U celei mai mici cu valoarea citit n tabelul valorilor critice pentru testul Mann-Whitney U, n funcie de nivelul alfa, nA i nB (Anexa 7). Practic, n cazul testului U decizia statistic se ia astfel: Se respinge ipoteza de nul dac valoarea U calculat este mai mic sau egal cu valoarea critic tabelar. Se accept ipoteza de nul dac valoarea U calculat este mai mare dect valoarea critic tabelar. Logica acestei decizii pare s fie contrar raionamentului aplicat n cazul altor teste statistice, unde, pentru a respinge ipoteza de nul, trebuie s avem o valoare calculat mai mare dect cea critic. S ne gndim ns c n cazul testului MannWhitney considerm drept valoare calculat una dintre cele dintre dou valori U, i anume pe aceea care este mai mic. Ipoteza de nul afirm c cele dou sume ar trebui s fie egale, dac diferena dintre suma rangurilor celor dou eantioane comparate ar fi nesemnificativ. Cu ct una dintre valorile U calculate, este mai mic, cu att cealalt sum este mai mare. n consecin, o valoare U calculat mai mic sau egal cu U critic, justific respingerea ipotezei de nul. n general, tabelele de decizie pentru testul Mann-Whitney nu acoper dect parial situaiile posibile i nu trec de valori ale lui nA i nB mai mari de 20. Pentru exemplul nostru valoarea critic corespunztoare pentru U0.05;17:10=48 (dac preferm aproximarea, mai conservatoare, nA=18). Deoarece UB<U0.05;17:10 ipoteza de nul se respinge i se accept ipoteza cercetrii. Ca urmare, concluzia cercetrii este aceea c nivelul primelor anuale este semnificativ diferit pentru brbai fa de femei3. Afirmam mai sus c tabelele statistice pentru testul Mann-Whitney U nu se refer la grupuri mai mari de 20. Aceasta deoarece, de la acest volum n sus, distribuia valorilor testului poate fi aproximat de curba normal z, iar testul poate fi calculat cu formula urmtoare:
3

Desigur, nu se poate invoca neaprat o discriminare de sex n acordarea primelor dac poziiile profesionale ocupate de subiecii cercetrii sunt diferite. Rezultatul poate sugera, ns, c brbaii ocup poziii profesionale mai nalte dect femeile.

Valoarea lui z astfel obinut este comparat cu valorile critice tabelare de pe curba normal, corespunztoare nivelului alfa ales, unilateral sau bilateral. Publicarea rezultatului La publicarea rezultatului pentru testul Mann-Whitney U se vor indica: volumul grupurilor comparate (nA i nB) valoarea testului (U) pragul de semnificaie (p). EXERCIII Un cercettor dorete s verifice dac bieii crescui de ctre mame singure manifest un nivel mai ridicat al trsturii feminitate dect bieii crescui n familii biparentale. Primul grup (A) cuprinde 10 subieci, al doilea, (B) este format din 8 subieci. Evaluarea feminitii s-a fcut pe baza unui chestionar specializat, cotat cu un scor numeric. Numrul subiecilor nu permite aplicarea unui test t pentru eantioane independente, motiv pentru care se decide utilizarea testului Mann-Whitney (U). Datele cercetrii: (valorile exprim scorul la trstura "feminitate") Proveniena A A A A A A A A A A B B B B B B B B Scor feminitate 14 12 15 9 10 13 15 11 14 12 10 7 12 8 6 4 3 5 Care este valoarea testului Mann-Whitney (U)? Care este decizia statistic i ce concluzie trage cercettorul?

Testul Kruskal-Wallis pentru mai mult de dou eantioane independente Pentru evaluarea diferenei la nivel de ranguri ntre mai mult de dou eantioane independente se utilizeaz testul Kruskal-Wallis. Acesta poate fi asimilat unei analize de varian pentru date ordinale. S presupunem c dorim s vedem dac exist diferene n abilitatea de a rezolva o sarcin de reprezentare spaial la trei categorii profesionale aeronautice, piloi (grup 1), controlori de trafic aerian (grup 2) i navigatori de bord (grup 3). n acest scop a fost aplicat un test de reprezentare spaial unui numr de ase piloi, trei controlori de trafic i patru navigatori de bord. Rezultatul este unul numeric (scorul la test), dar, dat fiind numrul foarte mic al subiecilor, aplicarea testului ANOVA este nepotrivit. Ca urmare, alegem soluia conversiei rezultatelor n valori de rang (pentru toate grupurile luate mpreun) i utilizm un test pentru date ordinale. Datele pentru acest exemplu sunt prezentate n tabelul urmtor: Scor reprez. Grup profesion rang spaial al 1 23 2 1 16 6 1 15 7 1 10 11 1 9 12 1 21 3 2 18 5 2 14 8 2 11 10 3 25 1 3 19 4 3 13 9 3 7 13 Tabelul prezint datele cercetrii. Variabila grup este una de tip nominal, fiecare din cele trei grupuri fiind codificat cu o valoare convenional (1=pilot, 2=controlor de trafic, 3=navigator de bord). Variabila scor reprez.spaial, este de tip numeric i reprezint scorul la test. Variabila rang conine poziia a fiecrui subiect sub aspectul reprezentrii spaiale, n raport cu toate valorile nregistrate. Formula de calcul pentru testul Kruskal-Wallis (notat cu H) este urmtoarea:

unde:

H este valoarea calculat a testului K-W N este volumul total al eantionului n este volumul grupurilor (N=n1+n2+n3+...+nk) K este numrul grupurilor independente T este suma rangurilor care va fi calculat pentru fiecare grup

nlocuind valorile corespunztoare exemplului, obinem:

Valorile distribuiei de nul ale lui H urmeaz forma distribuiei chi-ptrat care, ne amintim, are originea n valoarea 0. Cu ct sumele rangurilor pentru cele k grupuri sunt mai diferite ntre ele, cu att valoarea testului este mai mare i, potenial, mai aproape de o variaie semnificativ. Diferenele mici dintre rangurile grupurilor conduc spre valori ale testului care tind spre 0 i, implicit, nesemnificative. Valoarea critic a testului se citete din tabelul distribuiei chi-ptrat pentru df=k-1. Exist totui o excepie, atunci cnd nici unul din grupurile comparate nu este mai mare de 6, situaie n care decizia se ia cu ajutorul unei tabele speciale. n cazul nostru exist un grup cu mai mult de cinci subieci. Ca urmare, scorul critic pentru alfa=0.05 i 2 grade de libertate este 5.99. Deoarece H calculat este mai mic dect H critic, suntem nevoii s acceptm ipoteza de nul i s concluzionm c cele trei categorii de subieci nu sunt diferite sub aspectul capacitii de reprezentare spaial. EXERCIII Avnd n vedere faptul c volumul foarte redus al eantionului (N=6), analizai prin intermediul testului Kruskal-Wallis datele temei pe care ai avut-o la testul ANOVA. Un psiholog trebuie s recomande unui patiser culoarea glazurii pentru un nou tip de prjitur, avnd de ales ntre verde, rou i galben. n acest scop alege 18 subieci, crora le cere s efectueze o sarcin plictisitoare avnd la ndemn platouri cu prjituri glazurate. Subiecii sunt mprii n trei grupe, fiecare primind prjituri de o singur culoare. Dup un timp, numr cte prjituri a mncat fiecare subiect din cele trei grupuri i construiete tabelul urmtor. Verde 3 7 1 0 9 2 Rou 3 4 5 6 4 6 Galben 2 0 4 6 4 1

Care este valoarea testului i ce decizie ia cercettorul?

Testul Wilcoxon pentru dou eantioane perechi Dac avem subieci evaluai de dou ori, pe o scal de interval, iar variabilele nu ntrunesc condiiile pentru utilizarea testului t al diferenelor pentru eantioane dependente, se poate apela la testul Wilcoxon. Acesta este un test care, dei se aplic pe scale de interval/raport, utilizeaz proceduri de tip neparametric, apelnd la diferenele dintre valorile perechi i la ordonarea lor. Este, din acest punct de vedere, un test de date ordinale. Exemplu Un psiholog evalueaz frecvena conduitelor agresive dup prezentarea unui film care are inclui stimuli subliminali cu semnificaie agresiv. Frecvena conduitelor agresive este msurat nainte i dup vizionarea filmului. Rezultatele sunt sintetizate n tabelul urmtor. Cod nainte Dup Subiect 1 9 8 2 14 17 3 10 17 4 11 12 5 12 15 6 9 13 7 10 14 8 14 2 dup-nainte -1 3 7 1 3 4 4 -12 Modulul diferenei 1 3 7 1 3 4 4 12 Rangul diferenei 7.5 5.5 2.0 7.5 5.5 3.5 3.5 1.0 Semnul Diferenei + + + + + + -

Coloanele tabelului prezint etapele procedurii de calcul: se calculeaz diferena dintre variabilele supuse testrii dac sunt diferene nule, se elimin se iau n considerare diferenele n valoare absolut se construiesc rangurile pentru diferenele n valoare absolut se marcheaz semnul diferenelor pentru fiecare pereche de valori Din acest punct calcularea valorilor testului este simpl. Se calculeaz dou valori T, astfel: T(-), prin nsumarea rangurilor diferenelor negative, i T(+), prin nsumarea rangurilor diferenelor pozitive. Valoarea cea mai mic dintre ele este rezultatul testului Wilcoxon, al crui nivel de semnificaie se afl prin compararea cu valorile critice dintr-o tabel special (Anexa 8), n funcie de nivelul alfa ales i de volumul eantionului (N). Testul se fundamenteaz pe ideea c atunci cnd ipoteza nul este adevrat, ar trebui ca suma rangurilor pentru diferenele pozitive s fie egal cu suma rangurilor pentru diferenele negative. Pe msur ce diferena dintre cele dou sume este mai mare, ne ndeprtm de condiia ipotezei de nul. Decizia statistic pentru acest test se ia n felul urmtor: atunci cnd valoarea calculat este mai mic sau egal dect valoarea critic tabelar, ipoteza de nul se respinge, iar ipoteza cercetrii se confirm; atunci cnd valoarea calculat este mai mare dect valoarea critic tabelar, ipoteza de nul se accept, iar ipoteza cercetrii nu se confirm. Logica acestei decizii este similar celei aplicate n cazul testului MannWhitney. Valoarea calculat a testului este valoarea T cea mai mic, fie cea pozitiv, fie cea negativ. Ipoteza de nul afirm c cele dou sume ar trebui s fie egale, dac diferena dintre prima i a doua msurare ar fi nesemnificativ. Cu ct una dintre valorile T calculate, fie cea cu plus, fie cea

cu minus, este mai mic, cu att cealalt sum este mai mare. n consecin, un T calculat mai mic sau egal cu T critic justific respingerea ipotezei de nul. Pentru exemplul nostru, T(+)=28.5 iar T(-)=8.5. Acesta din urm devine rezultatul testului. Valoarea calculat (8.5) este mai mare dect valoarea critic (4) pentru N=8 i alfa=0.5 bilateral. Ca urmare, suntem nevoii s acceptm ipoteza de nul, considernd neconfirmat ipoteza cercetrii. Concluzia cercetrii, pentru exemplul dat, este aceea c datele studiului nu confirm existena unei relaii ntre prezena stimulilor subliminali i frecvena conduitelor agresive, dup vizionarea filmului. Aproximarea normal a distribuiei testului Mann-Whitney Ca i n cazul testului Mann-Whitney, pentru eantioane mai mari de 20 distribuia de nul a testului Wilcoxon poate fi aproximat prin distribuia normal. Formula de calcul pentru acest caz este urmtoarea:

Exceptnd situaiile n care se opereaz pe eantioane mici, ca n exemplul de mai sus, calculele sunt destul de laborioase. Din fericire, toate programele avansate de statistic ofer proceduri pentru calcularea automat a acestor teste statistice. Consideraii finale Atunci cnd rezultatul testului este semnificativ, enunarea concluziei i interpretarea rezultatului vor ine cont de modul de atribuire a rangurilor, cu alte cuvinte, dac rangul 1 a fost atribuit valorii celei mai mari, sau celei mai mici. O problem apare atunci cnd exist diferene egale cu zero ntre rangurile perechi (valori de rang egal). Unii statisticieni recomand eliminarea cazurilor care dau diferene egale cu zero i, implicit, reducerea volumului eantionului cu aceste cazuri. O abordare mai riguroas este aceea de a pstra valorile zero, dar atribuind arbitrar semnul + la jumtate dintre ele i semnul la cealalt jumtate. n situaia n care exist un numr impar de diferene egale cu zero ntre rangurile celor dou evaluri, se va elimina una dintre ele (reducnd N cu 1), dup care se aplic regula enunat anterior.

EXERCIII Avnd n vedere numrul mic al subiecilor cercetrii din tema pentru acas de la testul t pentru eantioane dependente, refacei calculele utiliznd testul Wilcoxon: Ne propunem s scoatem n eviden efectul stresului temporal (criza de timp) asupra performanei de operare numeric. n acest scop, selectm un eantion de subieci crora le cerem s efectueze un test de calcule aritmetice n dou condiii experimentale diferite: prima, n condiii de timp nelimitat, cu recomandarea de a lucra ct mai corect; a doua, n condiii de timp limitat, cu condiia de a lucra ct mai repede i mai corect n acelai timp. Rezultatele celor dou reprize sunt cele din tabelul alturat. S se rezolve urmtoarele sarcini:

Fr criz de timp 67 79 83 80 99 95 80 100

Cu criz de timp 65 73 70 85 93 88 72 69

Care sunt valoarea testului, decizia statistic i concluzia cercetrii n acest caz? Testul Friedman pentru msurri repetate S presupunem c un psiholog dorete s studieze relaia dintre stilurile de conducere (laissez-faire, democratic i autoritar) asupra nivelului de satisfacie profesional. n acest scop el poate constitui un grup de cercetare pe care s l supun, n momente succesive, celor trei tipuri de conducere. Un alt model ar putea fi constituirea a trei eantioane perechi, astfel constituite nct fiecrui subiect dintr-un eantion s i corespund cte un subiect echivalent din fiecare dintre celelalte dou eantioane (criteriile de echivalen pot fi: sexul, vrsta, nivelul de inteligen, gardul de motivare, etc.). Dar, oricare dintre variantele pe care l-ar alege cercettorul, din punct de vedere statistic el ar obine o structur de date identic: trei serii de evaluri ale satisfaciei (variabila dependent), pentru aceiai subieci (sau perechi de subieci) corespunztoare celor trei stiluri de conducere. Dac variabila dependent ar fi msurat pe o scal de interval/raport, testul parametric adecvat este unul pe care nu l-am tratat pn acum, ANOVA pentru msurri repetate. n lipsa lui, i presupunnd c variabila dependent nu ntrunete condiiile unui test parametric, soluia problemei este testul Friedman pentru date ordinale. Pentru aplicarea lui este suficient ca valorile variabilei dependente s fie ordonate dup rang, ca n tabelul alturat. Facem precizarea c, n acest caz, ordonarea dup rang se face la nivelul fiecrui set de evaluri perechi: 1 2 3 4 5 6 N=6 Democratic Laissez-faire 1 2 2 1 1 2 1 2 1 2 2 1 T1=8 T2=10 Autocratic 3 3 3 3 3 3 T3=18

Testul Friedman (Fr) pune n eviden n ce msur rangurile evalurilor repetate difer cu adevrat (statistic semnificativ) unele de altele, dup formula:

unde:

c este numrul msurrilor repetate N este volumul seturilor de evaluri perechi Ti este suma rangurilor corespunztoare fiecrui moment de msurare

La fel ca i n cazul testului H (Kruskal-Wallis), distribuia de nul a testului Friedman urmeaz forma distribuiei chi-ptrat pentru df=c-1. Introducem valorile cercetrii n formul:

Valoarea critic tabelar (chi-ptrat) pentru df=3-1=2, este 5.99. Valoarea calculat fiind mai mare, se respinge ipoteza de nul i se consider confirmat ipoteza cercetrii: nivelul satisfaciei profesionale variaz semnificativ n funcie de stilul de conducere. Testul Friedman poate fi aplicat i n cazul a doar dou msurri, situaie n care devine similar testului semnului. La fel ca i celelalte teste pentru date ordinale, el este afectat de existena rangurilor atribuite ex-aequo, pentru valori identice. n astfel de cazuri este recomandabil aplicarea unei corecii n formula de calcul, pe care nu o vom prezenta aici, n sperana c utilizarea programelor specializate va face, oricum, coreciile necesare. EXERCIII Un neurofiziolog dorete s verifice dac exist o relaie ntre leziunea cerebral stng i tipul de deficit de memorie de scurt durat, n trei tipuri de sarcin diferite: cifre, litere, litere i cifre amestecate. Un numr de cinci subieci cu leziune cerebral stng au efectuat teste de memorie distincte, pe iruri de cifre, litere i combinaii de cifre i litere. Performana nregistrat marcheaz irul cel mai lung memorat pentru fiecare test n parte. Datele cercetrii: (valorile semnific lungimea irului memorat) Litere Cifre/Litere 5 6 7 5 7 4 5 8 4 7 6 5

Subiectul A B C D E F

Cifre 6 8 7 8 6 7

Care este valoarea testului Friedman? Care este decizia statistic i ce concluzie trage cercettorul?

Coeficientul de corelaie pentru date ordinale (Spearman) Testele Wilcoxon i Friedman sunt utilizate pentru a pune n eviden diferenele dintre dou sau mai multe eantioane perechi (situaie care, de regul, se refer la msurri repetate pe aceiai subieci). Atunci cnd avem dou variabile ordinale i suntem interesai n evaluarea gradului de asociere ntre ele, vom utiliza un test similar coeficientului de corelaie pentru date de interval care este coeficientul de corelaie a rangurilor (Spearman). Aa cum ne amintim, coeficientul de corelaie Pearson (r) ne d msura intensitii legturii dintre dou variabile exprimate pe scale de tip interval/raport. Mecanismul de calcul se bazeaz pe transformarea valorilor ambelor variabile n scoruri z, adic pe convertirea acestora n distan standard fa de medie. Pentru datele de tip ordinal, modalitatea de calcul a coeficientului de corelaie se bazeaz pe poziia relativ a unei valori fa de celelalte. Coeficientul de corelaie a rangurilor Spearman (rS) are acelai domeniu de variaie (-1/+1) i se interpreteaz n acelai mod ca i coeficientul de corelaie pentru date parametrice Pearson. Exemplu: Problema cercetrii. ntr-un studiu cu privire la ameliorarea sistemului de evaluare a personalului, doi instructori urmeaz un program special de armonizare a evalurii. La sfritul programului ei sunt pui s ierarhizeze personalul unui compartiment de munc (N=10) din punctul de vedere al performanei profesionale. Ipoteza cercetrii. (pentru test bilateral) Evalurile celor doi instructori vor fi concordante. Ipoteza de nul. ntre evalurile celor doi instructori nu exist nici o legtur Criteriile deciziei statistice: alfa= 0.05 rS critic se citete ntr-un tabel special pentru coeficientul Spearman (Anexa 9). Valoarea se citete la intersecia dintre linia corespunztoare lui N (n acest caz nu se folosesc gradele de libertate) cu coloana corespunztoare tipului de test (unilateral, bilateral) i a nivelului . nregistrm rS critic =0.648 Datele cercetrii: RANG Diferena (D) Angajai RANG Instructor Instructor (R1-R2) I II A 3 2 1 B 1 3 -2 C 7 5 2 D 6 4 2 E 10 10 0 F 5 8 -3 G 9 7 2 H 8 9 -1 I 4 6 -2 J 2 1 1

D2 1 4 4 4 0 9 4 1 4 1 2 2D =32

Formula de calcul pentru coeficientul de corelaie a rangurilor Spearman este:

n care, prin nlocuirea cu valorile cercetrii, obinem:

Decizia statistic: rS calculat (0.81) rS critic (0.684). Ipoteza de nul se respinge. Concluzia cercetrii: Evalurile celor doi instructori sunt semnificativ concordante. Programul de instruire a avut efectul scontat. Interpretarea coeficientului de corelaie Spearman n principiu, acesta se interpreteaz la fel ca i coeficientul Pearson. rS = 0 0 > rS > 1 rS = 1.0 -1 > rS > 0 rS = -1.0 Cele dou variabile nu variaz concomitent, deloc Cele dou variabile tind s creasc sau s scad concomitent, ntr-o anumit msur Corelaie pozitiv perfect n timp ce o variabil tinde s creasc, cealalt tinde s descreasc Corelaie negativ perfect

Dac probabilitatea aferent valorii calculate a testului este mai mare dect 0.05, coeficientul de corelaie va fi considerat nesemnificativ (are anse prea mari s rezulte din ntmplare). Aceasta nu nseamn c nu exist o corelaie ntre cele dou variabile, ci doar c datele noastre nu au putut s o pun n eviden. Calcularea coeficientului de determinare (rS2) n cazul corelaiei Spearman nu este uzual, dei exist autori care o accept. Cnd se utilizeaz coeficientul de corelaie Spearman:

Atunci cnd ambele variabile sunt de tip ordinal Atunci cnd una dintre variabile este de tip ordinal i cealalt este de tip interval/raport. n acest caz, variabila interval/raport se transform mai nti n valori de ordine de rang Atunci cnd ambele variabile sunt de tip interval/raport dar una sau ambele, prezint valori extreme. n acest caz, prin transformarea n ordine de rang a celor dou distribuii, valorile extreme sunt anihilate, ele urmnd s participe la corelaie prin simpla poziie n distribuie i nu prin nivelul lor absolut.

Formula 5.7 nu este considerat adecvat pentru situaiile n care variabilele supuse corelaiei prezint multe ranguri ex-aequo. De aceea, un test alternativ pentru asocierea variabilelor ordinale este coeficientul de corelaie a rangurilor Kendall tau. La fel ca i coeficientul Spearman, Kendal tau ia valori ntre -1 i +1. Similaritile se opresc ns aici, deoarece coeficientul Kendall se calculeaz pe o cale diferit i se fundamenteaz pe o estimare a parametrului populaiei. Aceasta estimare se calculeaz ca probabilitatea concordanei minus probabilitatea discordanei dintre

rangurile perechi. Nu vom analiza n amnunt procedura de calcul, dar vom prezenta modul de obinere a coeficientului Kendall cu ajutorul programului SPSS n seciunea urmtoare. Ambii coeficieni sunt larg utilizai n studiile statistice, fcnd, n acelai timp, i obiectul unor dispute ntre statisticieni. Adesea, coeficientul Kendall este considerat mai adecvat datorit faptului c distribuia acestuia se apropie de forma normal ncepnd de la volume mai mici ale eantioanelor. Chiar dac, n calcule, pe aceleai date, cu cei doi coeficieni se obin valori uor diferite, decizia statistic nu este, de obicei, diferit. EXERCIII ntr-o coal de pilotaj a fost organizat un curs de optimizare a evalurii elevilor de ctre instructori, cu scopul de a se uniformiza criteriile de evaluare. Dup terminarea cursului, doi instructori sunt pui s efectueze, fiecare, un numr de ore de zbor cu aceiai 10 elevi, dup care li se cere s fac o ierarhie a lor. Datele cercetrii: (valorile din tabel exprim poziia de rang atribuit de instructori fiecrui elev) Elev A B C D E F G H I J Instructor 1 3 1 7 6 10 5 9 8 4 2 Instructor 2 3 2 6 7 10 4 8 9 5 1

Care este valoarea corelaiei dintre evalurile celor doi instructori? Care este decizia statistic i concluzia cercetrii n acest caz?

ANEXE Anexa 7. Tabelul valorilor critice pentru testul Mann-Whitney U nA/nB 3 5 6 8 10 12 14 16 18 0.05 0 1 2 3 4 5 6 7 0.01 0 1 1 2 2 4 0.05 1 2 4 5 7 9 11 12 0.01 0 1 2 3 4 5 6 5 0.05 2 3 6 8 11 13 15 18 0.01 0 1 2 4 6 7 9 11 6 0.05 3 5 8 11 14 17 21 24 0.01 1 2 4 6 9 11 13 16 8 0.05 6 8 13 17 22 26 31 36 0.01 2 4 7 11 15 18 22 26 10 0.05 8 11 17 23 29 36 42 48 0.01 4 6 11 16 21 26 31 37 12 0.05 11 14 22 29 37 45 53 61 0.01 6 9 15 21 27 34 41 47 14 0.05 13 17 26 36 45 55 64 74 0.01 7 11 18 26 34 42 50 58 16 0.05 15 21 31 42 53 64 75 86 0.01 9 13 22 31 41 50 60 70 18 0.05 18 24 36 48 61 74 86 99 0.01 11 16 26 37 47 58 70 81 20 0.05 20 27 41 55 69 83 98 112 0.01 13 18 30 42 54 67 79 92 (sursa: Clocotici V., Stan A., 2000, Statistic aplicat n psihologie, Polirom) 20 8 3 14 8 20 13 27 18 41 30 55 42 69 54 83 67 98 79 112 92 127 105

14

Anexa 8. Valorile critice pentru testul Wilcoxon Nivel de semnificaie pentru test unilateral 0.025 0,01 0.005 Nivel de semnificaie pentru test bilateral 0.05 0.02 0.01 6 0 7 2 0 8 4 2 0 9 6 3 2 10 8 5 3 11 11 7 5 12 14 10 7 13 17 13 10 14 21 16 13 15 25 20 16 16 30 24 20 17 35 28 23 18 40 33 28 19 46 38 32 20 52 43 38 21 59 49 43 22 66 56 49 23 73 62 55 24 81 69 61 25 89 77 68 (sursa : Clocotici V., Stan A., 2000, Statistic aplicat n psihologie, Polirom) N

15

Anexa 9. Valorile critice pentru testul de corelaie a rangurilor (Spearman) test unilateral alfa=0.05 alfa=0.025 alfa= 0,01 test bilateral alfa=0.10 alfa=0.05 alfa=0.02 0,900 0,829 0,886 0,943 0,714 0,786 0,893 0,643 0,738 0,833 0,600 0,683 0,783 0,564 0,648 0,745 0,523 0,623 0,736 0,497 0,591 0,703 0,475 0,566 0,673 0,457 0,545 0,646 0,441 0,525 0,623 0,425 0,507 0,601 0,412 0,490 0,582 0,399 0,476 0,564 0,388 0,462 0,549 0,377 0,450 0,534 0,368 0,438 0,521 0,359 0,428 0,508 0,351 0,418 0,496 0,343 0,409 0,485 0,336 0,400 0,475 0,329 0,392 0,465 0,323 0,385 0,456 0,317 0,377 0,448 0,311 0,370 0,440 0,305 0,364 0,432 alfa=0.005 alfa=0.01 0,881 0,833 0,794 0,818 0,780 0,745 0,716 0,689 0,666 0,645 0,625 0,608 0,591 0,576 0,562 0,549 0,537 0,526 0,515 0,505 0,496 0,487 0,478

N 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

(sursa: http://www.netnam.vn/unescocourse/index.htm)

16