Sunteți pe pagina 1din 5

Coeficientul de corelaie Spearman

Charles Spearman (1863 1945) a fost un psiholog englez cunoscut n special pentru munca sa depus n domeniul statisticii.

Coeficienii de corelaie Sunt o msur a asocierii dintre dou variabile. Ei ne spun cum se modific valoarea unei variabile n funcie de valoarea altei variabile (dac cele dou variabile sunt asociate). Coeficienii de corelaie nu numai c ne spun dac exist o corelaie ntre cele dou variabile, ci i ct de strns este relaia dintre ele.

Cei mai utilizai coeficieni de corelaie sunt: -coeficientul de corelaie Pearson (notat cu rxy sau r), care este un coeficient parametric. -coeficientul Spearman (notat cu sau rs), care este un coeficient non- parametric (corelaie a ordinului).

Coeficientul de corelaie al ordinului (Spearman) Coeficientul Spearman () este utilizat frecvent, deoarece reprezint o alternativ a coeficientului Pearson. La fel ca multe alte teste statistice non-parametrice, calcularea lui /rs necesit ca datele s aib un ordin sau rang. Pentru nceput, datele din fiecare eantion primesc un ordin. n continuare se folosete relaia (1) pentru a calcula coeficientul de corelaie al ordinului (Spearman).

(1) Unde: N = Numrul de subieci; D2 = suma ptratelor diferenelor dintre ranguri.

Coeficientul de corelaie Spearman poate avea valori ntre 1 i +1. 1

Valorile negative apropiate de 1 ne indic o corelaie invers. Valorile foarte mici ale lui , apropiate de zero, nu sugereaz o asociere semnificativ.

Aceast corelaie ne intereseaz cnd condiiile privind parametrii statistici nu pot fi ndepli nite, fie din cauza neomogenitii grupului, fie a numrului prea mic de subieci (sub 20). n cazul unor rezultate egale se acord i ranguri egale acelor subieci. Pentru a putea fi folosit ns acest test, nu trebuie s existe un numr prea mare de ranguri egale, cel puin nu peste 25% din totalul rangurilor celor dou grupe. Mai mult, dac doi subieci sunt clasai pe locul patru, ei vor primi rangul 4,5 aflat ntre locurile 4 i 5. Urmtorul rang acordat va fi 6. Dac sunt trei subieci clasai la egalitate pe locul 2, atunci ei vor primi rangul 3, aflat la mijlocul dintre locurile 2, 3 i 4, iar urmtorul rang ce va fi acordat va fi rangul 5.

Limitele coeficientului Spearman Principalele limite ale coeficientului de corelaie al ordinului (coeficientul Spearman) sunt: - deoarece datele trebuie s fie ordonate, sunt necesare date ordinale sau scalate pe un interval, deci datele nominale nu pot fi folosite; - valoarea coeficientului Spearman este afectat dac exist un numr relativ mare de ordine legate n fiecare set de date; - dei coeficientul Spearman nu presupune o relaie liniar ntre cele 2 variabile, totui se presupune ca direcia relaiei se menine (cresctoare sau descresctoare). - coeficientul de corelaie al ordinului (Spearman) are doar 91% din puterea coeficientului de corelatie Pearson. Prin putere se nelege abilitatea testului de a respinge ipoteza nulului cnd aceasta este n realitate fals. Deci, pentru acelai set de date, dac presupunerile ce implic folosirea coeficientului Pearson nu sunt violate, atunci acesta ne va indica o informaie mai corect dect coeficientul Spearman.

Aplicaii ale coeficienilor de corelaie Calculul coeficienilor de corelaie este deosebit de util, n ntelegerea legturilor dintre variaiile diferiilor parametri care caracterizeaz o populaie dat. Din multitudinea de aplicaii prezentm doar cteva exemple: relaia dintre bioproductivitate i factorii legai de proprietile solului (umiditate, concentraia diferitilor nutrieni, temperatur, granulozitate, pH, etc); relaia dintre viteza de alunecare a unui ghear i rata eroziunii rocilor; relaia dintre rata eroziunii solului i viteza vntului sau duritatea solului. 2

Exemplul 1: Se dorete s se afle dac exist vreo asociere ntre rezultatele obinute la competiia naional de discursuri oratorice individuale i gradul de anxietate social al subiecilor. Rezultatele la competiia naional sunt exprimate direct n ranguri (locurile din clasamentul final), n timp ce nivelul de anxietate social a fost mai nti exprimat numeric n urma aplicrii unui test adecvat (rezultatele mari indicau o anxietate social puternic), rezultatele obinute fiind mai apoi convertite n ranguri. Au fost supui studiului 10 subieci.

S A B C D E F G H I J

Rang competiie 4 3 6 8 9 10 5 7 2 1

Rezultat anxietate 43 54 23 27 42 18 25 35 30 30

Rang anxietate 9 10 2 4 8 1 3 7 5,5 5,5

D (diferen ranguri) -5 -7 +4 +4 +1 +9 +2 0 -3,5 -4,5

D 25 49 16 16 1 81 4 0 12,25 20,25

D2=224,5

Unde: N = Numrul de subieci (n problema de fa, 10); D2 = suma ptratelor diferenelor dintre ranguri (n acest caz, 224,5)

n problema de fa obinem urmtorul rezultat :

Am obinut un = -0.36 la un N = 10. Dac consultm valoarea trecut n tabelul lui n dreptul liniei lui N grade de libertate (unde N este numrul de perechi de subieci), adic 10, observm ca valoarea obinut de noi este mai mic dect valorile trecute n tabel. Ca urmare putem spune c nu exist o corelaie semnificativ statistic ntre cele dou tipuri de variabile, deci nivelul de anxietate social nu influeneaz rezultatele la competiiile de dezbateri individuale.

Exemplul 2: Ne punem ntrebarea dac exist vreo corelaie ntre totalul precipitaiilor i debit. Variabilele care reprezint precipitaiile (n mm/m3) sunt notate cu x, iar variabilele care reprezint debitul (m3/s) sunt notate cu y. Pentru a calcula coeficientul Spearman trebuie determinate valorile N (mrimea eantioanelor) i D (diferena dintre ordinul fiecrei perechi de msurtori). Mrimea eantioanelor N se determin prin numrarea perechilor din cele 2 seturi de date (n cazul nostru N = 10).

Precipitaii (mm/m3) x 1,2 1,8 4,0 3,6 1,9 2,4 2,7 0,4 0,1 0,9 D2 = 14

Debit (m3/s) y 2,7 2,4 8,1 7,2 2,5 3,7 4,6 1,7 1,8 1,4

Ordinul lui x rx 4 5 10 9 6 7 8 2 1 3

Ordinul lui y ry 6 4 10 9 5 7 8 2 3 1

D rx-ry -2 1 0 0 1 0 0 0 -2 -2

D2

4 1 0 0 1 0 0 0 4 4

Introducnd valoarea pentru D2 i N n relaia (1), obinem:

Aceast valoare ne indic o relaie puternic i pozitiv ntre debit i precipitaii. Deci, dac debitul crete, crete i cantitatea de precipitaii.

Tabelul valorilor critice pentru coeficientul Spearman: Nivelul de semnificaie N 4 5 6 7 8 9 10 10% 1,000 0,900 0,771 0,714 0,643 0,600 0,564 5% 1,000 0,886 0,786 0,738 0,683 0,648 2% 1,000 0,943 0,892 0,810 0,783 0,733 1% 1,000 0,929 0,857 0,817 0,781

Bibliografie

1. http://statisticasociala.tripod.com/cor_nepar.htm 2. http://www.statstutor.ac.uk/resources/uploaded/spearmans.pdf 3. http://www.phys.ubbcluj.ro/~dana.maniu/Informatica%20mediului/Curs%207.pdf 4. http://en.wikipedia.org/wiki/Charles_Spearman.

S-ar putea să vă placă și