Sunteți pe pagina 1din 4

Coeficientul de corelaţie, indicator al corelaţiei folosit în cazul legăturii simple liniare,

evaluază atât sensul, cât şi intensitatea legăturii (liniare) dintre două variabile.

Semnul coeficientului indică direcţia legăturii, iar valoarea lui indică intensitatea legăturii.

cov( x, y ) s xy  ( xi  x)( yi  y )
rxy    i 1
sx s y sx  s y n 2 
n
2
 i ( x  x )   ( yi  y ) 
 i 1   i1 

n
 n  n 
n xi yi    xi   yi 
rxy  i 1  i1  i 1 
 n 2  n 2   n 2  n 2 
n xi    xi   n yi    yi  
 i1  i1    i1  i 1  

Valoarea coeficientului de corelaţie (rxy sau simplu, r) este situată în intervalul [-1, 1].

Valoarea rxy=1 indică o corelaţie liniară directă şi perfectă (funcţională), iar rxy=-1 indică o
corelaţie liniară inversă perfectă.
y y

+ ++ +++
+ + + ++ +
+ + +++
+ ++
+

x x
rxy=1 rxy=-1

1
O valoare zero arată (de obicei) lipsa legăturii între variabile. Totuşi, această interpretare
trebuie făcută cu precauţie, deoarece o legătură neliniară, valori extreme sau aberante pot
distorsiona interpretarea coeficientului de corelaţie
Diagrama de împrăştiere ne va ajuta, în plus, la interpretarea lui r
Legătură directă puternică. Punctele se situează (datorită abaterilor întâmplătoare) în jurul
unei linii înclinate în sus spre dreapta (figura 4.6 c))
Legătură inversă puternică. Punctele se situează (datorită abaterilor întâmplătoare) în jurul
unei linii înclinate în jos spre dreapta.
Coeficientul de corelaţie r Interpretare
r 1 Legătura liniară perfectă directă
r 1 Legătură directă puternică
r0 r0 Legătură directă slabă.
r0 Nu există legătură.
r0 r 0 Legătură inversă, slabă.

r  1 Legătură inversă puternică

r  1 Legătura liniară perfectă inversă

ASOCIEREA VARIABILELOR CALITATIVE ORDINALE

Variabilele social-economice măsurate pe o scală ordinală presupun acordarea unor


numere de ordine, numite ranguri, tuturor unităţilor, astfel încât unităţile să poată fi ordonate
în funcţie de criteriile studiate.
Rangurile sunt de la 1 (unitatea cea mai puţin performantă, ori cu valoarea cea mai
scăzută a variabilei), până la n (unitatea cea mai performantă) rangurile indică, aşadar,
poziţiile în serii ale unităţilor, după variabilele studiate.
Dacă mai multe unităţi statistice au aceeaşi variantă/valoare a unei variabile, atunci se
acordă media rangurilor succesive.
Coeficientul de corelaţie al rangurilor, introdus de Spearman, se bazează, de fapt, pe

analiza concordanţei rangurilor rxi , ryi acordate pentru fiecare din cele n unităţi statistice,

după variabila X şi după variabila Y. Notam cu d i  rx  ry diferenţele rangurilor perechi


i i

acordate aceleiaşi unităţi statistice.

2
n
6 d i2
rS  1  i 1
rS    1,1

n n2 1 ,

Interpretarea
Valori (în modul) apropiate de unitate indică o asociere puternică între variabile, iar
valori apropiate de zero indică o asociere slabă între variabile.

Dacă există o asociere directă perfectă, atunci fiecărui rang i, i = 1, n după variabila X  rx 

îi va corespunde acelaşi rang i, după variabila Y ry  şi diferenţa din rangurile acordate aceleiaşi
unităţi statistice va fi nulă:
di = rxi – ryi = 0.
Dacă asocierea nu este perfectă, rangurile nu sunt identice şi, atunci, di = rxi – ryi ≠ 0.
Coeficientul de corelaţie a rangurilor Spearman (rs) se determină (dedus din formula
coeficientului de corelaţie liniară):
6 d i2
rs  1  ,
n  n 2  1
unde di = rxi – ryi reprezintă diferenţa dintre rangurile perechi acordate aceleiaşi unităţi
statistice.
Coeficientul de corelaţie a rangurilor Spearman ia valori cuprinse în intervalul [-1, 1].
Valori (în modul) apropiate de unitate indică o asociere puternică între variabile, iar
valori apropiate de zero indică o asociere slabă între variabile. Acest indicator nu este, uzual,
folosit pentru studiul corelaţiei variabilelor numerice (măsurate pe scală cardinală sau de
raport), din cauza pierderii de informaţii la trecerea de la valori efective la ranguri. Cu toate
acestea, indicatorul poate fi folositor în cazurile specificate mai sus.
Coeficientul de corelaţie a rangurilor Kendall (rk), care se bazează, în fapt, tot pe
studiul concordanţei rangurilor, necesită ordonarea — crescător — a unităţilor după
rangurile acordate variabilei X şi înscrierea, în paralel, a rangurilor acor-date după variabila
Y. Atunci:

2S
rk  ,
n n  1

3
n
n(n  1)

i 1
i
2
n
2 n(n  1)(2n  1)
unde: S = P – Q, P = ∑pi, Q = ∑qi
pi = numărul rangurilor superioare fiecărui rang ryi, acordat după variabila Y, de la el în jos;
qi = numărul rangurilor inferioare fiecărui rang ryi, acordat după variabila Y, de la el în jos.
Acest indicator ia valori cuprinse în intervalul [-1, 1], iar interpretarea este similară cu
cea a coeficientului de corelaţie a rangurilor Spearman. Se poate observa că, dacă asocierea
este perfectă şi directă, atunci şi rangurile acordate după variabila Y sunt ordonate crescător
şi:
n 1
n n  1
p  i  , Q  0 , deci rk  1 .
i 1 2
n  n  1
Dacă asocierea este perfectă şi inversă, atunci P  0, Q  şi rk = –1. În general,
2
coeficientul rangurilor Kendall are o valoare mai mică decât coeficientul rangurilor

2
Spearman şi, pentru un număr mare de unităţi statistice (n) avem relaţia rk  rs .
3

S-ar putea să vă placă și