Sunteți pe pagina 1din 6

Descrierea statistică a seriilor bivariate

(Analiza de regresie și corelație)


Clasificarea metodelor statistice de analiză a legăturilor

Metodele statistice
cele mai utilizate în analiza legăturilor

a. Metoda grafică
Fenomenul se reprezintă cu ajutorul diagramei norului de puncte, denumită şi corelogramă, astfel:
Interpretarea se realizează după cum sunt repartizate punctele pe grafic:
 dacă punctele se plasează pe direcţia primei bisectoare, atunci legătura dintre cele două variabile
este directă
 plasarea punctelor pe direcţia celei de-a doua bisetoare, prezintă o legătură inversă
 cu cât punctele sunt mai concentrate în apropierea primei sau celei de-a doua bisectoare, cu atât
legătura estemai intensă
 dacă repartizarea punctelor se face pe direcţia unei drepte, atunci forma legăturii este liniare, în
caz contrar se vorbeşte despre o legătură neliniară (parabolică, exponenţială etc)

1
b. Metoda parametrică a regresiei liniare unifactoriale
Funcţia de regresie liniară unifactorială are forma dată prin relaţia:
yˆ i  b0  b1 xi
din care se observă că variabila rezultativă ŷi depine de o singură variabilă factorială xi .
Parametrii b0 şi b1 sunt estimatori ai punctului de intercepţie  , respectiv ai pantei liniei de regresie
 (funcţia de regresie la nivelul colectivităţii generale fiind: Yi   0  1 xi   i ).
În general practica a demonstrat că metoda cea mai fidelă şi utilizată pentru estimarea parametrilor
este metoda celor mai mici pătrate.
n n
min 
i 1
( y i  yˆ i ) 2 = min (y
i 1
i  a  bxi ) 2 , care conduce la sistemul de ecuaţii normale:

 n n

 na  b 
i 1
x i  
i 1
yi
 n n n
a  xi  b xi2   xi yi
 i 1 i 1 i 1

Estimatorul b0 :
- este denumit termen liber (intercept);
- are caracter de mărime medie – indică valoarea variabilei rezultative y când toţi factorii
neesenţiali au o acţiune constantă (este nivelul mediu al variabilei y determinată prin influenţa celorlalţi
factori, în afara lui xi ).

- în reprezentarea grafică, indică punctul de întâlnire dintre axa OY şi panta dreptei de regresie.
- valoarea pozitivă ( b0  0 ) sau negativă ( b0  0 ) nu are nici o relevanţă în modelul regresiei.

 Estimatorul b1 :
- se numeşte şi coeficient de regresie;
- arată:
 gradul de influenţă a variabilităţii factoriale x asupra rezultativei y (cu cât variază în medie y în
condiţiile modificării cu o unitate a factorului x ).
 direcţia legăturii:
 b1  0 , legătură directă (creşterea valorilor variabilei factoriale x determină o creştere a valorilor
ecuaţiilor de regresie şi invers).
 b1  0 , legătură inversă sau indirectă (creşterea valorilor variabilei factoriale x determină o scădere a
valorilor ecuaţiilor de regeresie şi invers).
 b1  0 , nu există legătură; variabilele sunt independente valoarea mediea a caracteristicii factoriale x
este egală cu cea a caracteristicii rezultative).
- în reprezentarea grafică, parametrii exprimă panta dreptei de regresie.

2
c. Metoda parametrică a raportului de corelaţie
Raportul de corelaţie se stabileşte în funcţie de coeficientul de determinaţie ( R 2 ) rezultat din regula
de adunare a dispersiilor:
n n

  yˆ i  y   y  yˆ i 
2 2
i
R  R2  i 1
n
 1 i 1
n

 y  y  y  y
2 2
i i
i 1 i 1

Raportul de corelaţie R  0,1, prin valorile obţinute are următoarele semnificaţii:

- dacă R  0 , cele două variabile sunt independente, deci nu există o legătură între ele (toate mediile
sunt egale între ele);
- dacă R 0;0,2 , există o legătură foarte slabă între variabilele studiate;
- dacă R 0,2 ;0,5, există o legătură slabă între cele două variabile;
- dacă R 0,5; 0,75, există o legătură de intensitate medie între variabile;
- dacă R 0,75; 0,95, există o legătură puternică între cele două variabile
- dacă R 0,95 ;1, există o legătură foarte puternică între variabile;
- dacă R  1 , există o legătură perfectă, deterministă sau funcţională între cele două variabile

d. Metoda parametrică a covarianţei


Covarianta dintre două variabile se determină astfel:

cov x, y  

 xi  x  y i  y  
n

Rezultatul obţinut prin determinarea acestui indicator ne indică direcţia legăturii stabilite între cele
două variabile x, y  , astfel:

 când covx, y   0 , atunci între factorul  x  şi rezultat  y  există o legătură directă

 când covx, y   0 , atunci între factorul  x  şi rezultat  y  există o legătură indirectă.

În Excel, coeficientul de corelație se regăsește într-un tabel de tipul:


y x
y cov(y,y)
x cov(x,y) cov(x,x)

3
e. Metoda parametrică a coeficientului de corelaţie
În cazul corelaţiei simple liniare, pentru o serie bidimensională simplă, coeficientul de corelaţie se
calculează astfel:
n

 x i  x  y i  y 
cov x; y  s xy
r i 1
 
ns x s y sx s y sx s y
sau
n

 x
i 1
i  x  y i  y 
r
 n 2 
n
2

 i 1
 x i  x 
  i 1

   yi  y  


respectiv:
n n n
n 
i 1
xi y i   y
i 1
xi 
i 1
i
r
 n  n    n 2  n
2
 
2


 i 1 

  


 xi   xi     y i  
2


y i  
 
 
 i 1
  i 1 i 1

unde: n - numărul variabilelor perechi x, y  incluse în analiză;


s x - abaterea medie pătratică a variabilei factoriale x
s y - abaterea medie pătratică a variabilei rezultative y
s xy - abaterea medie pătratică corespunzătoare ambelor variabile xy

Valorile coeficientului de corelaţie stabilesc gradul de intensitate a legăturii valorilor coeficientului de


corelaţie sunt prezentate în tabelul următor:

Tabelul 7.1. Semnificaţiile valorilor coeficientului de corelaţie


Dacă r  0 , NU există legătură între variabilele studiate
Legătură INVERSĂ, dacă r   1 ; 0 Legătură DIRECTĂ, dacă r  0 ; 1
Interval Tipul legăturii Interval Tipul legăturii
r   0,2 ; 0 inversă foarte slabă r  0 ; 0,2 directă foarte slabă
r   0,5 ;  0,2 inversă slabă r  0,2 ; 0,5 directă slabă
r   0,75 ;  0,5 inversă de intensitate medie r  0,5 ; 0,75 directă de intensitate medie
r   0,95 ;  0,75 inversă puternică r  0,75 ; 0,95 directă puternică
r   1 ;  0,95 Inversă foarte puternică r  0,95 ; 1 directă foarte puternică
r  1 Inversă perfectă r 1 directă perfectă

În Excel, coeficientul de corelație se regăsește într-un tabel de tipul:


y x
y 1
x r Coeficient de corelație 1

4
f. Metoda neparametrică a coeficienţilor de corelație a rangurilor
Spearman şi Kendall

Coeficientul rangurilor Spearman


În cazul legăturilor simple y  f x  , aplicarea metodologiei presupune parcurgrea etapelor:
1 - caracteristicilor supuse analizei interdependenţei statistice ( x - independentă, y - dependentă) le
sunt acordate ranguri în mod crescător, în sensul că, valorile empirice sunt înlocuite cu ranguri ( R x pentru
factorială şi R y pentru rezultativă), astfel încât celui mai mic nivel îi corespunde rangul 1;
2 – se ordonează crescător rangurile acordate caracteristicii factoriale ( R x )
3 - se ordonează rangurile acordate caracteristicii rezultative ( R y ) după cum corespund rangurilor
factorialei( R x )
4 – se determină diferenţa rangurilor: d i  R x  R y
5 – se calculeză pătratul diferenţei: d i2
6 – se determină şi se interpretează coeficientul rangurilor Spearman, cu relaţia:

6d
2

 1   1,1
i

nn  1
C S 2

în care:
n  numărul de unităţi observate
Observaţie!
Coeficientul rangurilor Spearman are o interpretare similară cu a coeficientului de corelaţie
parametrică

Coeficientul rangurilor Kendall


Pentru legăturile simple y  f x  , aplicarea metodologiei presupune parcurgrea următoarelor etape:
1 - caracteristicilor supuse analizei interdependenţei statistice ( x - independentă, y - dependentă) le
sunt acordate ranguri în mod crescător, în sensul că, valorile empirice sunt înlocuite cu ranguri ( R x pentru
factorială şi R y pentru rezultativă), astfel încât celui mai mic nivel îi corespunde rangul 1;
2 – se ordonează crescător rangurile acordate caracteristicii factoriale ( R x );
3 - se ordonează rangurile acordate caracteristicii rezultative ( R y ) după cum corespund rangurilor
factorialei( R x );
4 - se stabileşte concordanţa ( Pi ) pe baza ultimelor ranguri R y aranjate în funcţie de R x ordonat
crescător;
5 - se stabileşte disconcordanţa ( Qi ) pe baza ultimelor ranguri R y aranjate în funcţie de R x ordonat
crescător;
6 - se calculează  S i , unde S i  Pi  Qi
7 – se determină şi se interpretează coeficientul rangurilor Kendall, cu relaţia:

2 S i
CK    1,1
nn  1
în care: n  numărul de unităţi observate
Observaţie!
Coeficientul rangurilor Kendall are o interpretare similară cu a coeficientului de corelaţie parametrică

5
g. Metoda neparametrică a coeficientului Yulle
Aplicabilitatea acestui coeficient se bazează pe întocmirea tabelului de asociere:

y peste sub
y y Total
x
peste x a b a+b
sub x c d c+d
Total a+c b+d a+b+c+d

Metodologia determinării coeficientului de asociere Yulle depinde de tipul caracteristicilor care stau
la baza analizei legăturii de asociere.
Etapele de determinare a coeficientului de asociere Yulle, când ambele caracteristici sunt
cantitative, sunt următoarele:
1 – se schiţează tabelul de asociere ce urmează a fi completat
n n

 xi y i
2 – se determină valorile medii ale caracteristicilor ( x şi y ), astfel: x  i 1
şi y  i 1

n n
3 – se acordă semnul “+”, respectiv “-“, fiecărei valori xi şi yi după cum este mai mare sau egală,
respectiv mai mică în comparaţie cu valoarea medie corespunzătoare, ( x sau y );
4 – se numără câte valori perechi , , , , ,  , , sunt, iar rezultatele numărării se trec în
tabel astfel:
a - numărul perechilor ,
b - numărul perechilor ,
c - numărul perechilor , 
d - numărul perechilor ,

5 – se calculează coeficientul de asociere Yulle pe baza relaţiei:


ad  bc
Q 
ad  bc
6 – are o interpretare similară cu a coeficientului de corelaţie parametrică (r), astfel:

Tabelul - Semnificaţiile valorilor coeficientului de asociere


Dacă Q  0 , NU există asociere între variabilele studiate
Asociere INVERSĂ, dacă Q   1 ; 0 Asociere DIRECTĂ, dacă Q  0 ; 1
Interval Tipul asocierii Interval Tipul asocierii
Q   0,2 ; 0 inversă foarte slabă Q  0 ; 0,2 directă foarte slabă
Q   0,5 ;  0,2 inversă slabă Q  0,2 ; 0,5 directă slabă
Q   0,75 ;  0,5 inversă de intensitate medie Q  0,5 ; 0,75 directă de intensitate medie
Q   0,95 ;  0,75 inversă puternică Q  0,75 ; 0,95 directă puternică
Q   1 ;  0,95 Inversă foarte puternică Q  0,95 ; 1 directă foarte puternică
Q  1 Inversă perfectă Q 1 directă perfectă

Cea mai largă aplicabilitate o are utilizarea acestui coeficient în cazul caracteristicilor nenumerice
(exemplu: când se doreşte analiza legăturii la nivelul unei firme dintre sexul salariaţilor şi opinia acestora
cu privire la momentul petrecerii concediului: vara sau iarna)

S-ar putea să vă placă și