Sunteți pe pagina 1din 5

Descrierea statistică a seriilor bivariate

(Analiza de regresie și corelație)


Clasificarea metodelor statistice de analiză a legăturilor

Metodele statistice
cele mai utilizate în analiza legăturilor

a. Metoda grafică
Legătura dintre 2 variabile se reprezintă cu ajutorul diagramei norului de puncte (Scatter), denumită
şi corelogramă, care ne arată:
a.1 – direcția legăturii dintre cele două variabile;
Interpretarea se realizează după cum sunt repartizate punctele pe grafic:
 dacă punctele se plasează pe direcţia primei bisectoare, atunci legătura dintre cele două
variabile este directă
 plasarea punctelor pe direcţia celei de-a doua bisetoare, prezintă o legătură inversă
 cu cât punctele sunt mai concentrate în apropierea primei sau celei de-a doua bisectoare, cu atât
legătura este mai intensă
a.2 – forma legăturii
 dacă repartizarea punctelor se face pe direcţia unei drepte, atunci forma legăturii este liniare, în
caz contrar se vorbeşte despre o legătură neliniară (parabolică, exponenţială etc)
1
b. Metoda parametrică a regresiei liniare unifactoriale
Funcţia de regresie liniară unifactorială are forma dată prin relaţia:
yˆ i  b0  b1 xi
din care se observă că variabila rezultativă ŷ i depine de o singură variabilă factorială xi .
Parametrii b0 şi b1 sunt estimatori ai punctului de intercepţie  0 , respectiv ai pantei liniei de regresie
 1 (funcţia de regresie la nivelul colectivităţii generale fiind: Yi   0  1 xi   i ).
În general practica a demonstrat că metoda cea mai fidelă şi utilizată pentru estimarea parametrilor
este metoda celor mai mici pătrate.
n n
min 
i 1
( y i  yˆ i ) 2 = min (y
i 1
i  b0  b1 xi ) 2 , care conduce la sistemul de ecuaţii normale:

 n n

 0 1  i  y i
nb  b x 
i 1 i 1
 n n n
b0  xi  b1  xi2   xi y i
 i 1 i 1 i 1

Estimatorul b0 :
- este denumit intercept (termen liber);
- are caracter de mărime medie – indică valoarea variabilei rezultative y când toţi factorii

neesenţiali au o acţiune constantă (este nivelul mediu al variabilei y determinată prin influenţa celorlalţi
factori, în afara lui xi ).

- în reprezentarea grafică, indică punctul de întâlnire dintre axa OY şi panta dreptei de regresie ŷ i .

- valoarea pozitivă ( b0  0 ) sau negativă ( b0  0 ) nu are nici o relevanţă în modelul regresiei.

 Estimatorul b1 :
- se numeşte şi coeficient de regresie;
- arată:
 gradul de influenţă a variabilităţii factoriale x asupra rezultativei y (în condiţiile modificării cu o unitate a
factorului x în medie y variază cu valoarea lui b1).
 direcţia legăturii:
 b1  0 , legătură directă (creşterea valorilor variabilei factoriale x determină o creştere a valorilor
ecuaţiilor de regresie şi invers).
 b1  0 , legătură inversă sau indirectă (creşterea valorilor variabilei factoriale x determină o scădere a
valorilor ecuaţiilor de regeresie şi invers).
 b1  0 , nu există legătură; variabilele sunt independente valoarea mediea a caracteristicii factoriale x
este egală cu cea a caracteristicii rezultative).
- în reprezentarea grafică, parametrul exprimă panta dreptei de regresie.
2
c. Metoda parametrică a raportului de corelaţie
Raportul de corelaţie se stabileşte în funcţie de coeficientul de determinaţie ( R 2 ) rezultat din
regula de adunare a dispersiilor:
R  R2
Raportul de corelaţie R  0,1 , prin valorile obţinute are următoarele semnificaţii:

- dacă R  0 , cele două variabile sunt independente, deci nu există o legătură între ele (toate
mediile sunt egale între ele);
- dacă R 0;0,2 , există o legătură foarte slabă între variabilele studiate;
- dacă R 0,2 ;0,5, există o legătură slabă între cele două variabile;
- dacă R 0,5 ; 0,75, există o legătură de intensitate medie între variabile;
- dacă R 0,75 ; 0,95, există o legătură puternică între cele două variabile
- dacă R 0,95 ;1 , există o legătură foarte puternică între variabile;
- dacă R  1, există o legătură perfectă, deterministă sau funcţională între cele două variabile
Foarte Slabă de intensitate medie Foarte Puternică
0 0,2 0,5 0,75 0,95 1
Slabă Puternică
Raportul de corelație se determină ca R   R  2

 Unde R este coeficientul de determinație (R Square) care arată ponderea de


2

influență a factorului (x) în variația rezultatului (y).


 Astfel:
- dacă R  50 % atunci factorul x influențează semnificativ rezultatul y
- dacă R  50 % atunci factorul x nu influențează semnificativ rezultatul y

d. Metoda parametrică a covarianţei


Covarianța dintre două variabile se determină astfel:

covx, y  
 
 xi  x  y i  y 
n
Rezultatul obţinut prin determinarea acestui indicator ne indică direcţia legăturii stabilite între
cele două variabile x, y  , astfel:

 când covx, y   0 , atunci între factorul  x  şi rezultat  y  există o legătură directă

 când covx, y   0 , atunci între factorul  x  şi rezultat  y  există o legătură indirectă.


În Excel, matricea covarianței este de tipul:
y x
y cov(y,y)
x cov(x,y) cov(x,x)
3
e. Metoda parametrică a coeficientului de corelaţie
În cazul corelaţiei simple liniare, pentru o serie bidimensională simplă, coeficientul de corelaţie se
calculează astfel:
n

 x i  x  y i  y 
cov x; y  s
r i 1
  b1  x
ns x s y sx s y sy
Sau
n n n n

 x
i 1
i  x  y i  y  n x y x  y
i i i i
i 1 i 1 i 1
r r
 n 2 
n
2  n    n
2
 
2

 i 1
 x i  x   
   yi  y  
  i 1  
 n

 n
 xi2   xi     y i2  
     yi  
 
 i 1  i 1    i 1  i 1  

unde: n - numărul variabilelor perechi x, y  incluse în analiză;


s x - abaterea medie pătratică a variabilei factoriale x
s y - abaterea medie pătratică a variabilei rezultative y
s xy - abaterea medie pătratică corespunzătoare ambelor variabile xy

Valorile coeficientului de corelaţie stabilesc gradul de intensitate a legăturii valorilor coeficientului de


corelaţie sunt prezentate în tabelul următor:

Tabelul 7.1. Semnificaţiile valorilor coeficientului de corelaţie


Dacă r  0 , NU există legătură între variabilele studiate
Legătură INVERSĂ, dacă r   1 ; 0 Legătură DIRECTĂ, dacă r  0 ; 1
Interval Tipul legăturii Interval Tipul legăturii
r   0,2 ; 0 inversă foarte slabă r  0 ; 0,2 directă foarte slabă
r   0,5 ;  0,2 inversă slabă r  0,2 ; 0,5 directă slabă
r   0,75 ;  0,5 inversă de intensitate medie r  0,5 ; 0,75 directă de intensitate medie
r   0,95 ;  0,75 inversă puternică r  0,75 ; 0,95 directă puternică
r   1 ;  0,95 Inversă foarte puternică r  0,95 ; 1 directă foarte puternică
r  1 Inversă perfectă r 1 directă perfectă

Foarte Slabă de intensitate medie Foarte Puternică


0 0,2 0,5 0,75 0,95 1
Slabă Puternică

În Excel, matricea de corelație este de tipul:


y x
y 1
x r Coeficient de corelație 1

4
f. Metoda neparametrică a coeficienţilor de corelație a rangurilor
Spearman şi Kendall

Coeficientul rangurilor Spearman


În cazul legăturilor simple y  f x  , aplicarea metodologiei presupune parcurgrea etapelor:
1 - caracteristicilor supuse analizei interdependenţei statistice ( x - independentă, y - dependentă)
le sunt acordate ranguri în mod crescător, în sensul că, valorile empirice sunt înlocuite cu ranguri ( R x
pentru factorială şi R y pentru rezultativă), astfel încât celui mai mic nivel îi corespunde rangul 1;
2 – se ordonează crescător rangurile acordate caracteristicii factoriale ( R x )
3 - se ordonează rangurile acordate caracteristicii rezultative ( R y ) după cum corespund rangurilor
factorialei( R x )
4 – se determină diferenţa rangurilor: d i  Rx  R y
5 – se calculeză pătratul diferenţei: d i2
6 – se determină şi se interpretează coeficientul rangurilor Spearman, cu relaţia:

6d
2
r  1   1,1
 
i
n n 1
S 2

în care: n  numărul de unităţi observate


Observaţie! Coeficientul rangurilor Spearman are o interpretare similară cu a coeficientului de
corelaţie parametrică

Coeficientul rangurilor Kendall


Pentru legăturile simple y  f x  , aplicarea metodologiei presupune parcurgrea următoarelor etape:
1 - caracteristicilor supuse analizei interdependenţei statistice ( x - independentă, y - dependentă)
le sunt acordate ranguri în mod crescător, în sensul că, valorile empirice sunt înlocuite cu ranguri ( R x
pentru factorială şi R y pentru rezultativă), astfel încât celui mai mic nivel îi corespunde rangul 1;
2 – se ordonează crescător rangurile acordate caracteristicii factoriale ( R x );
3 - se ordonează rangurile acordate caracteristicii rezultative ( R y ) după cum corespund
rangurilor factorialei( R x );
4 - se stabileşte concordanţa ( Pi ) pe baza ultimelor ranguri R y aranjate în funcţie de R x ordonat
crescător;
5- se stabileşte disconcordanţa ( Qi ) pe baza ultimelor ranguri R y aranjate în funcţie de R x ordonat
crescător;
n n n n
6 - se calculează scorul  S i , unde  S   P  Q
i i i
i 1 i 1 i 1 i 1
7– se determină şi se interpretează coeficientul rangurilor Kendall, cu relaţia:
n
2 S i
rK  i 1
  1,1
nn  1
în care: n  numărul de unităţi observate
Observaţie! Coeficientul rangurilor Kendall are o interpretare similară cu a coeficientului de
corelaţie parametrică
5

S-ar putea să vă placă și