Sunteți pe pagina 1din 9

3.5.

Măsurarea intensităţii legăturilor dintre fenomene


În natură ca şi în societate, fenomenele evoluează în strânsă dependenţă
unele de altele. Toate aceste legături pot fi rezumate la două tipuri: legături
funcţionale şi legături statistice.
Legăturile funcţionale se întâlnesc îndeosebi în fizică, chimie, mecanică,
etc. Un fenomen-efect depinde de un singur fenomen-cauză. O asemenea
dependenţă este de tip univoc,
y=f(x)
Astfel de legături se întâlnesc, este adevărat mai rar, şi în practica
economică. Spre exemplu, costul total cu energia electrică pe care o firmă îl achită
furnizorului (C) depinde de consum (Q), tariful fiind o constantă care, cel puţin
într-un interval de timp, nu se modifică:
C=Q . t
Legăturile statistice, cunoscute şi sub numele de legături stochastice se
întâlnesc cel mai frecvent în practica social-economică. Varietatea şi complexitatea
factorilor, mai ales a celor economici, generează o dependenţă de tip stochastic.
Aceasta presupune că un fenomen-efect evoluează sub influenţa mai multor
factori-cauză. Modelul de dependenţă stochastică este de forma:
y=f(x1,x2,...,xn)
Spre exemplu, costul de fabricaţie pe unitatea de produs depinde de mai
mulţi factori: consumurile de materiale, preţul de aprovizionare al acestora,
cantitatea de produse, productivitatea muncii etc.
Dacă variabilele dependente se exprimă numeric atunci avem de a face, cu
ceea ce numim o corelaţie. În practică se întâlnesc mai multe tipuri de corelaţii:
a) După numărul de variabile asociate, luate în studiu:
- corelaţie simplă, în cazul a două variabile (x - variabilă cauză şi y -
variabilă efect);
- corelaţie multiplă, pentru mai multe variabile (y - variabilă efect
dependentă de x1, x2, ... xn variabile cauză).
b) După direcţia în care se produce:
- corelaţie directă (pozitivă) când variabilele evoluează în acelaşi sens;
- corelaţie inversă (negativă) atunci când variabilele îşi modifică nivelul
în sens contrar.
c) După forma ei:
- corelaţie liniară, exprimată prin ecuaţia unei drepte;
- corelaţie curbilinie ce poate fi exprimată prin ecuaţia unei funcţii
exponenţiale, parabolice, hiperbolice etc.
d) După timpul în care are loc:
- corelaţie sincronă (concomitentă);
- corelaţie asincronă, sau cu decalaj în timp.
Studierea corelaţiei presupune:
- identificarea factorilor de dependenţă şi ierarhizarea lor în ceea ce priveşte
influenţarea variabilei rezultative;
- procurarea datelor privind parametrii modelului pentru rezolvarea acestuia;
- determinarea indicatorilor de corelaţie pentru aprecierea existenţei, formei
şi intensităţii dependenţei stochastice.
Aplicarea metodei corelaţiei se bazează pe utilizarea funcţiilor statistico-
matematice. Opţiunea pentru o anumită funcţie este determinată de tipul de
corelaţie existentă între variabilele studiate.
Acest tip de corelaţie presupune studierea dependenţei dintre două variabile
al căror nivel se modifică în progresie aritmetică.
Pentru a exprima dependenţa liniară ne folosim de funcţia de regresie:
ȳ x=a+ bx i

Linia de regresie exprimă dependenţa variabilei y de variabila factorială x,


considerând constantă influenţa celorlalţi factori, exprimată de parametrul “a” ca o
medie. Parametrul “b”, numit şi coeficient de regresie, exprimă numeric
modificarea variabilei-efect atunci când nivelul variabilei-cauză creşte cu o unitate.
Totodată, el oferă informaţii cu privire la existenţa şi sensul corelaţiei:
b¹0, există corelaţie;
b > 0, corelaţie directă (pozitivă);
b < 0, corelaţie inversă (negativă).
Parametrii funcţiei de regresie pot fi localizaţi grafic, spre exemplu în cazul
b > 0 (fig. 9):

y
y x  a  bxi

a
b
0 1 x

Fig. 9: Cazul corelaţiei liniare pozitive.


Prin urmare, când: x=0 Þ yx  a
dacă x=1 Þ yx  a  b
Cu ajutorul metodei celor mai mici pătrate se determină parametrii ecuaţiei
funcţiei de regresie, astfel încât
n
∑ ( y i− ȳ x )2 =minim
i =1

Punând această condiţie, prin operaţiile matematice de rigoare se obţine


sistemul:
 pentru seriile simple,
n n

{
na+b ∑ xi=∑ yi ¿ ¿¿¿¿
i=1 i=1

 pentru repartiţiile de frecvenţe,


n n n

{∑
a f i +b ∑ xi f x =∑ y i f yi ¿ ¿¿¿¿
i=1 i=1
i
i=1

Valorile parametrilor a şi b se determină rezolvând sistemul de ecuaţii.


Înlocuind valorile obţinute în ecuaţia funcţiei liniare obţinem funcţia ce estimează
dependenţa dintre cele două variabile.
În funcţie de valorile obţinute pentru parametri a şi b se fac aprecieri cu
privire la existenţa şi sensul corelaţiei dintre fenomenele urmărite.
Pentru măsurarea intensităţii dependenţei liniare între cele două variabile
aleatoare se foloseşte coeficientului de corelaţie liniară având expresia:
n n n n n

r xy =
( ∑ f i⋅∑ x i ∑ y i f x y
i =1 i =1 i=1
i i )(
− ∑ x fx ∑ y fy
i=1
i i )( i=1
i i )
√[(
n n n 2 n n n 2

∑ f i ¿ ∑ x2i f x i −
i=1 i=1
)( ∑ xi f xi
i=1
) ][ ( ∑ f i ¿ ∑ y 2i f y i −
i=1 i=1
) (∑ ) ]
i =1
yi f yi

De remarcat că în cazul unei legături de tip univoc (corelaţie funcţională),


când avem de a face cu dependenţa de un singur factor,
rxy = 1, în cazul corelaţiei directe (pozitive);
rxy = -1, pentru corelaţia inversă (negativă);
Pentru legăturile statistice (stochastice):
r xy ≠0 , există corelaţie;

rxy > 0, dar < 1, în corelaţia directă;


rxy < 0, dar > -1, în corelaţia inversă.
Cel mai adesea, în practica economică se întâlnesc fenomene a căror evoluţie
se află sub influenţa simultană a mai multor factori. Studiul corelaţiei simple
presupune, pe baza unei analize atente, să desprindem factorul-cauză cel mai
important în raport de care să studiem dependenţa.
Cu ajutorul corelaţiei multiple poate fi apreciată conexiunea dintre o
variabilă-efect şi mai mulţi factori-cauză importanţi, determinând influenţa
fiecăruia în parte.
Dacă se consideră y=f(x1,x2,...,xn) o legătură stochastică multiplă, aceasta
poate fi exprimată prin ecuaţia funcţiei liniare de forma:
ȳ x =a 0 +a 1 x 1 + a2 x 2 +. . .+ an x n
1 , x 2 , .. . , x n

în care:
a1,a2,...,an - coeficienţii de regresie care arată cât de mare este modificarea
variabilei dependente sub influenţa factorilor x1,x2,...,xn
a0 - parametrul care exprimă sub formă de medie influenţa
celorlalţi factori, în afara celor consideraţi.
De exemplu, dependenţa salariului orar de vechimea în muncă şi de
productivitatea muncii poate fi exprimată prin ecuaţia funcţiei liniare de tipul:
ȳ x =a 0 +a 1 x 1 + a2 x 2
1 , x 2 , .. . , x n

Parametrii a0, a1 şi a2 se determină cu ajutorul metodei celor mai mici


n

∑ ( y− ȳ x x )2 =minim
pătrate. Punând condiţia ca i=1
1 2
, se obţine sistemul:

n n n n n n n

{ {
na0+a1∑ x1+a2∑ x2=∑ y ¿ a0∑ x1+a1∑ x +a2∑ x1x2=∑ x1 y ¿¿¿¿¿
i=1 i=1 i=1 i=1 i=1 i=1 i=1
2
1

Prin rezolvarea sistemului se obţin valorile pentru parametri a 0, a1 şi a2 pe


baza cărora se ecuaţia de regresie dintre variabilele urmărite. Pe baza ecuaţiei de
regresie poate fi estimat nivelul variabilei dependente (y) în funcţie de valorile
variabilelor independende (x1 şi x2).
Intensitatea influenţelor factorilor se măsoară cu ajutorul coeficientului
corelaţiei multiple, având expresia:
n n

√ ∑ ( y− ȳ )2−∑ ( y− ȳ x 2

i=1 i=1
1 2
x )
Ry x1 x2 = n
=
∑ ( y − ȳ )2
i=1

sau
2
σyx x

unde:
Ry x
1 x2
= 1−
√ σ 2y
1 2

∑ ( y− ȳ x x )2 1 2
σ 2y = i=1
x1 x2 n
n

∑ ( y− ȳ )2
σ 2y = i=1
n
Dacă nivelul coeficientul corelaţiei multiple se apropie de 1 înseamnă că
între variabilele urmărite există o strânsă legătură.
Pentru a măsura contribuţia fiecărui factor în parte asupra modificării
fenomenului-efect se utilizează coeficienţii de determinaţie.
Coeficientul determinaţiei multiple exprimă influenţa simultană a factorilor
independenţi asupra fenomenului dependent, având relaţia:
2
σy
x 1 x2
Dy x x =1− 2
1 2 σ yx x
1 2

Prin descompunerea determinaţiei totale se pot stabili influenţele pe factori,


folosind coeficienţii parţiali de determinaţie:
x1 y

Dy x =
a1 (∑ n
− ȳ x̄ 1 )
1
σ 2y

x2 y

Dy x =
a2 (∑ n
− ȳ x̄ 2 )
2
σ 2y

în care:

x̄ 1=
∑ x1
n

x̄ 2=
∑ x2
n

ȳ=
∑y
n

Aceşti coeficienţi măsoară contribuţia fiecărei variabile factoriale (x1 şi x2) la


modificarea variabilei rezultative (y).
Corelaţia curbilinie. Uneori, în practica social-economică se întâlnesc
legături stochastice în care o variabilă-efect este dependentă chiar de nivelul
variabilei-cauză. Acest gen de legături de formă curbilinie pot fi exprimate sintetic
prin ecuaţia unei hiperbole, parabole, ori a curbei exponenţiale.
În cazul curbei de tipul hiperbolei se foloseşte ecuaţia de estimare:
b
ȳ x=a+
xi
Pentru corelaţia parabolică ecuaţia are expresia:
2
ȳ x=a+ bx i+ cx i

iar în cazul curbei exponenţiale ecuaţia este:


xi
ȳ x=ab

În cele ce urmează vom urmări un model de corelaţie hiperbolic.


Parametrii a şi b ai ecuaţiei hiperbolei se calculează cu ajutorul metodei
celor mai mici pătrate. Punând condiţia:
n
∑ ( y i− ȳ x )2 =minim
i =1

se obţine sistemul pentru seriile simple:


n n

{ 1
na+b ∑ =∑ yi ¿ ¿¿¿¿
i=1 x i i=1
pentru repartiţiile de frecvenţe:

n n f xi n

{∑ a f i+b∑ =∑ yi f y ¿ ¿¿¿¿
i=1 i=1 xi i=1
i

Prin rezolvarea sistemului se obţin valorile pentru cei doi parametri (a şi b),
ceea ce ne permite identificarea ecuaţiei care descrie dependenţa dintre variabilele
urmărite. În acest fel se poate determina nivelul teoretic al variabilei y în funcţie de
valorile reale ale variabilei x.
Estimarea intensităţii corelaţiei neliniare se face cu ajutorul raportului de
corelaţie, cunoscut şi sub numele de indice de corelaţie, având relaţia:
n n n
yi

√ ( )( )
2
a ∑ yi f y + b∑ f x y − ȳ ∑ f i
i=1
i
i=1 xi i i i=1
R xy = n n

∑ y2 f y −
i=1
i i ( ∑)ȳ 2
i=1
fi

în care:
n

∑ yi f y i
i=1
ȳ= n

∑ fi
i =1

Cu cât valoarea acestui indicator se apropie de 1 cu atât între cele două


variabile există o dependenţă mai puternică.
Corelaţia neparametrică. Metodele neparametrice permit, în cazul celor
mai variate tipuri de repartiţii, să stabilim existenţa corelaţiei, sensul şi intensitatea
acesteia. În corelaţia neparametrică nu operăm cu valorile caracteristicilor ci cu
rangul acestora. Rangul reprezintă numărul de ordine pe care îl ocupă fiecare
unitate observată într-o serie organizată crescător sau descrescător pentru fiecare
din variabilele corelate. De aici şi numele de corelaţie a rangurilor sub care mai
întâlnim, uneori, acest tip de dependenţă.
Între metodele neparametrice se utilizează, cel mai adesea, coeficienţii de
corelaţie a rangurilor.
a) Coeficientul Spearman
Fie n unităţi ale unei populaţii statistice pentru care se înregistrează două
variabile x şi y între care se presupune că există o dependenţă. Dacă se ordonează
unităţile observate, să spunem crescător, pentru fiecare din variabile se obţin:
rx
i -rangurile unităţilor după variabila x;
ry
i -rangurile unităţilor după variabila y.
La o privire asupra rangurilor putem observa o concordanţă a acestora.
Respectiv, rangurilor mari după variabila factorială să le corespundă ranguri tot
mai mari după variabila dependentă, ceea ce sugerează o corelaţie directă
(pozitivă). În cazul discordanţei rangurilor, corelaţia este inversă (negativă). De
această dată rangurile mici ale lui x au corespondente ranguri mari după y.
Cu ajutorul coeficientului folosit de Spearman, având expresia:
6 ∑ Δ 2i
r xy=1−
n3 −n
se estimează sensul corelaţiei şi intensitatea acesteia:
r xy ≠0 , există corelaţie;
r xy >0 , corelaţie directă;

r xy <0 , corelaţie inversă.

în care:  i - diferenţele dintre rangurile celor două variabile corelate,


Δ i=r x −r y
i i

b) Coeficientul Kendall
Corelaţia rangurilor poate fi studiată şi cu ajutorul coeficientului propus de
Kendall, având expresia:

r xy =
∑ pi − ∑ qi
1
n ( n−1 )
2
în care:
pi - numărul de ranguri superioare rangului i al variabilei dependente
care există pe coloana respectivă după fiecare rang;
qi - reprezintă numărul de ranguri inferioare ale variabilei dependente
care există după rangul i al acesteia.

S-ar putea să vă placă și