Sunteți pe pagina 1din 25

Capitolul 4

ANALIZA LEGĂTURILOR DINTRE FENOMENELE ŞI PROCESELE ECONOMICE

4.1. INDICATORI: DEFINIRE, FORMULE DE CALCUL

Metoda regresiei

Regresia simplă (unifactorială)

Modelul liniar Funcţia de regresie:

Y

x

i =

a

+

bx

i

Parametrul “a“ reprezintă ordonata la origine şi arată la ce nivel ar fi ajuns valoarea caracteristicii Y dacă toţi factorii - mai puţin cel înregistrat - ar fi avut o acţiune constantă asupra formării acesteia. Parametrul “b” se mai numeşte şi coeficient de regresie şi reprezintă, în sens geometric, panta liniei drepte. Coeficientul de regresie “b“ arată cu cât se schimbă în medie variabila Y în cazul în care variabila X se modifică cu o unitate. Acest parametru este pozitiv în cazul legăturii directe şi negativ în cazul legăturii inverse.

Parametrii “aşi “bse determină din sistemul de ecuaţii normale obţinut

n

prin metada celor mai mici pătrate (

i = 1

( y

i

Y

x

i

)

2

=

minim ).

În cazul în care dispunem de un număr mic de perechi de valori (xB i B, yB i B):


na

+

a

n

i = 1

b

n

n

∑ ∑

x

i

=

i

= 1

i

=

1

y

i

x

i

+

b

n

n

∑ ∑

x

2

i

=

i

=

1

i

=

1

x y

i

i

Dacă se foloseşte metoda determinanţilor se obţine:

a =

 

n

n

 

y

i

x

i

i

=

1

i

=

1

n

n

 

2

x y

i

i

x

i

 

i

=

1

i

=

1

 
   

n

   
 

n

x

i

 

i

=

1

 

n

n

∑ ∑

x

i

x

i

2

i

=

1

i

=

1

 

=

 

n

n n

 

n

∑ ∑

y

i

x

2

i

∑ ∑

x y

i

i

x

i

i

=

1

i

=

1

i

=

1

i

=

1

 

 

2

 

n

n

x

2

i

n

x

i

 

i =

1

 

i

=

1

134

b =

 

n

 
 

n

 

y

i

 

i

=

1

n

n

∑ ∑

x

i

x y

i

i

i

=

1

i

=

1

   

n

   
 

n

x

i

 

i

=

1

 

n

n

∑ ∑

x

i

x

i

2

i

=

1

i

=

1

=

n

n

n

n

∑ ∑∑

x y

i

i

x

i

i

=

1

i

=

1

i

=

1

y

i

n

n

=

1

i

x

2

i

n

=

1

i

x

i

2

În cazul în care perechile de valori (xB i B, yB i B) se repetă de nB i B ori:

na

+

a

k

i = 1

b

k

i

= 1

x n

i

i

=

x n

i

i

+

b

k

=

1

i

k

=

1

i

x

2

i

n

y n

i

i

=

i

k

=

1

i

x y n

i

i

i

unde

n =

k

i = 1

n

i

Dacă se foloseşte metoda determinanţilor se obţine:

 

k

k k

 

k

∑ ∑

y n

i

i

x

2

i

n

i

x y n

i

i

i

x n

i

i

a i

=

=

1

i

=

1

i

=

1

i

=

1

   

n

k

x

i

2

n

i

k

x n

i

i

2

 
 

i

=

1

i

=

1

   
 

n

k

x y n

i

i

i

k

k

∑ ∑

x n

i

i

y n

i

i

b i

=

=

1

i

=

1

i

=

1

n

k

x

2

i

n

k

i

x n

i

i

2

 
 

i

=

1

i

=

1

În cazul sistematizării datelor într-un tabel cu dublă intrare în care perechile de valori (xB i B, yB j B) se repetă de nB ij B ori:

unde:

n

na

+

a

k

i = 1

=

k

i = 1

b

k

i = 1

x n

i

i .

n

i .

=

x n

i

+

b

k

j

=

1

i .

=

m

j

= 1

k

=

1

i

x

2

i

n

y

i .

j

n

=

.

j

k

m

∑∑

i

=

1

j

=

1

n

. j

=

k

m

∑∑

i

j

11

==

n

135

ij

x y

i

j

n

ij

k

m

∑∑

i =

1

j

=

1

x y

i

j

n

ij

=

k

m

∑ ∑

x

i

i

=

1

j

=

1

y

j

n

ij

=

m

k

∑ ∑

y

j

j

=

1

i

=

1

x n

i

ij

Dacă se foloseşte metoda determinanţilor se obţine:

a =

b

=

m

j

=

1

y n

j

.

j

k

=

1

i

x

2

i

n

i

.

k

m

∑∑

i

=

1

j

=

1

x y n

i

j

ij

k

=

1

i

x n

i

i

.

n

k

m

∑∑

i

=

1

j

=

1

n

k

=

1

i

x y n

i

j

x

ij

2

i

n

i

.

k

=

1

i

x n

i

i

.

2

k

m

∑ ∑

x n

i

i

.

i

=

1

j

=

1

y n

j

.

j

k

n

i

=

1

x

2

i n

i .

⎜ ⎛

⎝ ⎜

k

=

1

i

x n

i

i

.

⎟ ⎟

2

Regresia multiplă

Modelul liniar

Y x

1

,

x

2

,

,

x

n

=

a

0

+

a x

1

1

+

a

2

x

2

+

+

a x

n

n

în care:

aB 0 B - reprezintă parametrul care exprimă factorii neînregistraţi, consideraţi

cu acţiune constantă, în afara celor consideraţi drept caracteristici factoriale;

,aB n B - coeficienţii de regresie care arată cât se modifică

caracteristica rezultativă dacă caracteristica factorială respectivă se modifică cu o unitate;

,xB n B - caracteristicile factoriale incluse în raportul de

interdependenţă. Parametrii aB 1 B,aB 2 B,

aB 1 B,aB 2 B,

xB 1 B,xB 2 B,

,aB n Bse determină din sistemul de ecuaţii normale:na

0

+ a

1

x

1i

+

a

a

0

0

∑ ∑

x

1i

+

a

1

∑ ∑

x

ni

+

a

1

x

2

1i

x

1i

+

+

a

x

ni

n

x

+

a

n

+

+

ni

=

y

x

1i

a

n

x

ni

x

2

ni

i

=

=

x

1i

y

i

x

ni

y

i

Cunoscând cei n parametri ai funcţiei de ajustare, se calculează pentru fiecare unitate ecuaţia de regresie pe baza valorilor xB 1 B, xB 2 B,…,xB n B.

136

Metoda corelaţiei

Corelaţia simplă

Covarianţa (cov(x,y))

cov( x ,

y

) =

n

=

1

i

(

x

i

x

)(

y

i

y

)

n

Coeficientul de corelaţie

Se foloseşte pentru măsurarea intensitatea legăturii liniare dintre două variabile statisice. În cazul în care dispunem de un număr mic de perechi de valori (xB i B, yB i B):

n

(

x

i

x

)(

y

i

y

)

 

=

i

=

1

r

y

/

x

n

σσ

x

y

Coeficientul de corelaţie liniară simplă poate să ia valori între -1 şi +1. Între -1 şi 0, legătura dintre cele două variabile este de sens invers şi este cu atât mai intensă, cu cât se apropie de –1. Între 0 şi +1, legătura dintre cele două variabile este directă şi este cu atât mai intensă, cu cât se apropie de 1. Formulă de calcul simplificat:

r

y

/

x

=

 

n

n n

 
 

n

x

i

y

i

∑ ∑

x

i

y

i

 

i = 1

 

i

=

1

i

=

1

 

i

2

⎤ ⎡

 

i

2

⎢ ⎣

n

n

i = 1

x

2

i

n

=

1

i

x

⎦ ⎢ ⎣

n

n

=

1

i

y

n

2

i y

i

=

1

Dacă s-a utilizat coeficientul de corelaţie liniară simplă, pentru testarea semnificaţiei legăturii, se aplică cel mai frecvent testul t:

r y / x t = ⋅ n − 2 , 2 1 − r
r y /
x
t =
n
2
,
2
1
− r
y
/ x

unde n reprezintă volumul eşantionului. Valoarea calculată se compară cu cea tabelară stabilită probabilistic pentru

un nivel de semnificaţie P = 1 α / 2

Dacă t B şi dacă t B

esenţial cu care să se studieze corelaţia.

şi cu n-2 grade de libertate.

calculat B

< t B

> t B

tabelar B se verifică ipoteza semnificaţiei relaţiei de corelaţie

calculat B

tabelar B legătura este nesemnificativă şi trebuie căutat un alt factor

137

Raportul de corelaţie

În cazul în care dispunem de un număr mic de perechi de valori (xB i B, yi):

selectat.

unde

R

y

/

x

Y

x

i

=

∑ n ( Y x − y i ) 2 i = 1 n (
∑ n (
Y
x − y
i
) 2
i = 1
n
(
y
)
2
i − y
i = 1

sau

R

y

/

x

=

n ∑ ( y − Y i x ) 2 i i = 1 1
n
∑ (
y
− Y
i
x
) 2
i
i = 1
1
n
∑ (
y
i − y
)
2
i = 1

reprezintă valorile ajustate indiferent de modelul de regresie

Raportul de corelaţie poate lua valori de la zero la +1.

Dacă

R

y

/

x

=

r

y

/

x

se confirmă ipoteza legăturii liniare.

Pentru corelaţia neliniară, măsurarea gradului de intensitate a legăturii se face numai prin raportul de corelaţie.

Corelaţia multiplă

Coeficientul de corelaţie multiplă 2 2 r + r − 2r r r y /
Coeficientul de corelaţie multiplă
2
2
r
+
r
2r
r
r
y
/
x
y
/
x
y
/
x
y
/
x
x
x
=
1
2
1
2
1
2
r y
/
x
x
1 ,
2
2
1
r
x
x
1
2
şi
2
2
=
r
+
r
dacă r
r y
/ x
x
y
/
x
y
/
x
x
, x
1 ,
2
1
2
1
2

Raportul de corelaţie multiplă

R

y

/

x

x

1 2

,

L

,

,

x

n

=

∑ n ( ) 2 y i − Y x , x , L x
∑ n (
) 2
y
i − Y
x
,
x
,
L x
,
1
2
n
i
= 1
1
n
∑ (
y
i − y
)
2
i
= 1

Corelaţie neparametrică

Coeficientul de asociere

= 0

dacă r

x

1

,

x

2

0

Această metodă se utilizează pentru măsurarea intensităţii legăturii a două caracteristici alternative prezentate într-un tabel de asociere de forma:

y

yB 1 B

yB 2 B

Total

x

xB 1 B

a

b

a+b

xB 2 B

c

d

c+d

Total

a+c

b+d

a+b+c+d

138

Produsul ad arată gradul de realizare a legăturii directe dintre X şi Y, iar produsul bc gradul de legătură inversă între aceste două caracteristici cercetate. Pentru stabilirea valorii numerice a coeficientului de asociere, care să indice existenţa şi intensitatea unei legături, formula cea mai utilizată este cea propusă de Yule:

Q =

ad

bc

ad

+

bc

Acest indicator poate să ia valori între -1 şi +1, arătând nu numai gradul

de intensitate al asocierii celor două caracteristici, dar şi sensul ei.

Coeficienul de corelaţie a rangurilor propus de Spearman

r s

= −

1

în care:

6

n

=

1

i

d

2

i

n

3

n

,

dB i B - reprezintă diferenţa între rangurile perechii de valori (xB i B,yB i B); n - numărul de perechi de valori.

Coeficientul de corelaţie a rangurilor propus de Kendall:

r k

=

în care

unde:

2

S

n

S

(n

=

1)

n

i = 1

(

,

P

i

Q

i

)

PB i B - numărul rangurilor mai mari care urmează rangului curent pentru variabila dependentă; QB i B - numărul rangurilor mai mici care urmează rangului curent pentru variabila dependentă.

139

4.2. PROBLEME REZOLVATE

Problema 1. Pentru 10 unităţi economice din acelaşi sector de activitate se cunosc datele următoare:

Tabelul 4.1.

Nr. crt.

Capital fix

Producţia

(mii RON)

(mii RON)

A

1

2

1

140

80

2

90

50

3

110

60

4

220

120

5

80

40

6

60

30

7

130

70

8

100

60

9

150

90

10

200

110

Total

1280

710

Se cere:

1. să se argumenteze, cu ajutorul metodelor simple, existenţa, direcţia şi

forma legăturii;

2. să se determine parametrii funcţiei de regresie;

3. să se calculeze valorile funcţiei de regresie;

4. să se afle valoarea coeficientului de corelaţie.

Rezolvare

1. Dintre metodele simple de evidenţiere a legăturilor dintre variabile cele mai indicate pentru acest exemplu sunt: metoda seriilor paralele interdependente şi metoda grafică. Metoda seriilor paralele interdependente presupune ordonarea valorilor

(

(

i ) corespunzătoare ale caracteristicii dependente (producţie), după cum se poate

vedea în tabelul 4.2. Cele două şiruri de date din tabelul 4.2. indică existenţa unei legături directe între capitalul fix şi mărimea producţiei.

x ) ale caracteristicii factoriale (capitalul fix) şi înregistrarea în paralel a valorilor

i

y

140

Tabelul 4.2.

Nr.

x i (mii RON)

 

(mii RON)

crt.

y

i

A

1

 

2

1

60

 

30

2

80

 

40

3

90

 

50

4

100

 

60

5

110

 

60

6

130

 

70

7

140

 

80

8

150

 

90

9

200

 

110

10

220

 

120

Pentru a putea aprecia şi forma legăturii este necesar să se traseze graficul de corelaţie (figura 4.1.), care sugerează o legătură de tip liniar.

Producţie (mii RON)

140

120

100

100

80

60

60

40

40

20

0

0

50

100

150

200

250

Capital fix (mii RON)

Figura 4.1. Legătura dintre capitalul fix şi producţie

2. Aflarea parametrilor funcţiei liniare de regresie necesită rezolvarea

următorului sistem de ecuaţii normale:

na

+

b

n

a x

i = 1

i

n

n

∑ ∑

x

i

=

i

= 1

i

=

1

y

i

+

b

n

n

∑ ∑

x

2

i

=

i

=

1

i

=

1

x y

i

i

141

Calculele necesare rezolvării sistemului au fost sistematizate în tabelul 4.3., coloanele 3 şi 4.

Tabelul 4.3.

Nr.

crt.

x

i

y

i

2

i

x

x y

i

i

y

2 Y

i x

i

0

1

2

3

4

5

6

1

60

30

3600

1800

900

32,6

2

80

40

6400

3200

1600

43,9

3

90

50

8100

4500

2500

49,6

4

100

60

10000

6000

3600

55,2

5

110

60

12100

6600

3600

60,9

6

130

70

16900

9100

4900

72,1

7

140

80

19600

11200

6400

77,8

8

150

90

22500

13500

8100

83,5

9

200

110

40000

22000

2100

111,7

10

220

120

48400

26400

4400

123

Total

1280

710

187600

104300

58100

710,3

Sistemul de ecuaţii normale este:

10 a


+

1280 b

=

710

1280 a

+

187600 b

=

cu soluţiile:

a = −1,32

b = 0,565

104300

,

Ecuaţia

medie

de

estimare

a

legăturii

liniare

dintre

capitalul

fix

şi

producţie este:

Y

x

i =− ,

1 32

+

0 565 x

,

i

La o creştere cu o mie de lei noi (RON) a capitalului fix, producţia se măreşte, în medie, cu 0,565 mii RON.

3. Valorile ajustate ale producţiei se calculează înlocuind fiecare variantă ( x i ) a caracteristicii factoriale în funcţia de regresie (vezi tabelul 4.2., coloana 6).

Y

M

Y

x

x

1

10

=−

1 , 32

+

0 , 565 60

=

=−

1 , 32

+

0 , 565 220

32 , 6

=

123

142

4.

Coeficientul de corelaţie liniară simplă este:

n

n

n

n ∑ x y − ∑ ∑ x y i i i i i =
n
x
y
∑ ∑
x
y
i
i
i
i
i = 1
i
=
1
i
=
1
r
=
=
y
/ x
2
2
n
n
⎤ ⎡
n
n
n
x
x
n
y
2 ⎥
i y
i 2 − ∑
i
i
i = 1
i
=
1
i
=
1
i
=
1
⎦ ⎥ ⎣ ⎢
10 104300
1280 710
=
=
0 9928
,
(
10 187600
1638400
)(
10 58100
504100
)

Acest

rezultat

arată

o

legătură

directă

foarte

puternică,

funcţională, între variabilele înregistrate.

aproape

Problema 2. Numărul mediu de angajaţi şi profitul anual înregistrat de 10 firme dintr-o subramură industrială se prezintă astfel:

Tabelul 4.4.

 

Număr mediu de angajaţi (persoane)

Profit anual

Nr. crt.

(mii RON)

0

1

2

1

13

115

2

4

45

3

12

100

4

5

50

5

6

55

6

8

85

7

3

40

8

4

50

9

5

45

10

7

70

Total

67

655

Se cere:

1. să se analizeze existenţa, direcţia şi forma legăturii;

2. să se determine parametrii funcţiei de regresie;

3. să se calculeze valorile funcţiei de regresie;

4. să se măsoare intensitatea corelaţiei dintre cele două variabile folosind

coeficientul şi raportul de corelaţie.

143

Rezolvare

1. În relaţia dintre cele două variabile factorul de influenţă este numărul

mediu de angajaţi (x), iar variabila rezultativă este mărimea profitului (y).

Dintre metodele simple de evidenţiere a corelaţiei dintre două variabile am ales metoda grafică, aceasta oferind cele mai multe informaţii. Din figura 4.2. reiese că între numărul de angajaţi şi mărimea profitului există o legătură directă, de tip liniar.

140 120 100 80 60 40 20 0 0 1 2 3 4 5 6
140
120
100
80
60
40
20
0
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
Profit anual (mii RON)

Număr mediu angajaţi (persoane)

Figura 4.2. Legătura dintre numărul mediu de angajaţi şi valoarea profitului

2. Sistemul de ecuaţii normale necesar pentru aflarea parametrilor a şi b

ai funcţiei liniare este:

naa

∑ ∑

∑ ∑∑

+

b

x

i

+

x

b

i

=

x

2

i

y

=

i

x y

i

i

Folosind rezultatele calculelor intermediare prezentate în tabelul 4.5 (coloanele 1 - 4), se obţine sistemul:

10 a

67a

+

+

67b

553b

=

655

=

5170

, cu soluţiile:

a

b

=

=

15 2017

,

7 5072

,

3. Valorile teoretice ale profitului (

Y

x

) se vor calcula înlocuind fiecare
i

valoare ( x ) a variabilei factoriale în funcţia de regresie:

i

Y

x

i =

15 2017

,

+

7 5072 x

,

i

144

Rezultatele calculelor efectuate sunt prezentate în tabelul nr. 4.5., coloana 6.

Tabelul 4.5.

Nr.

crt.

x

i

y

i

x y

i

i

x