Sunteți pe pagina 1din 25

Capitolul 4

ANALIZA LEGĂTURILOR DINTRE


FENOMENELE ŞI PROCESELE ECONOMICE
4.1. INDICATORI: DEFINIRE, FORMULE DE CALCUL
Metoda regresiei
Regresia simplă (unifactorială)
Modelul liniar
Funcţia de regresie:
Yxi = a + bxi
Parametrul “a“ reprezintă ordonata la origine şi arată la ce nivel ar fi
ajuns valoarea caracteristicii Y dacă toţi factorii - mai puţin cel înregistrat - ar fi
avut o acţiune constantă asupra formării acesteia.
Parametrul “b” se mai numeşte şi coeficient de regresie şi reprezintă, în
sens geometric, panta liniei drepte. Coeficientul de regresie “b“ arată cu cât se
schimbă în medie variabila Y în cazul în care variabila X se modifică cu o unitate.
Acest parametru este pozitiv în cazul legăturii directe şi negativ în cazul legăturii
inverse.
Parametrii “a” şi “b” se determină din sistemul de ecuaţii normale obţinut
n
prin metada celor mai mici pătrate ( ∑(y −Y
i =1
i xi ) 2 = minim ).

În cazul în care dispunem de un număr mic de perechi de valori (xi, yi): B B B B

⎧ n n



na + b ∑
i =1
xi =
i =1
yi∑
⎨ n n n
⎪a x + b x 2 =
⎪ ∑
⎩ i =1
i
i =1
i∑ i =1
xi yi ∑
Dacă se foloseşte metoda determinanţilor se obţine:
n n


i =1
yi ∑x i =1
i

n n n n n n
∑x y ∑x
i =1
i i
i =1
2
i ∑ ∑ yi xi2 − ∑ xi yi ∑x i
i =1 i =1 i =1 i =1
a= n
= 2
n
⎛ n ⎞
n ∑x i n ∑x 2
i ∑
− ⎜⎜ xi ⎟⎟
n
i =1
n
i =1 ⎝ i =1 ⎠
∑x ∑x
i =1
i
i =1
2
i

134
n
n ∑y
i =1
i

n n n n n
∑x ∑x y
i =1
i
i =1
i i n ∑ xi yi − ∑ ∑y xi i
i =1 i =1 i =1
b= n
= 2
n
⎛ n ⎞
n ∑x i n ∑x 2
i
− ⎜⎜ xi ⎟⎟∑
n
i =1
n
i =1 ⎝ i =1 ⎠
∑x ∑x
i =1
i
i =1
2
i

În cazul în care perechile de valori (xi, yi) se repetă de ni ori: B B B B B B

⎧ k k

⎪na + b xi ni =

∑ yi ni ∑ k
⎨ k
i =1
k
i =1
k
unde n= ∑n i
⎪a x n + b x 2 n =
⎪ ∑
⎩ i =1
i i
i =1
i i
i =1
xi yi ni ∑ ∑ i =1

Dacă se foloseşte metoda determinanţilor se obţine:


k k k k


i =1
yi ni ∑ i =1
xi2 ni − ∑
i =1
xi yi ni ∑xn
i =1
i i
a= 2
k
⎛ k ⎞
n ∑ i =1
xi2 ni − ⎜⎜ xi ni ⎟⎟
⎝ i =1 ⎠

k k k
n ∑
i =1
xi yi ni − ∑i =1
xi ni ∑yn
i =1
i i
b= 2
k
⎛ k ⎞
n ∑
i =1
xi2 ni
⎝ i =1

− ⎜⎜ xi ni ⎟⎟

În cazul sistematizării datelor într-un tabel cu dublă intrare în care
perechile de valori (xi, yj) se repetă de nij ori:
B B B B B B

⎧ k m

⎪ na + b ∑ x n
i i. = ∑ y j n. j
⎪ i =1 j =1
⎨ k k k m
⎪a x n + b x 2 n =

⎪⎩ i =1 i i. ∑i =1
i i. ∑∑
i =1 j =1
x i y j nij

unde:
k k k m
n = ∑ ni. = ∑ n. j = ∑∑ nij
i =1 j =1 i =1 j =1

135
k m k m m k

∑∑ x y n
i =1 j =1
i j ij = ∑ xi ∑ y j nij = ∑ y j ∑ xi nij
i =1 j =1 j =1 i =1

Dacă se foloseşte metoda determinanţilor se obţine:


m k k m k

∑j =1
y j n. j ∑
i =1
xi2 ni. − ∑∑
i =1 j =1
xi y j nij ∑x n
i =1
i i.

a= 2
k
⎛ k ⎞
n ∑
i =1
xi2 ni.
⎝ i =1

− ⎜⎜ xi ni. ⎟⎟

k m k m
n ∑∑
i =1 j =1
xi y j nij − ∑
i =1
xi ni. ∑y n
j =1
j .j

b= 2
k
⎛ k ⎞
n ∑x ni =1
2
i i. ∑
− ⎜⎜ xi ni. ⎟⎟
⎝ i =1 ⎠

Regresia multiplă
Modelul liniar
Yx1 , x 2 ,..., x n = a0 + a1 x1 + a2 x2 + ... + an xn
în care:
a0 - reprezintă parametrul care exprimă factorii neînregistraţi, consideraţi
B B

cu acţiune constantă, în afara celor consideraţi drept caracteristici factoriale;


a1,a2, ... ,an - coeficienţii de regresie care arată cât se modifică
B B B B B B

caracteristica rezultativă dacă caracteristica factorială respectivă se modifică cu o


unitate;
x1,x2, ... ,xn - caracteristicile factoriale incluse în raportul de
B B B B B B

interdependenţă.
Parametrii a1,a2, ... ,an se determină din sistemul de ecuaţii normale:
B B B B B B

⎧na0 + a1 x1i + ... + an xni =



yi ∑ ∑ ∑
⎪..........................................................
⎪ 2
⎨a0 x1i + a1 x1i + ... + an x1i xni = ∑ x1i yi ∑ ∑ ∑

⎪............................................................
⎪a
⎩ 0 xni + a1 x1i xni + ... + an xni = ∑ 2
xni yi ∑ ∑ ∑
Cunoscând cei n parametri ai funcţiei de ajustare, se calculează pentru
fiecare unitate ecuaţia de regresie pe baza valorilor x1, x2,…,xn. B B B B B B

136
Metoda corelaţiei

Corelaţia simplă
Covarianţa (cov(x,y))
n

∑ (x − x )( y − y )
i =1
i i
cov( x, y ) =
n
Coeficientul de corelaţie
Se foloseşte pentru măsurarea intensitatea legăturii liniare dintre două
variabile statisice.
În cazul în care dispunem de un număr mic de perechi de valori (xi, yi): B B B B

∑ (x − x )( y − y )
i =1
i i
ry / x =
nσ xσ y
Coeficientul de corelaţie liniară simplă poate să ia valori între -1 şi +1.
Între -1 şi 0, legătura dintre cele două variabile este de sens invers şi este
cu atât mai intensă, cu cât se apropie de –1.
Între 0 şi +1, legătura dintre cele două variabile este directă şi este cu atât
mai intensă, cu cât se apropie de 1.
Formulă de calcul simplificat:
n n n
n ∑
i =1
xi yi − ∑ ∑y
i =1
xi
i =1
i
ry / x =
⎡ n ⎛ n ⎞
2
⎤⎡ n ⎛ n ⎞ ⎤
2


⎢n xi2 − ⎜ xi
⎢ i =1 ⎜
⎝ i =1
∑ ⎟

⎠ ⎥ ⎢ i =1

⎥ ⎢n yi2 − ⎜ yi ⎟ ⎥
⎜ ⎟
⎝ i =1 ⎠ ⎥⎦

⎣ ⎦⎣
Dacă s-a utilizat coeficientul de corelaţie liniară simplă, pentru testarea
semnificaţiei legăturii, se aplică cel mai frecvent testul t:

ry / x
t= ⋅ n−2 ,
1 − ry2/ x

unde n reprezintă volumul eşantionului.


Valoarea calculată se compară cu cea tabelară stabilită probabilistic pentru
un nivel de semnificaţie P = 1 − α / 2 şi cu n-2 grade de libertate.
Dacă t calculat > t tabelar se verifică ipoteza semnificaţiei relaţiei de corelaţie
B B B B

şi dacă t calculat < t tabelar legătura este nesemnificativă şi trebuie căutat un alt factor
B B B B

esenţial cu care să se studieze corelaţia.

137
Raportul de corelaţie
În cazul în care dispunem de un număr mic de perechi de valori (xi, yi): B B

∑ (y )
n

∑ (Y )
n
2
xi −y
2
i − Yx i
i =1
Ry / x = i =1
n
sau Ry / x = 1 − n

∑ (y
i =1
i − y)
2
∑ (y
i =1
i − y)
2

unde Y x i reprezintă valorile ajustate indiferent de modelul de regresie


selectat.
Raportul de corelaţie poate lua valori de la zero la +1.
Dacă R y / x = ry / x se confirmă ipoteza legăturii liniare.
Pentru corelaţia neliniară, măsurarea gradului de intensitate a legăturii se
face numai prin raportul de corelaţie.

Corelaţia multiplă

Coeficientul de corelaţie multiplă

ry2/ x1 + ry2/ x 2 − 2 ry / x1 ry / x 2 rx1 x2


ry / x1 , x 2 = dacă rx1 , x 2 ≠ 0
1 − rx21 x2
şi
ry / x1 , x2 = ry2/ x1 + ry2/ x 2 dacă rx1 , x2 = 0

Raportul de corelaţie multiplă

∑ (y − Y )
n
2
i x1 , x 2 ,L, x n
i =1
R y / x1 , x 2 ,L, x n = 1 − n

∑ (y − y)
i =1
i
2

Corelaţie neparametrică
Coeficientul de asociere
Această metodă se utilizează pentru măsurarea intensităţii legăturii a două
caracteristici alternative prezentate într-un tabel de asociere de forma:
y y1
B B y2
B B Total
x
x1 B B a b a+b
x2 B B c d c+d
Total a+c b+d a+b+c+d

138
Produsul ad arată gradul de realizare a legăturii directe dintre X şi Y, iar
produsul bc gradul de legătură inversă între aceste două caracteristici cercetate.
Pentru stabilirea valorii numerice a coeficientului de asociere, care să indice
existenţa şi intensitatea unei legături, formula cea mai utilizată este cea propusă de
Yule:
ad − bc
Q=
ad + bc
Acest indicator poate să ia valori între -1 şi +1, arătând nu numai gradul
de intensitate al asocierii celor două caracteristici, dar şi sensul ei.
Coeficienul de corelaţie a rangurilor propus de Spearman
n
6 ∑d
i =1
i
2

rs = 1 − ,
n3 − n
în care:
di - reprezintă diferenţa între rangurile perechii de valori (xi,yi);
B B B B B B

n - numărul de perechi de valori.


Coeficientul de corelaţie a rangurilor propus de Kendall:
2⋅S
rk = ,
n ⋅ (n − 1)
n
în care S = ∑ (P − Q )
i =1
i i

unde:
Pi - numărul rangurilor mai mari care urmează rangului curent pentru
B B

variabila dependentă;
Qi - numărul rangurilor mai mici care urmează rangului curent pentru
B B

variabila dependentă.

139
4.2. PROBLEME REZOLVATE

Problema 1. Pentru 10 unităţi economice din acelaşi sector de activitate se


cunosc datele următoare:
Tabelul 4.1.
Capital fix Producţia
Nr. crt.
(mii RON) (mii RON)
A 1 2
1 140 80
2 90 50
3 110 60
4 220 120
5 80 40
6 60 30
7 130 70
8 100 60
9 150 90
10 200 110
Total 1280 710

Se cere:
1. să se argumenteze, cu ajutorul metodelor simple, existenţa, direcţia şi
forma legăturii;
2. să se determine parametrii funcţiei de regresie;
3. să se calculeze valorile funcţiei de regresie;
4. să se afle valoarea coeficientului de corelaţie.

Rezolvare
1. Dintre metodele simple de evidenţiere a legăturilor dintre variabile cele
mai indicate pentru acest exemplu sunt: metoda seriilor paralele interdependente şi
metoda grafică.
Metoda seriilor paralele interdependente presupune ordonarea valorilor
( xi ) ale caracteristicii factoriale (capitalul fix) şi înregistrarea în paralel a valorilor
( yi ) corespunzătoare ale caracteristicii dependente (producţie), după cum se poate
vedea în tabelul 4.2.
Cele două şiruri de date din tabelul 4.2. indică existenţa unei legături
directe între capitalul fix şi mărimea producţiei.

140
Tabelul 4.2.
Nr. xi (mii RON) yi (mii RON)
crt.
A 1 2
1 60 30
2 80 40
3 90 50
4 100 60
5 110 60
6 130 70
7 140 80
8 150 90
9 200 110
10 220 120

Pentru a putea aprecia şi forma legăturii este necesar să se traseze graficul


de corelaţie (figura 4.1.), care sugerează o legătură de tip liniar.
Producţie (mii RON)

140

120

100

80

60

40

20

0
0 50 100 150 200 250

Capital fix (mii RON)

Figura 4.1. Legătura dintre capitalul fix şi producţie

2. Aflarea parametrilor funcţiei liniare de regresie necesită rezolvarea


următorului sistem de ecuaţii normale:
⎧ n n



n a + b ∑
i =1
x i = ∑
i =1
yi
⎨ n n n
⎪a x + b x 2 =
⎪ ∑
⎩ i =1
i ∑
i =1
i ∑
i =1
xi yi

141
Calculele necesare rezolvării sistemului au fost sistematizate în tabelul
4.3., coloanele 3 şi 4.
Tabelul 4.3.
Nr. Yxi
xi yi xi2 xi yi yi2
crt.
0 1 2 3 4 5 6
1 60 30 3600 1800 900 32,6
2 80 40 6400 3200 1600 43,9
3 90 50 8100 4500 2500 49,6
4 100 60 10000 6000 3600 55,2
5 110 60 12100 6600 3600 60,9
6 130 70 16900 9100 4900 72,1
7 140 80 19600 11200 6400 77,8
8 150 90 22500 13500 8100 83,5
9 200 110 40000 22000 2100 111,7
10 220 120 48400 26400 4400 123
Total 1280 710 187600 104300 58100 710,3

Sistemul de ecuaţii normale este:


⎧10 a + 1280 b = 710
⎨ ,
⎩1280 a + 187600 b = 104300
cu soluţiile:
a = −1,32
b = 0,565
Ecuaţia medie de estimare a legăturii liniare dintre capitalul fix şi
producţie este:
Yxi = −1,32 + 0,565 xi

La o creştere cu o mie de lei noi (RON) a capitalului fix, producţia se


măreşte, în medie, cu 0,565 mii RON.

3. Valorile ajustate ale producţiei se calculează înlocuind fiecare variantă


( xi ) a caracteristicii factoriale în funcţia de regresie (vezi tabelul 4.2., coloana 6).

Yx1 = −1,32 + 0,565 ⋅ 60 = 32,6


M
Yx10 = −1,32 + 0,565 ⋅ 220 = 123

142
4. Coeficientul de corelaţie liniară simplă este:

n n n
n ∑
i =1
xi yi − ∑ ∑y
i =1
xi
i =1
i
ry / x = =
⎡ n ⎛ n ⎞
2
⎤⎡ n ⎛ n ⎞ ⎤
2


⎢n xi2 − ⎜ xi
⎢ i =1 ⎜ ∑
⎝ i =1


⎠ ⎥ ⎢ i =1

⎥ ⎢n yi − ⎜ yi ⎟ ⎥
2
⎜ ⎟
⎝ i =1 ⎠ ⎥⎦

⎣ ⎦⎣

10 ⋅ 104300 − 1280 ⋅ 710


= = 0,9928
(10 ⋅ 187600 − 1638400 )(10 ⋅ 58100 − 504100 )
Acest rezultat arată o legătură directă foarte puternică, aproape
funcţională, între variabilele înregistrate.

Problema 2. Numărul mediu de angajaţi şi profitul anual înregistrat de 10


firme dintr-o subramură industrială se prezintă astfel:
Tabelul 4.4.
Număr mediu de Profit anual
Nr. crt.
angajaţi (persoane) (mii RON)
0 1 2
1 13 115
2 4 45
3 12 100
4 5 50
5 6 55
6 8 85
7 3 40
8 4 50
9 5 45
10 7 70
Total 67 655

Se cere:
1. să se analizeze existenţa, direcţia şi forma legăturii;
2. să se determine parametrii funcţiei de regresie;
3. să se calculeze valorile funcţiei de regresie;
4. să se măsoare intensitatea corelaţiei dintre cele două variabile folosind
coeficientul şi raportul de corelaţie.

143
Rezolvare

1. În relaţia dintre cele două variabile factorul de influenţă este numărul


mediu de angajaţi (x ) , iar variabila rezultativă este mărimea profitului ( y ) .
Dintre metodele simple de evidenţiere a corelaţiei dintre două variabile am
ales metoda grafică, aceasta oferind cele mai multe informaţii.
Din figura 4.2. reiese că între numărul de angajaţi şi mărimea profitului
există o legătură directă, de tip liniar.

140
Profit anual (mii RON)

120

100

80

60

40

20

0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Număr mediu angajaţi (persoane)

Figura 4.2. Legătura dintre numărul mediu de angajaţi şi valoarea profitului

2. Sistemul de ecuaţii normale necesar pentru aflarea parametrilor a şi b


ai funcţiei liniare este:
⎧⎪n a + b xi =∑ yi ∑

∑ 2
⎪⎩a xi + b xi = ∑ ∑x y i i

Folosind rezultatele calculelor intermediare prezentate în tabelul 4.5


(coloanele 1 - 4), se obţine sistemul:
⎧10 a + 67 b = 655 a = 15,2017
⎨ , cu soluţiile:
⎩67 a + 553b = 5170 b = 7 ,5072

3. Valorile teoretice ale profitului ( Yxi ) se vor calcula înlocuind fiecare


valoare ( xi ) a variabilei factoriale în funcţia de regresie:

Yxi = 15,2017 + 7 ,5072 xi

144
Rezultatele calculelor efectuate sunt prezentate în tabelul nr. 4.5., coloana 6.

Tabelul 4.5.
Nr.
crt.
xi yi xi yi xi2 yi2 Yxi (y − Y )
i xi
2

0 1 2 3 4 5 6 7
1 13 115 1.495 169 13.225 112,80 4,86
2 4 45 180 16 2.025 45,23 0,05
3 12 100 1.200 144 10.000 105,29 27,96
4 5 50 250 25 2.500 52,74 7,50
5 6 55 330 36 3.025 60,24 27,51
6 8 85 680 64 7.225 75,26 94,88
7 3 40 120 9 1.600 37,72 5,18
8 4 50 200 16 2.500 45,23 22,75
9 5 45 225 25 2.025 52,74 59,87
10 7 70 490 49 4.900 67,75 5,05
Total 67 655 5.170 553 49.025 655,00 225,62

4. Calculele efectuate pentru determinarea parametrilor a şi b ai funcţiei


liniare de regresie (tabelul 4.5.) pot fi utilizate şi pentru aplicarea formulei de
calcul simplificat a coeficientului de corelaţie:
n n n
n ∑
i =1
xi yi − ∑ ∑y
i =1
xi
i =1
i
ry / x = =
⎡ n ⎛ n ⎞ ⎤⎡ n 2 ⎛ n
2
⎞ ⎤
2


⎢ i =1 ⎜ ⎟ ∑
⎢n xi − ⎜ xi ⎟ ⎥ ⎢n yi − ⎜ yi ⎟ ⎥
2

⎝ i =1 ⎠ ⎥⎦ ⎢⎣ i =1
⎜ ⎟
⎝ i =1 ⎠ ⎥⎦
∑ ∑

10 ⋅ 5170 − 67 ⋅ 655
= = 0,9789
[ ][
10 ⋅ 553 − 67 2 10 ⋅ 49025 − 655 2 ]
Această valoare apropiată de 1 indică o legătură foarte puternică între cele
două variabile.
Raportul de corelaţie se determină cu formula:

∑ (y − Y )
n
2
i xi
i =1
Ry x = 1− n
,
∑ ( yi − y )2
i =1
n

∑y
i =1
i
655
unde y= = = 65,5 mii RON/angajat
n 10

145
Utilizând datele din tabelul 4.5., calculăm:
255,62
Ry x = 1 − = 0,9789
6122,50
Coeficientul şi raportul de corelaţie au valori egale, ceea ce confirmă
liniaritatea legăturii.

Problema 3. Se cunosc următoarele date pentru zece firme:


Tabelul 4.6
Producţie Număr de salariaţi (mii Capital fix
(mii tone) pers.) (mil. RON)
10 1,1 2,0
12 1,3 2,1
14 1,4 2,2
16 1,2 2,3
17 1,5 2,3
20 1,7 2,1
20 1,9 2,3
21 1,9 2,4
22 2,0 2,4
23 2,1 2,5
Se cere:
1. dacă legătura dintre variabile este liniară, să se estimeze parametrii
modelului elaborat;
2. să se testeze semnificaţia parametrilor modelului şi a modelului liniar;
3. să se calculeze valorile ajustate pentru caracteristica rezultativă, pe
baza modelului validat.

Rezolvare
Se notează cu y – producţia; x1 – numărul de salariaţi; x2 – capitalul fix.
B B B B

Modelul de regresie considerat are forma y = a + bx1 + cx2

Rezolvare folosind EXCEL:


• Se introduc datele din tabelul 4.6 într-o foaie de calcul Excel;
• Se selectează din meniu Tools – Data Analysis – Regression;
• În fereastra de dialog se introduce la Input Y Range câmpul A1:A11
reprezentând valorile variabilei dependente (producţia); la Input X
Range se selectează câmpurile B1:C11, reprezentând valorile
variabilelor independente (salariaţi şi capital fix). Se bifează Labels;
• Calculele sunt realizate pentru un prag de semnificaţie de 0,05. Dacă
se doreşte modificarea pragului se bifează Confidence Level şi se
modifică valoarea;

146
• Dacă se doreşte şi obţinerea valorilor reziduale ( yi − yˆi ) , se bifează
Residuals. Tastaţi OK.

Se obţin rezultatele:

SUMMARY OUTPUT

Regression Statistics
Multiple R 0.950237502
R Square 0.902951309
Adjusted R Square 0.875223112
Standard Error 1.564293263
Observations 10

ANOVA
df SS MS FSignificance
F
Regression 2 159.3709061 79.68545 32.56437 0.00028475
Residual 7 17.12909389 2.447013
Total 9 176.5

Coefficients Standard t Stat P-value Lower 95% Upper 95%


Error
Intercept -12.69677948 9.033681838 -1.40549 0.202671 -34.0580273 8.6644684
Numar de 9.388646288 2.233077646 4.204353 0.004014 4.108260507 14.669032
salariaţi
Capital fix 6.673034934 5.057545859 1.319422 0.228544 -5.2861521 18.632222

RESIDUAL OUTPUT

Observation Predicted Productie Residuals


1 10.97680131 -0.9768013
2 13.52183406 -1.5218340
3 15.12800218 -1.1280021
4 13.91757642 2.08242358
5 16.73417031 0.26582969
6 17.27729258 2.72270742
7 20.48962882 -0.4896288
8 21.15693231 -0.1569323
9 22.09579694 -0.095796
10 23.70196507 -0.701965

147
Interpretarea rezultatelor:
¾ Raportul de corelaţie multiplă R y / x1 , x2 (Multiple R) este 0,950. Arată o
legătură foarte puternică între variabile.
¾ Coeficientul de determinaţie R2 (R Square) are valoarea 0,903. Cu cât
P P

este mai apropiat de 1 cu atât partea din variaţia lui y explicată de x1 şi


B B

x2 este mai mare şi deci intensitatea legăturii dintre variabile este mai
B B

puternică. În acest exemplu putem spune că 90,3% din variaţia


producţiei este explicată de variaţia numărului de salariaţi şi a
capitalului fix, variabilele factoriale incluse în model.
¾ Eroarea standard (Standard Error) este 1,564. Dacă această valoare ar
fi nulă, toate punctele observate s-ar afla pe dreapta de regresie,
aşadar e de dorit ca eroarea standard să fie cât mai apropiată de zero.
În cazul nostru, condiţia este îndeplinită.
¾ Analiza dispersională pentru validarea modelului se regăseşte în
tabelul ANOVA: varianţa explicată prin model (Regression), varianţa
neexplicată (Residual) şi varianţa totală (Total), pentru fiecare fiind
calculate numărul gradelor de libertate, suma pătratelor şi dispersia.
¾ Pentru a verifica, din punct de vedere statistic, modalitatea în care
modelul specificat reuşeşte să conducă la reconstituirea valorilor
empirice prin valorile teoretice, se foloseşte testul F. În cazul nostru,
valoarea calculată de 32,56 este semnificativă, deci modelul este
validat ca fiind acceptabil;
¾ Ecuaţia modelului este: y = −12,697 + 9,389 xi + 6 ,673 x2 :
- Intercept reprezintă termenul liber (coeficientul a), care este egal
cu –12,697. Aceasta reprezintă valoarea variabilei dependente y
când toate variabilele explicative sunt nule. Astfel, producţia care
s-ar obţine dacă nu ar fi nici un salariat şi capitalul fix ar fi zero,
este –12,697 mii tone. Desigur că în acest caz, nu are nici o
semnificaţie;
- Coeficientul b are valoarea 9,389 (pozitiv, deci legătura e
directă), ceea ce înseamnă că la creşterea cu o mie de persoane a
numărului de salariaţi, producţia va creşte cu 9,389 mii tone;
- Coeficientul c are valoarea 6,673, ceea ce înseamnă că la
creşterea cu un milion de lei a capitalului fix, producţia va creşte
cu 6,673 mii tone;
¾ În cazul în care a fost selectat Residuals, sunt calculate şi valorile
previzionate ( yˆi ) , în cazul nostru Predicted Producţie, pe baza
modelului de regresie validat.

148
Problema 4. Cele 10 magazine de acelaşi profil dintr-o localitate se
caracterizează prin următoarele date:
Tabelul 4.7
Desfaceri 52 60 74 20 25 34 49 38 45 12
(mii RON)
Suprafaţă 41 38 72 16 21 22 23 21,5 32 15
(mp.)

Se cere să se măsoare legătura dintre cele două variabile folosind metode


neparametrice.

Rezolvare
În vederea aplicării metodei corelaţiei vom ordona crescător valorile
caracteristicii factoriale X (suprafaţă), trecând într-o coloană alăturată valorile
corespunzătoare ale caracteristicii dependente Y (desfaceri), după cum se poate
vedea în tabelul următor, coloanele 1 şi 2. Vom acorda câte un rang fiecăruia din
cele 10 magazine, în funcţie de mărimea suprafeţei comerciale
(coloana 3) şi nivelul desfacerilor (coloana 4) şi vom măsura diferenţele dintre
cele două ranguri. Aceste diferenţe vor fi ridicate la pătrat (coloana 5), suma lor
urmând a fi folosită pentru calcularea coeficientului Spearman de corelaţie a
rangurilor:
n
6 ∑di =1
i
2

= 1−
n(n − 1)
rS 2
,

unde: d i - diferenţa de rang pentru unitatea i ( di = Rxi − Ryi );


n - numărul observaţiilor.
Se obţine rS = 0,9636 (legătură puternică).
Tabelul 4.8
xi yi Rxi R yi d i2 Pi Qi
1 2 3 4 5 6 7
15 12 1 1 0 9 0
16 20 2 2 0 8 0
21 25 3 3 0 7 0
21,5 38 4 5 1 5 1
22 34 5 4 1 5 0
23 49 6 7 1 3 1
32 45 7 6 1 3 0
38 60 8 9 1 1 1
41 52 9 8 1 1 0
72 74 10 10 0 0 0
Total - - - 6 42 3

149
Pentru a calcula coeficientul Kendall de corelaţie a rangurilor vom
stabili pentru fiecare magazin i în parte numărul total de magazine care au un nivel
superior (coloana 6), respectiv inferior (coloana 7) al desfacerilor. Pentru aceasta
vom număra rangurile superioare (respectiv inferioare) R y care apar după rândul
corespunzător magazinului i până la sfârşitul tabelului. De exemplu, magazinul cu
desfaceri de 49 mii RON are rangul 7 după desfaceri. Dintre cele patru magazine
înscrise pe rândurile următoare, 3 au ranguri R y superioare şi unul are rang R y
inferior. Este obligatoriu ca rangurile Rx să fie ordonate crescător. Folosind
totalurile din coloanele 6 şi 7 putem calcula coeficientul Kendall:
⎛ n n

∑ ∑
2 ⋅ ⎜⎜ Pi − Qi ⎟⎟
rk = ⎝ i =1 i =1 ⎠, rk = 0,87
n (n − 1)
Datele din tabelul iniţial pot fi folosite pentru a construi un tabel de
asociere. Pentru aceasta am calculat valoarea medie a desfacerilor (41 mii RON)
şi suprafaţa medie a unui magazin (30 mp) şi am transformat cele două variabile
analizate în caracteristici alternative prin restrângerea celor 10 înregistrări în două
grupe: valori sub medie, respectiv peste medie.
Tabelul 4.9
Desfaceri
Suprafaţă
(mii RON)
(mp)
sub 41 peste 41
A 1 2
sub 30 5 1
peste 30 0 4

Pentru a aprecia intensitatea legăturii se foloseşte coeficientul de asociere,


calculat cu relaţia:
a d − b c 5 ⋅ 4 − 1⋅ 0
Q= = , Q=1
a d + b c 5 ⋅ 4 + 1⋅0

150
4.3. PROBLEME PROPUSE

Problema 1. Pentru cei 8 muncitori dintr-o secţie a unei unităţi economice


s-au înregistrat următoarele date:
Tabelul 4.10
Vechime (ani) 3 6 4 5 2 5 4 1
Producţie
22 30 20 25 18 26 22 19
(buc.)
Se cere:
1. să se reprezinte grafic datele şi să se aleagă funcţia de regresie
potrivită;
2. să se determine parametrii funcţiei de regresie;
3. să se interpreteze din punct de vedere economic coeficientul de
regresie;
4. să se calculeze coeficientul de corelaţie.

Rezolvare
1. Reprezentare grafică: corelograma (figura 4.3.).

35
Producţie (buc.)

30

25

20

15

10

0
0 1 2 3 4 5 6 7 8
Vechime (ani)

Figura 4.3. Legătura dintre vechime şi producţe

2. Aflarea parametrilor funcţiei liniare de regresie necesită rezolvarea


următorului sistem de ecuaţii normale:

151
⎧ n n



⎪n a + b xi =
i =1

i =1
yi
⎨ n n n
⎪a x + b x 2 =
⎪ ∑
⎩ i =1
i
i =1
∑i
i =1
∑xi yi

Elementele necesare rezolvării sistemului se înscriu în tabelul 4.11,


coloanele 1-4.

Tabelul 4.11
Nr. Yxi
xi yi xi2 xi yi yi2
crt.
0 1 2 3 4 5 6
1 3 22
2 6 30
3 4 20
4 5 25
5 2 18
6 5 26
7 4 22
8 1 19
Total

Sistemul de ecuaţii normale devine:

⎧8 a + ............. b = .............
⎨ ,
⎩...... a + .......... b = ............

cu soluţia:
a = ..............
b = ..............
3. Interpretarea coeficientului de regresie

4. Coeficientul de corelaţie liniară simplă este:


n n n
n ∑
i =1
xi yi − ∑ ∑y
i =1
xi
i =1
i
ry / x = =
⎡ n ⎛ n ⎞
2
⎤⎡ n ⎛ n ⎞ ⎤
2


⎢n xi2 − ⎜ xi
⎢ i =1 ⎜
⎝ i =1
∑ ⎟

⎠ ⎥ ⎢ i =1

⎥ ⎢n yi − ⎜ yi ⎟ ⎥
2
⎜ ⎟
⎝ i =1 ⎠ ⎥⎦

⎣ ⎦⎣

152
R: 1. funcţie liniară; 2. Yi = 14,77 + 2,13 xi ; 3. pentru fiecare an
suplimentar de vechime, producţia unui muncitor creşte, în medie, cu 2,13 buc. 4.
0,8821.

Problema 2. Într-o firmă s-au înregistrat următoarele date:


Tabelul 4.12
Vechime (ani) 12 34 3 36 14 22 5 10
Salariu lunar
950 2100 700 2500 1400 1900 800 900
(RON)

Ştiind că legătura dintre cele două variabile este exprimată prin funcţia:
Yi = 507 ,48 + 47 ,266 xi se cere:
1. calculaţi raportul de corelaţie;
2. determinaţi în ce măsură influenţează vechimea salariului lunar;
3. estimaţi salariul lunar al unei persoane cu 20 ani vechime.

Rezolvare
1. Valorile teoretice ale salariului ( Yxi ) se vor calcula înlocuind fiecare
valoare a variabilei factoriale xi (vechime) în funcţia de regresie:
Yi = 507 ,48 + 47 ,266 xi .
Rezultatele calculelor se vor înscrie în tabelul 4.13, coloana 3.

Tabelul 4.13
Nr. crt. xi yi Yxi (y − Y )
i xi
2
( yi − y )2
0 1 2 3 4 5
1 12 950
2 34 2100
3 3 700
4 36 2500
5 14 1400
6 22 1900
7 5 800
8 10 900
Total

Raportul de corelaţie se determină cu formula:

153
∑ (y − Y )
n
2
i xi
i =1
Ry x = 1− n
,
∑ (y − y)
i =1
i
2

∑y
i =1
i
.................
unde y= = = ................
n 8
Utilizând datele din tabelul 4.13, calculăm:
....................
Ry x = 1 − = .........................
....................
2. Se calculează coeficientul de determinaţie:
R 2 = ( Ry x ) 2 = ......................
3. În funcţia de regresie se atribuie valoarea 20 variabilei factoriale
xi (vechime):
Yi = 507 ,48 + 47 ,266 ⋅ 20 = ............. .
R: 1. 0,971; 2. 0,9428 (salariul depinde în proporţie de 94,28% de
vechime); 3. 452,8 RON.

Problema 4. Se cunosc următoarele date privind comerţul exterior al


României cu ţările Uniunii Europene (UE15) în anul 2004:
Tabelul 4.14
Ţara Export (mil. euro) Import (mil. euro)
Austria 590 919
Belgia 374 393
Danemarca 42 93
Franţa 1608 1866
Finlanda 15 78
Germania 2832 3918
Grecia 507 355
Irlanda 31 128
Italia 4014 4515
Luxemburg 4 16
Olanda 603 488
Portugalia 37 78
Regatul Unit 1259 860
Spania 375 578
Suedia 107 280
Sursa: Anuarul statistic al României, 2005,INS.

154
Se cere să se calculeze coeficienţii de corelaţie a rangurilor Spearman şi
Kendall.

Rezolvare
Coeficientul de corelaţie a rangurilor Spearman se calculează cu formula:
n
6∑d i =1
i
2

= 1−
n (n − 1)
rS 2
,

unde di reprezintă diferenţa de rang dintre export şi import pentru aceeaşi


B B

ţară i.
Pentru calcularea coeficientului Kendall se ordonează crescător ţările
Uniunii Europene după variabila x (export) înscriind în coloana alăturată rangurile
corespunzătoare după variabila y (import). Se determină apoi pentru fiecare ţară,
pe baza rangurilor la import:
Pi - numărul de ţări (de la rândul i până la sfârşitul seriei) având la import
B B

ranguri superioare rangului ţării i;


Qi - numărul de ţări (de la rândul i până la sfârşitul seriei) având la import
B B

ranguri inferioare rangului ţării i.

Tabelul 4.15
Ţara Rang după: Diferenţa de d i2 Pi Qi
xi yi
B B B B

xi yi rang (di)
B B

Luxemburg 1
Finlanda 2
Irlanda 3
Portugalia 4
Danemarca 5
Suedia 6
Belgia 7
Spania 8
Grecia 9
Austria 10
Olanda 11
Regatul 12
Unit
Franţa 13
Germania 14
Italia 15
Total -

155
Se determină apoi diferenţa:
n n
S= ∑
i =1
Pi − ∑Q
i =1
i = ........... .

Coeficientul Kendall este:


2⋅S 2 ⋅ ........
rK = = = .............
n ⋅ (n − 1) 15 ⋅ (15 − 1)

4.4. TEMĂ

Problema 1. Opt agenţi economici din acelaşi domeniu de activitate


au înregistrat următoarele realizări:
Tabelul 4.16
Cifra de afaceri
540 580 600 640 700 620 610 470
(mii RON)
Profit (mii RON) 47 59 52 56 64 58 50 40

Ştiind că legătura dintre cele două variabile are caracter liniar, măsuraţi
intensitatea acesteia prin intermediul:
1. raportului de corelaţie;
2. coeficientului de corelaţie;
3. coeficientului de corelaţie a rangurilor Spearman;
4. coeficientului de corelaţie a rangurilor Kendall.

R: 1. 0,8857;2. 0,8857; 3. 0,714; 4. 0,571.

Problema 2. La o firmă s-au înregistrat următoarele date privind costurile


de producţie şi profitul obţinut:
Tabelul 4.17
Costuri
90 30 100 50 45 110 70 55 20 15
(mii RON)
Profit (mii RON) 10 15 8 12 14 9 11 13 16 17
Măsuraţi intensitatea legăturii dintre cele două variabile cu ajutorul:
1. coeficientului şi raportului de corelaţie, dacă funcţia de regresie este
Y i = 17 , 687 − 0 , 089 x i ;
2. coeficientului de corelaţie a rangurilor Spearman;
3. coeficientului de corelaţie a rangurilor Kendall.

R: 1. – 0,9739 şi 0,9739; 2.– 0,9758; 3. – 0,9111.

156
Problema 3. Pentru cincisprezece firme din aceeaşi ramură s-au
înregistrat următoarele informaţii referitoare la o lună de activitate:
Tabelul 4.18
Nr. crt. Profit Nr. salariaţi Capital fix
(mii RON) (pers.) (mil. RON)
0 1 2 3
1 15 10 2,40
2 17 12 2,72
3 13 8 2,08
4 23 17 3,68
5 16 10 2,56
6 21 15 3,36
7 14 10 2,24
8 20 14 3,20
9 24 19 3,84
10 17 10 2,72
11 16 11 2,07
12 18 13 2,33
13 23 16 2,98
14 15 10 1,94
15 16 12 2,17
Considerând că variabila dependentă y este profitul,iar factorii de influenţă
sunt numărul de salariaţi ( x1 ) şi capitalul fix ( x2 ) să se determine folosind Excel:
1. funcţia de regresie multiplă care exprimă legătura dintre variabile;
2. intensitatea legăturilor simple între x1 şi y , x2 şi y , x1 şi x2 ;
3. valoarea raportului de corelaţie multiplă.

R: 1. Yx 1 x 2 = 3,53 + 0,84 x1 + 1,44 x2 ; 2. ry / x1 = 0,9684; ry / x 2 =0,9027;


rx1 / x 2 =0,8697; 3. R y/x1,x2=0,976
B B

157
4.5. INTREBĂRI RECAPITULATIVE
1. Prin ce se caracterizează legăturile statistice?
2. Prin ce se deosebesc legăturile statistice de alte tipuri de legături?
3. Ce înţelegeţi prin legătură simplă? Exemplificaţi.
4. Ce înţelegeţi prin legătură multiplă? Exemplificaţi.
5. Ce înţelegeţi prin legătură directă? Exemplificaţi.
6. Ce înţelegeţi prin legătură inversă? Exemplificaţi.
7. Ce înţelegeţi prin asociere statistică? Exemplificaţi.
8. Ce înţelegeţi prin corelaţie statistică? Exemplificaţi.
9. Ce metode simple se pot utiliza pentru verificarea existenţei legăturii?
10. Prin ce se reprezintă grafic legătura dintre două variabile statistice?
11. Ce se poate evidenţia cu ajutorul metodei grafice cu privire la
legăturile statistice?
12. Ce este un tabel de corelaţie?
13. Ce condiţii trebuie să îndeplinească un tabel de corelaţie pentru a
permite analiza legăturii între două variabile statistice?
14. Ce este un tabel de asociere?
15. Pentru ce se poate utiliza un tabel de asociere?
16. Pentru ce se utilizează metoda regresiei?
17. Care este semnificaţia statistică a parametrilor modelului liniar de
regresie?
18. Care este semnificaţia geometrică a parametrilor modelului liniar de
regresie?
19. Ce arată semnul coeficientului de regresie?
20. Prin ce se măsoară intensitatea legăturii liniare?
21. Ce semnificaţie are valoarea coeficientului de corelaţie?
22. Între ce limite ia valori coeficientul de corelaţie?
23. Ce semnificaţie are valoarea raportului de corelaţie?
24. Între ce limite ia valori raportul de corelaţie?
25. Ce indicator se poate calcula pe baza raportului de corelaţie?
26. Când se utilizează metodele neparametrice pentru analiza legăturilor
dintre variabilele statistice?
27. Care sunt cele mai utilizate metode neparametrice pentru analiza
legăturilor dintre variabilele statistice?
28. Când se utilizează coeficientul de asociere propus de Yule?
29. Ce înţelegeţi prin ranguri şi care sunt cei mai utilizaţi indicatori
calculaţi pe baza acestora?
30. Ce relaţie este între coeficienţii de asociere a rangurilor propuşi de
Spearman şi Kendall?

158

S-ar putea să vă placă și