Documente Academic
Documente Profesional
Documente Cultură
⎧ n n
⎪
⎪
na + b ∑
i =1
xi =
i =1
yi∑
⎨ n n n
⎪a x + b x 2 =
⎪ ∑
⎩ i =1
i
i =1
i∑ i =1
xi yi ∑
Dacă se foloseşte metoda determinanţilor se obţine:
n n
∑
i =1
yi ∑x i =1
i
n n n n n n
∑x y ∑x
i =1
i i
i =1
2
i ∑ ∑ yi xi2 − ∑ xi yi ∑x i
i =1 i =1 i =1 i =1
a= n
= 2
n
⎛ n ⎞
n ∑x i n ∑x 2
i ∑
− ⎜⎜ xi ⎟⎟
n
i =1
n
i =1 ⎝ i =1 ⎠
∑x ∑x
i =1
i
i =1
2
i
134
n
n ∑y
i =1
i
n n n n n
∑x ∑x y
i =1
i
i =1
i i n ∑ xi yi − ∑ ∑y xi i
i =1 i =1 i =1
b= n
= 2
n
⎛ n ⎞
n ∑x i n ∑x 2
i
− ⎜⎜ xi ⎟⎟∑
n
i =1
n
i =1 ⎝ i =1 ⎠
∑x ∑x
i =1
i
i =1
2
i
⎧ k k
⎪na + b xi ni =
⎪
∑ yi ni ∑ k
⎨ k
i =1
k
i =1
k
unde n= ∑n i
⎪a x n + b x 2 n =
⎪ ∑
⎩ i =1
i i
i =1
i i
i =1
xi yi ni ∑ ∑ i =1
∑
i =1
yi ni ∑ i =1
xi2 ni − ∑
i =1
xi yi ni ∑xn
i =1
i i
a= 2
k
⎛ k ⎞
n ∑ i =1
xi2 ni − ⎜⎜ xi ni ⎟⎟
⎝ i =1 ⎠
∑
k k k
n ∑
i =1
xi yi ni − ∑i =1
xi ni ∑yn
i =1
i i
b= 2
k
⎛ k ⎞
n ∑
i =1
xi2 ni
⎝ i =1
∑
− ⎜⎜ xi ni ⎟⎟
⎠
În cazul sistematizării datelor într-un tabel cu dublă intrare în care
perechile de valori (xi, yj) se repetă de nij ori:
B B B B B B
⎧ k m
⎪ na + b ∑ x n
i i. = ∑ y j n. j
⎪ i =1 j =1
⎨ k k k m
⎪a x n + b x 2 n =
∑
⎪⎩ i =1 i i. ∑i =1
i i. ∑∑
i =1 j =1
x i y j nij
unde:
k k k m
n = ∑ ni. = ∑ n. j = ∑∑ nij
i =1 j =1 i =1 j =1
135
k m k m m k
∑∑ x y n
i =1 j =1
i j ij = ∑ xi ∑ y j nij = ∑ y j ∑ xi nij
i =1 j =1 j =1 i =1
∑j =1
y j n. j ∑
i =1
xi2 ni. − ∑∑
i =1 j =1
xi y j nij ∑x n
i =1
i i.
a= 2
k
⎛ k ⎞
n ∑
i =1
xi2 ni.
⎝ i =1
∑
− ⎜⎜ xi ni. ⎟⎟
⎠
k m k m
n ∑∑
i =1 j =1
xi y j nij − ∑
i =1
xi ni. ∑y n
j =1
j .j
b= 2
k
⎛ k ⎞
n ∑x ni =1
2
i i. ∑
− ⎜⎜ xi ni. ⎟⎟
⎝ i =1 ⎠
Regresia multiplă
Modelul liniar
Yx1 , x 2 ,..., x n = a0 + a1 x1 + a2 x2 + ... + an xn
în care:
a0 - reprezintă parametrul care exprimă factorii neînregistraţi, consideraţi
B B
interdependenţă.
Parametrii a1,a2, ... ,an se determină din sistemul de ecuaţii normale:
B B B B B B
136
Metoda corelaţiei
Corelaţia simplă
Covarianţa (cov(x,y))
n
∑ (x − x )( y − y )
i =1
i i
cov( x, y ) =
n
Coeficientul de corelaţie
Se foloseşte pentru măsurarea intensitatea legăturii liniare dintre două
variabile statisice.
În cazul în care dispunem de un număr mic de perechi de valori (xi, yi): B B B B
∑ (x − x )( y − y )
i =1
i i
ry / x =
nσ xσ y
Coeficientul de corelaţie liniară simplă poate să ia valori între -1 şi +1.
Între -1 şi 0, legătura dintre cele două variabile este de sens invers şi este
cu atât mai intensă, cu cât se apropie de –1.
Între 0 şi +1, legătura dintre cele două variabile este directă şi este cu atât
mai intensă, cu cât se apropie de 1.
Formulă de calcul simplificat:
n n n
n ∑
i =1
xi yi − ∑ ∑y
i =1
xi
i =1
i
ry / x =
⎡ n ⎛ n ⎞
2
⎤⎡ n ⎛ n ⎞ ⎤
2
∑
⎢n xi2 − ⎜ xi
⎢ i =1 ⎜
⎝ i =1
∑ ⎟
⎟
⎠ ⎥ ⎢ i =1
∑
⎥ ⎢n yi2 − ⎜ yi ⎟ ⎥
⎜ ⎟
⎝ i =1 ⎠ ⎥⎦
∑
⎣ ⎦⎣
Dacă s-a utilizat coeficientul de corelaţie liniară simplă, pentru testarea
semnificaţiei legăturii, se aplică cel mai frecvent testul t:
ry / x
t= ⋅ n−2 ,
1 − ry2/ x
şi dacă t calculat < t tabelar legătura este nesemnificativă şi trebuie căutat un alt factor
B B B B
137
Raportul de corelaţie
În cazul în care dispunem de un număr mic de perechi de valori (xi, yi): B B
∑ (y )
n
∑ (Y )
n
2
xi −y
2
i − Yx i
i =1
Ry / x = i =1
n
sau Ry / x = 1 − n
∑ (y
i =1
i − y)
2
∑ (y
i =1
i − y)
2
Corelaţia multiplă
∑ (y − Y )
n
2
i x1 , x 2 ,L, x n
i =1
R y / x1 , x 2 ,L, x n = 1 − n
∑ (y − y)
i =1
i
2
Corelaţie neparametrică
Coeficientul de asociere
Această metodă se utilizează pentru măsurarea intensităţii legăturii a două
caracteristici alternative prezentate într-un tabel de asociere de forma:
y y1
B B y2
B B Total
x
x1 B B a b a+b
x2 B B c d c+d
Total a+c b+d a+b+c+d
138
Produsul ad arată gradul de realizare a legăturii directe dintre X şi Y, iar
produsul bc gradul de legătură inversă între aceste două caracteristici cercetate.
Pentru stabilirea valorii numerice a coeficientului de asociere, care să indice
existenţa şi intensitatea unei legături, formula cea mai utilizată este cea propusă de
Yule:
ad − bc
Q=
ad + bc
Acest indicator poate să ia valori între -1 şi +1, arătând nu numai gradul
de intensitate al asocierii celor două caracteristici, dar şi sensul ei.
Coeficienul de corelaţie a rangurilor propus de Spearman
n
6 ∑d
i =1
i
2
rs = 1 − ,
n3 − n
în care:
di - reprezintă diferenţa între rangurile perechii de valori (xi,yi);
B B B B B B
unde:
Pi - numărul rangurilor mai mari care urmează rangului curent pentru
B B
variabila dependentă;
Qi - numărul rangurilor mai mici care urmează rangului curent pentru
B B
variabila dependentă.
139
4.2. PROBLEME REZOLVATE
Se cere:
1. să se argumenteze, cu ajutorul metodelor simple, existenţa, direcţia şi
forma legăturii;
2. să se determine parametrii funcţiei de regresie;
3. să se calculeze valorile funcţiei de regresie;
4. să se afle valoarea coeficientului de corelaţie.
Rezolvare
1. Dintre metodele simple de evidenţiere a legăturilor dintre variabile cele
mai indicate pentru acest exemplu sunt: metoda seriilor paralele interdependente şi
metoda grafică.
Metoda seriilor paralele interdependente presupune ordonarea valorilor
( xi ) ale caracteristicii factoriale (capitalul fix) şi înregistrarea în paralel a valorilor
( yi ) corespunzătoare ale caracteristicii dependente (producţie), după cum se poate
vedea în tabelul 4.2.
Cele două şiruri de date din tabelul 4.2. indică existenţa unei legături
directe între capitalul fix şi mărimea producţiei.
140
Tabelul 4.2.
Nr. xi (mii RON) yi (mii RON)
crt.
A 1 2
1 60 30
2 80 40
3 90 50
4 100 60
5 110 60
6 130 70
7 140 80
8 150 90
9 200 110
10 220 120
140
120
100
80
60
40
20
0
0 50 100 150 200 250
⎪
⎪
n a + b ∑
i =1
x i = ∑
i =1
yi
⎨ n n n
⎪a x + b x 2 =
⎪ ∑
⎩ i =1
i ∑
i =1
i ∑
i =1
xi yi
141
Calculele necesare rezolvării sistemului au fost sistematizate în tabelul
4.3., coloanele 3 şi 4.
Tabelul 4.3.
Nr. Yxi
xi yi xi2 xi yi yi2
crt.
0 1 2 3 4 5 6
1 60 30 3600 1800 900 32,6
2 80 40 6400 3200 1600 43,9
3 90 50 8100 4500 2500 49,6
4 100 60 10000 6000 3600 55,2
5 110 60 12100 6600 3600 60,9
6 130 70 16900 9100 4900 72,1
7 140 80 19600 11200 6400 77,8
8 150 90 22500 13500 8100 83,5
9 200 110 40000 22000 2100 111,7
10 220 120 48400 26400 4400 123
Total 1280 710 187600 104300 58100 710,3
142
4. Coeficientul de corelaţie liniară simplă este:
n n n
n ∑
i =1
xi yi − ∑ ∑y
i =1
xi
i =1
i
ry / x = =
⎡ n ⎛ n ⎞
2
⎤⎡ n ⎛ n ⎞ ⎤
2
∑
⎢n xi2 − ⎜ xi
⎢ i =1 ⎜ ∑
⎝ i =1
⎟
⎟
⎠ ⎥ ⎢ i =1
∑
⎥ ⎢n yi − ⎜ yi ⎟ ⎥
2
⎜ ⎟
⎝ i =1 ⎠ ⎥⎦
∑
⎣ ⎦⎣
Se cere:
1. să se analizeze existenţa, direcţia şi forma legăturii;
2. să se determine parametrii funcţiei de regresie;
3. să se calculeze valorile funcţiei de regresie;
4. să se măsoare intensitatea corelaţiei dintre cele două variabile folosind
coeficientul şi raportul de corelaţie.
143
Rezolvare
140
Profit anual (mii RON)
120
100
80
60
40
20
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
144
Rezultatele calculelor efectuate sunt prezentate în tabelul nr. 4.5., coloana 6.
Tabelul 4.5.
Nr.
crt.
xi yi xi yi xi2 yi2 Yxi (y − Y )
i xi
2
0 1 2 3 4 5 6 7
1 13 115 1.495 169 13.225 112,80 4,86
2 4 45 180 16 2.025 45,23 0,05
3 12 100 1.200 144 10.000 105,29 27,96
4 5 50 250 25 2.500 52,74 7,50
5 6 55 330 36 3.025 60,24 27,51
6 8 85 680 64 7.225 75,26 94,88
7 3 40 120 9 1.600 37,72 5,18
8 4 50 200 16 2.500 45,23 22,75
9 5 45 225 25 2.025 52,74 59,87
10 7 70 490 49 4.900 67,75 5,05
Total 67 655 5.170 553 49.025 655,00 225,62
∑
⎢ i =1 ⎜ ⎟ ∑
⎢n xi − ⎜ xi ⎟ ⎥ ⎢n yi − ⎜ yi ⎟ ⎥
2
⎝ i =1 ⎠ ⎥⎦ ⎢⎣ i =1
⎜ ⎟
⎝ i =1 ⎠ ⎥⎦
∑ ∑
⎣
10 ⋅ 5170 − 67 ⋅ 655
= = 0,9789
[ ][
10 ⋅ 553 − 67 2 10 ⋅ 49025 − 655 2 ]
Această valoare apropiată de 1 indică o legătură foarte puternică între cele
două variabile.
Raportul de corelaţie se determină cu formula:
∑ (y − Y )
n
2
i xi
i =1
Ry x = 1− n
,
∑ ( yi − y )2
i =1
n
∑y
i =1
i
655
unde y= = = 65,5 mii RON/angajat
n 10
145
Utilizând datele din tabelul 4.5., calculăm:
255,62
Ry x = 1 − = 0,9789
6122,50
Coeficientul şi raportul de corelaţie au valori egale, ceea ce confirmă
liniaritatea legăturii.
Rezolvare
Se notează cu y – producţia; x1 – numărul de salariaţi; x2 – capitalul fix.
B B B B
146
• Dacă se doreşte şi obţinerea valorilor reziduale ( yi − yˆi ) , se bifează
Residuals. Tastaţi OK.
Se obţin rezultatele:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.950237502
R Square 0.902951309
Adjusted R Square 0.875223112
Standard Error 1.564293263
Observations 10
ANOVA
df SS MS FSignificance
F
Regression 2 159.3709061 79.68545 32.56437 0.00028475
Residual 7 17.12909389 2.447013
Total 9 176.5
RESIDUAL OUTPUT
147
Interpretarea rezultatelor:
¾ Raportul de corelaţie multiplă R y / x1 , x2 (Multiple R) este 0,950. Arată o
legătură foarte puternică între variabile.
¾ Coeficientul de determinaţie R2 (R Square) are valoarea 0,903. Cu cât
P P
x2 este mai mare şi deci intensitatea legăturii dintre variabile este mai
B B
148
Problema 4. Cele 10 magazine de acelaşi profil dintr-o localitate se
caracterizează prin următoarele date:
Tabelul 4.7
Desfaceri 52 60 74 20 25 34 49 38 45 12
(mii RON)
Suprafaţă 41 38 72 16 21 22 23 21,5 32 15
(mp.)
Rezolvare
În vederea aplicării metodei corelaţiei vom ordona crescător valorile
caracteristicii factoriale X (suprafaţă), trecând într-o coloană alăturată valorile
corespunzătoare ale caracteristicii dependente Y (desfaceri), după cum se poate
vedea în tabelul următor, coloanele 1 şi 2. Vom acorda câte un rang fiecăruia din
cele 10 magazine, în funcţie de mărimea suprafeţei comerciale
(coloana 3) şi nivelul desfacerilor (coloana 4) şi vom măsura diferenţele dintre
cele două ranguri. Aceste diferenţe vor fi ridicate la pătrat (coloana 5), suma lor
urmând a fi folosită pentru calcularea coeficientului Spearman de corelaţie a
rangurilor:
n
6 ∑di =1
i
2
= 1−
n(n − 1)
rS 2
,
149
Pentru a calcula coeficientul Kendall de corelaţie a rangurilor vom
stabili pentru fiecare magazin i în parte numărul total de magazine care au un nivel
superior (coloana 6), respectiv inferior (coloana 7) al desfacerilor. Pentru aceasta
vom număra rangurile superioare (respectiv inferioare) R y care apar după rândul
corespunzător magazinului i până la sfârşitul tabelului. De exemplu, magazinul cu
desfaceri de 49 mii RON are rangul 7 după desfaceri. Dintre cele patru magazine
înscrise pe rândurile următoare, 3 au ranguri R y superioare şi unul are rang R y
inferior. Este obligatoriu ca rangurile Rx să fie ordonate crescător. Folosind
totalurile din coloanele 6 şi 7 putem calcula coeficientul Kendall:
⎛ n n
⎞
∑ ∑
2 ⋅ ⎜⎜ Pi − Qi ⎟⎟
rk = ⎝ i =1 i =1 ⎠, rk = 0,87
n (n − 1)
Datele din tabelul iniţial pot fi folosite pentru a construi un tabel de
asociere. Pentru aceasta am calculat valoarea medie a desfacerilor (41 mii RON)
şi suprafaţa medie a unui magazin (30 mp) şi am transformat cele două variabile
analizate în caracteristici alternative prin restrângerea celor 10 înregistrări în două
grupe: valori sub medie, respectiv peste medie.
Tabelul 4.9
Desfaceri
Suprafaţă
(mii RON)
(mp)
sub 41 peste 41
A 1 2
sub 30 5 1
peste 30 0 4
150
4.3. PROBLEME PROPUSE
Rezolvare
1. Reprezentare grafică: corelograma (figura 4.3.).
35
Producţie (buc.)
30
25
20
15
10
0
0 1 2 3 4 5 6 7 8
Vechime (ani)
151
⎧ n n
⎪
∑
⎪n a + b xi =
i =1
∑
i =1
yi
⎨ n n n
⎪a x + b x 2 =
⎪ ∑
⎩ i =1
i
i =1
∑i
i =1
∑xi yi
Tabelul 4.11
Nr. Yxi
xi yi xi2 xi yi yi2
crt.
0 1 2 3 4 5 6
1 3 22
2 6 30
3 4 20
4 5 25
5 2 18
6 5 26
7 4 22
8 1 19
Total
⎧8 a + ............. b = .............
⎨ ,
⎩...... a + .......... b = ............
cu soluţia:
a = ..............
b = ..............
3. Interpretarea coeficientului de regresie
∑
⎢n xi2 − ⎜ xi
⎢ i =1 ⎜
⎝ i =1
∑ ⎟
⎟
⎠ ⎥ ⎢ i =1
∑
⎥ ⎢n yi − ⎜ yi ⎟ ⎥
2
⎜ ⎟
⎝ i =1 ⎠ ⎥⎦
∑
⎣ ⎦⎣
152
R: 1. funcţie liniară; 2. Yi = 14,77 + 2,13 xi ; 3. pentru fiecare an
suplimentar de vechime, producţia unui muncitor creşte, în medie, cu 2,13 buc. 4.
0,8821.
Ştiind că legătura dintre cele două variabile este exprimată prin funcţia:
Yi = 507 ,48 + 47 ,266 xi se cere:
1. calculaţi raportul de corelaţie;
2. determinaţi în ce măsură influenţează vechimea salariului lunar;
3. estimaţi salariul lunar al unei persoane cu 20 ani vechime.
Rezolvare
1. Valorile teoretice ale salariului ( Yxi ) se vor calcula înlocuind fiecare
valoare a variabilei factoriale xi (vechime) în funcţia de regresie:
Yi = 507 ,48 + 47 ,266 xi .
Rezultatele calculelor se vor înscrie în tabelul 4.13, coloana 3.
Tabelul 4.13
Nr. crt. xi yi Yxi (y − Y )
i xi
2
( yi − y )2
0 1 2 3 4 5
1 12 950
2 34 2100
3 3 700
4 36 2500
5 14 1400
6 22 1900
7 5 800
8 10 900
Total
153
∑ (y − Y )
n
2
i xi
i =1
Ry x = 1− n
,
∑ (y − y)
i =1
i
2
∑y
i =1
i
.................
unde y= = = ................
n 8
Utilizând datele din tabelul 4.13, calculăm:
....................
Ry x = 1 − = .........................
....................
2. Se calculează coeficientul de determinaţie:
R 2 = ( Ry x ) 2 = ......................
3. În funcţia de regresie se atribuie valoarea 20 variabilei factoriale
xi (vechime):
Yi = 507 ,48 + 47 ,266 ⋅ 20 = ............. .
R: 1. 0,971; 2. 0,9428 (salariul depinde în proporţie de 94,28% de
vechime); 3. 452,8 RON.
154
Se cere să se calculeze coeficienţii de corelaţie a rangurilor Spearman şi
Kendall.
Rezolvare
Coeficientul de corelaţie a rangurilor Spearman se calculează cu formula:
n
6∑d i =1
i
2
= 1−
n (n − 1)
rS 2
,
ţară i.
Pentru calcularea coeficientului Kendall se ordonează crescător ţările
Uniunii Europene după variabila x (export) înscriind în coloana alăturată rangurile
corespunzătoare după variabila y (import). Se determină apoi pentru fiecare ţară,
pe baza rangurilor la import:
Pi - numărul de ţări (de la rândul i până la sfârşitul seriei) având la import
B B
Tabelul 4.15
Ţara Rang după: Diferenţa de d i2 Pi Qi
xi yi
B B B B
xi yi rang (di)
B B
Luxemburg 1
Finlanda 2
Irlanda 3
Portugalia 4
Danemarca 5
Suedia 6
Belgia 7
Spania 8
Grecia 9
Austria 10
Olanda 11
Regatul 12
Unit
Franţa 13
Germania 14
Italia 15
Total -
155
Se determină apoi diferenţa:
n n
S= ∑
i =1
Pi − ∑Q
i =1
i = ........... .
4.4. TEMĂ
Ştiind că legătura dintre cele două variabile are caracter liniar, măsuraţi
intensitatea acesteia prin intermediul:
1. raportului de corelaţie;
2. coeficientului de corelaţie;
3. coeficientului de corelaţie a rangurilor Spearman;
4. coeficientului de corelaţie a rangurilor Kendall.
156
Problema 3. Pentru cincisprezece firme din aceeaşi ramură s-au
înregistrat următoarele informaţii referitoare la o lună de activitate:
Tabelul 4.18
Nr. crt. Profit Nr. salariaţi Capital fix
(mii RON) (pers.) (mil. RON)
0 1 2 3
1 15 10 2,40
2 17 12 2,72
3 13 8 2,08
4 23 17 3,68
5 16 10 2,56
6 21 15 3,36
7 14 10 2,24
8 20 14 3,20
9 24 19 3,84
10 17 10 2,72
11 16 11 2,07
12 18 13 2,33
13 23 16 2,98
14 15 10 1,94
15 16 12 2,17
Considerând că variabila dependentă y este profitul,iar factorii de influenţă
sunt numărul de salariaţi ( x1 ) şi capitalul fix ( x2 ) să se determine folosind Excel:
1. funcţia de regresie multiplă care exprimă legătura dintre variabile;
2. intensitatea legăturilor simple între x1 şi y , x2 şi y , x1 şi x2 ;
3. valoarea raportului de corelaţie multiplă.
157
4.5. INTREBĂRI RECAPITULATIVE
1. Prin ce se caracterizează legăturile statistice?
2. Prin ce se deosebesc legăturile statistice de alte tipuri de legături?
3. Ce înţelegeţi prin legătură simplă? Exemplificaţi.
4. Ce înţelegeţi prin legătură multiplă? Exemplificaţi.
5. Ce înţelegeţi prin legătură directă? Exemplificaţi.
6. Ce înţelegeţi prin legătură inversă? Exemplificaţi.
7. Ce înţelegeţi prin asociere statistică? Exemplificaţi.
8. Ce înţelegeţi prin corelaţie statistică? Exemplificaţi.
9. Ce metode simple se pot utiliza pentru verificarea existenţei legăturii?
10. Prin ce se reprezintă grafic legătura dintre două variabile statistice?
11. Ce se poate evidenţia cu ajutorul metodei grafice cu privire la
legăturile statistice?
12. Ce este un tabel de corelaţie?
13. Ce condiţii trebuie să îndeplinească un tabel de corelaţie pentru a
permite analiza legăturii între două variabile statistice?
14. Ce este un tabel de asociere?
15. Pentru ce se poate utiliza un tabel de asociere?
16. Pentru ce se utilizează metoda regresiei?
17. Care este semnificaţia statistică a parametrilor modelului liniar de
regresie?
18. Care este semnificaţia geometrică a parametrilor modelului liniar de
regresie?
19. Ce arată semnul coeficientului de regresie?
20. Prin ce se măsoară intensitatea legăturii liniare?
21. Ce semnificaţie are valoarea coeficientului de corelaţie?
22. Între ce limite ia valori coeficientul de corelaţie?
23. Ce semnificaţie are valoarea raportului de corelaţie?
24. Între ce limite ia valori raportul de corelaţie?
25. Ce indicator se poate calcula pe baza raportului de corelaţie?
26. Când se utilizează metodele neparametrice pentru analiza legăturilor
dintre variabilele statistice?
27. Care sunt cele mai utilizate metode neparametrice pentru analiza
legăturilor dintre variabilele statistice?
28. Când se utilizează coeficientul de asociere propus de Yule?
29. Ce înţelegeţi prin ranguri şi care sunt cei mai utilizaţi indicatori
calculaţi pe baza acestora?
30. Ce relaţie este între coeficienţii de asociere a rangurilor propuşi de
Spearman şi Kendall?
158