Sunteți pe pagina 1din 36

Parcurgnd acest capitol vei putea fi n stare s

rspundei la urmtoarele ntrebri:



Ce tipuri de legturi se stabilesc ntre fenomenele economice
si sociale?
Prin ce metode se pot analiza intensitatea acestor legturi
statistice?
Ce indicatori ai corelaiei neparametrice cunoatei?
Prezentai testul Hi-ptrat.
Prezentai comparativ coeficienii Kendall, Spearman,
Fechner.
Care este importana regresiei (liniar sau curbilinie) ntr-o
analiz statistic?
Care este metoda standard pentru determinarea dreptei de
regresie?
n ce fel se folosete programul EXCEL n determinarea
modelelor se regresie?
Cum se realizeaz estimarea nivelului unui fenomen
economic sau social folosind linia de regresie?








































Originea,
modelului statistic de analiz de regresie i corelaie se
afl n cercetrile lui Francis Galton (1822-1911) cu privire la
ereditatea membrilor unei familii. Mai apoi au adus
contribuii K. Pearson n corelaia pentru trei variabile,
G.U.Yule n corelaia multipl, Spearman i Kendal n
corelaia rangurilor precum i Mosteller i Tukey n corelaia
robust.

Concepte, noiuni n analiza de regresie i corelaie

Regresia,
exprim o legtur de tip statistic i anume regresia n
medie cu privire la comportamentul unor variabile.
Corelaia,
exprim raporturi reciproce ntre anumite caracteristici.
Covariaia,
exprim variaia simultan a dou variabile ntre care
exist dependen. Se msoar cu ajutorul covarianei.
Analiza de regresie,
este metoda statistic care permite studierea i msurarea,
relaiei dintre dou sau mai multe variabile, adic permite
estimarea valorilor unei variabile n funcie de o alt variabil
sau de mai multe.
Analiza de corelaie,
este metoda statistic prin care se msoar intensitatea
legturii dintre variabile, adic se evideniaz gradul de
influen a variabilei sau variabilelor factoriale asupra
variabilei rezultative.
Variabila factorial,
se mai numete independent, cauz, exogen, explicativ
se noteaz prin x
explic variaia altei variabile, celei rezultative.
Variabila rezultativ,
se mai numete dependent, efect, endogen, explicat
se noteaz prin y
Variabila reziduu,
sau eroarea de modelare, sintetizeaz influena tuturor
factorilor neinclui n model.
se noteaz prin e
Model de regresie,
este expresia matematic care exprim legtura dintre
variabile i care n forma cea mai general poate fi scris:
y = f ( x
1
, x
2
, x
3
, x
n
) + e

Tipuri de legturi statistice:

Dup numrul variabilelor corelate,
- legturi simple, exprim variaia variabilei rezultative y n
funcie de o singur variabil factorial x.
- legturi multiple, exprim variaia variabilei rezultative y
n funcie de variaia simultan a mai multor variabile
factoriale x.

Dup sensul legturii,
- legturi directe, care exprim modificarea variabilei y n
acelai sens cu variaia variabilei x.
- legturi inverse, care exprim modificarea variabilei y n
sens contrar cu variaia variabilei x.

Dup forma legturii,
- legturi liniare
- legturi curbilinii

Etape n analiza de regresie i corelaie
Identificarea existenei legturii, se face prin analiza
logic a posibilitii de existen a unei legturi ntre
variabilele analizate.
Stabilirea sensului i formei legturii prin metode
specifice analizei de regresie.
Determinarea gradului de intensitate a legturii cu
ajutorul indicatorilor parametrici sau neparametrici ai
intensitii corelaiei.


Metode de analiz a legturilor statistice

Se cunosc: - metode elementare
- metode analitice




Metode elementare

1. Metoda seriilor paralele interdependente:
const n compararea termenilor a dou serii ntre care se
presupune c exist legtur, interdependen.
se aplic n cazul seriilor cu un numr mic de variante.
cnd se compar dou serii de timp termenii acestora se
ordoneaz cronologic.
cnd se compar dou serii, de spaiu sau de frecvene,
termenii seriilor comparate se ordoneaz cresctor sau
descresctor dup variabila factorial x i se aliniaz
corespunztor seria dup variabila rezultativ z.
se pot ntlni urmtoarele situaii:
- dac variaia celor dou variabile este n acelai
sens, exist legtur direct.
- dac variaia acestora este n sens diferit, corelaia
este invers.
- Dac cele dou variabile variaz n mod
independent sau una rmne constant, nu exist
legtur.

Metoda se aplic aeznd datele dup urmtorul model:

x x
1
x
2
. x
i
. x
n
y y
1
y
2
. y
i
. y
n

Exemple:
Se cunosc urmtoarele date cu privire la cheltuielile cu
publicitatea i nivelul vnzrilor unei firme n ultimele luni
de activitate.
Tabelul nr.49
Cheltuieli cu
publicitatea
(mil.lei)
6 10 14 12 13,6 16
Nivelul
vnzrilor
(mld.lei)
10 50 140 90 120 180

7 8 9 13 14,8 15,6 17
24 30 54 110 150 160 190

Ordonm cresctor dup variabila factorial cheltuieli cu
publicitatea i aliniem corespunztor dup variabila
rezultativ nivelul vnzrilor.


Tabelul nr.50
x

6

7

8

9

1
0

1
2

1
3

1
3
,
6

1
4

1
4
,
8

1
5
,
6

1
6

1
7

y

1
0

2
4

3
0

5
4

5
0

9
0

1
1
0

1
2
0

1
4
0

1
5
0

1
6
0

1
8
0

1
9
0


Concluzie: cnd variabila factorial crete se nregistreaz o
cretere corespunztoare a variabilei rezultative deci ntre
cele dou exist legtur direct


Cu privire la numrul accidentelor rutiere i numrul
persoanelor alcoolice nregistrate n lunile iulie i august n
apte localiti ale unui jude se cunosc urmtoarele:

Tabelul nr.51
Nr.
alcoolici
( x )
14 19 27 34 41 47 51
Nr.
accidente
rutiere
( y )
8 10 13 15 16 21 37

Concluzie: legtur direct.

Se cunosc urmtoarele date cu privire la capitalul social (K)
i preul practicat (P) de apte firme productoare ale
aceluiai produs:

Tabelul nr.52
K(mil) 3 7 12 17 19 21 2
P (mii) 23 1 19 13 21 20 5

Concluzie: nu exist legtur.

2. Metoda gruprilor
const n gruparea valorilor variabilei factoriale x pe
intervale de variaie (cresctor sau descresctor) i
calcularea valorilor medii corespunztoare ale variabilei y.
Se urmrete variaia perechii de valori ( x
i
,
i
y ).
se aplic n cazul cnd cele dou variabile corelate
prezint un numr mare de variante.
metoda se aplic aeznd datele dup urmtorul model:


Tabelul nr.53
Variabila x grupat
pe intervale de
variaie
Frecvenele pe
grupe de variaie
Valoarea
medie a
variabilei y
pe grupe
dup x
x
0
- x
1
f
1
1
y

.
x
i-1
- x
i
f
i
i
y

.
x
n-1
- x
n
f
n
n
y

Total

i
i
f

y


Exemplu:
Printr-o sistematizare a datelor primare dintr-o firm s-a
obinut urmtoarea situaie cu privire la productivitatea
muncii i salariul celor 50 de angajai ai firmei.

Tabelul nr.54
Grupe de salariai
dup producia
realizat (buc)
Numr
de
angajai
Salariul mediu
al angajailor
pe grupe dup
prod. realizat
(mii lei)
9 14 3 731
14 19 9 810
19 24 12 1.100
24 29 11 1.370
29 34 9 1.530
34 - 39 6 1.717
Total 50 1.390

Concluzie: ntre cele dou variabile exist legtur direct.
Productivitatea muncii unui angajat influeneaz direct
salariul primit de acesta.

3. Metoda tabelului de corelaie
const n gruparea unitilor unei populaii simultan
dup ambele variabile corelate, dup cea factorial x i dup
cea rezultativ y
se recomand s se foloseasc gruparea pe intervale
egale i s se formeze aproximativ acelai numr de grupe
dup ambele variabile.
n funcie de modul de distribuie a frecvenelor f
ij
n
tabel se poate aprecia existena, direcia i intensitatea
legturii.
se pot ntlni urmtoarele situaii:
- dac frecvenele f
ij
sunt dispersate relativ
uniform pe toat suprafaa tabelului ntre variabilele
considerate nu exist legtur.
- cu ct frecvenele f
ij
se concentreaz mai mult n jurul
uneia din diagonalele tabelului (n funcie de aezarea
variabilelor n tabel), cu att corelaia este mai intens.
Metoda se aplic aeznd datele dup urmtorul model:


Tabelul nr.55
Grupe
Grupe dup y
dup x

y
1
.. y
j
.. y
m
Total uniti
pe grupe
(f
i
)
x
1
.
x
i
.
x
n
f
11
.. f
1j
.. f
1m
.
f
i1
.. f
ij
.. f
im

.
f
n1
.. f
nj
.. f
nm
f
1
.
f
i
.
f
n
Total uniti pe
subgrupe (f
j
)

f
1
f
j
f
m

= =
n
1 i
m
1 j
ij
f


4. Metoda grafic
const n reprezentarea grafic a perechilor de valori ale
variabilelor ntr-un sistem de axe de coordonate rezultnd un
grafic de corelaie numit corelogram sau nor de puncte.
prin aceast metod se stabilete existena, sensul, forma
i intensitatea legturii.
cele mai frecvente tipuri de corelogram sunt prezentate
n Figura nr.20.



Metode analitice
permit exprimarea matematic a formei legturii i
msurarea numeric a intensitii acesteia.
Se folosesc:
- metode neparamerice de apreciere i msurare a
intensitii legturilor dintre variabile (corelaia
neparametric).
- regresia i corelaia parametric.

Corelaia neparametric

se folosete pentru msurarea intensitii legturilor
statistice fr a ine seama de forma lor sau de parametrii
funciilor de modelare.
Cele mai largi aplicaii n cercetarea legturilor statistice
n acest sens sunt:
- Testul
2
al lui Pearson de verificare a existenei
legturii,
- Coeficientul de contingen al lui Pearson,
- Raportul de corelaie al lui Pearson,
- Coeficienii simplii de corelaie a rangurilor ai lui
Kendall i Spearmann
- Coeficientul generalizat de corelaie a rangurilor al lui
Kendall (pentru legturi multiple),
- Coeficientul lui Fechner (pentru concordana
semnelor),
- Coeficientul corelaiei informaionale al lui Octav
Onicescu

Figura nr.17 Modele de corelogram


Testul
2
al lui Pearson
Formula de calcul este urmtoarea:
( )


=
i j
ij
ij ij
c
f
f f
*
2
*
2


Unde:
f
ij
= frecvenele observate (din datele primare)
f
ij
*
= frecvenele calculate (dup modelul teoretic)
Se pornete de la presupunerea
*
ij ij 0
f f : H = (ipoteza nul)
sau (ipoteza complementar)
*
ij ij 1
f f : H
Valoarea Hi-ptrat astfel calculat se compar cu valoarea
tabelar a lui Hi-ptrat pentru o anumit probabilitate de eroare
() i numrul gradelor de libertate corespunztoare (g).
Cum definim gradele de libertate?






n acest caz numrul gradelor de libertate se stabilete dup
relaia:
g = ( m-1 ) ( n-1 )
Unde:
m = numrul de variante sau intervale dup caracteristica y
n = numrul de variante sau intervale dup caracteristica x

Se ntlnesc urmtoarele situaii:
- Dac , atunci ntre cele dou caracteristici nu
2
g
2
c
<
exist legtur, ipoteza nul H
0
se verific.
- Dac , atunci ntre cele dou caracteristici
2
g
2
c
>
exist legtur, ipoteza nul H
0
se respinge.
Se apreciaz c legtura este cu att mai intens cu ct
distana ntre cele dou variabile
2
este mai mare.
Exemplu:
S-a efectuat un sondaj pe un eantion de 1.200 de
consumatori pentru a analiza cererea pentru un anumit produs
i modul de apreciere a acestuia sub influena diferiilor
factori. Un segment din prelucrarea datelor este evideniat n
tabelul urmtor:
Tabelul nr.56
Grupe de vrst (ani) Aprecieri
sub
30
30 -
50
Peste
50
Total
favorabile 193 232 139 564
fiecare dintre variabilele independente
care caracterizeaz modificarea, variaia
parametrului.
nefavorabile 230 241 165 636
Total
423 473 304 1.200

S se stabileasc dac vrsta influeneaz semnificativ
aprecierea produsului alegnd un nivel de semnificaie
=0,05.

Folosim testul
2
.
Emitem ipoteza nul H
0
conform creia aprecierea total
(favorabil+nefaforabil) are aceleai proporii n cadrul
fiecrei subgrupe de vrst. n acest caz frecvenele n
fiecare subgrup ar trebui s fie urmtoarele:

Tabelul nr.57
Grupe de vrst (ani)
Aprecieri
Sub 30 30 50 Peste 50
Total
Favorabil
e
199
(47%42
3)
222
(47%47
3)
143
(47%30
4)
564
(47%
)
Nefavora
bile
224
(53%42
3)
251
(53%47
3)
161
(53%30
4)
636
(53%
)

Total
423
( 100% )
473
( 100% )
304
( 100% )
1.200
100
%

Pe baza Tabelului nr.64 i a Tabelului nr.65 se calculeaz:
( )
401 , 1
161
) 161 165 (
251
) 251 421 (
224
) 224 230 (
143
) 143 139 (
222
) 222 232 (
199
) 199 193 (
2 2 2
2 2 2
*
2
*
2
=

+
+

i j
ij
ij ij
c
f
f f


Hi-ptrat calculat se compar cu Hi-ptrat tabelar folosind
Anexa1.
Pentru = 0,05 i g = (2-1)(3-1) = 2 ,
2
= 5,991.
Deoarece
991 , 5 401 , 1
2
tabelar
2
calculat
= < =
ipoteza nul se admite, mai corect spus ipoteza nul nu se
respinge, adic aprecierile persoanelor privind produsul nu
sunt influenate de vrst.

Coeficientul Pearson
Se calculeaz dup formula
2
2
Pearson
n
C

+
=
i ia valori ntre 0 i 1.
Apropierea de zero nseamn legtur slab.
Apropierea de 1 nseamn legtur puternic.
Pentru exemplul de mai sus
0012 , 0
401 , 1 1200
401 , 1
C
Pearson
=
+
=
confirm faptul c ntre vrst i aprecierea persoanelor
privind produsul nu exist legtur.


Coeficienii simplii de corelaie a rangurilor
se numesc ai rangurilor pentru c n calculul acestora
se folosesc rangurile atribuite unitilor statistice i nu valorile
care le caracterizeaz.
pentru calculul acestora se procedeaz astfel:
- se acord fiecrei uniti statistice cte un rang n raport
cu fiecare caracteristic.
- Se ordoneaz rangurile dup variabila factorial i se
aliniaz corespunztor corespunztor, pe irul al doilea,
rangurile acordate dup cea de-a doua variabil (cea
rezultativ)
- ntre rangurile perechi poate exista concordan,
discordan.

Coeficientul Kendall
Kendall, pornind de la concordana i discordana dintre
dou variabile, propune calculul urmtorului coeficient:

) 1 (
) ( 2
2
) 1 (

=
n n
Q P
n n
Q P
k
Unde:
P semnific situaia de concordan dintre variabile,
exprimat prin numrul rangurilor mai mari dect un rang
dat
Q semnific situaia de discordan dintre variabile
exprimat prin numrul rangurilor mai mici dect un rang
dat

Semnificaia indicatorului este urmtoarea:
- Semnul coeficientului arat sensul legturii:
Cnd k > 0 (adic P>Q) ntre variabile exist
legtur direct
Cnd k < 0 (adic P< Q) ntre variabile exist
legtur invers
- Nivelul numeric al coeficientului sugereaz intensitatea
legturii:
Cnd k tinde spre 1 (adic P sau Q tinde spre valoarea
maxim) legtura ntre cele dou variabile este mai
intens.
Cnd k tinde spre zero (adic P i Q sunt apropiai)
legtura ntre cele dou variabile este mai slab.


Coeficientul Spearman

Autorul construiete indicatorul pornind de la distanele
dintre rangurile perechi ale variabilelor analizate, astfel:
) 1 (
6
1
2
2
/

=

n n
d
c
x z


Semnificaia nivelului i semnului coeficientului Spearman este
aceeai ca i a coeficientului Kendall.

Exemplu:
Se cunosc urmtoarele date cu privire la capitalul utilizat i
volumul vnzrilor dintr-o lun, pentru zece firme,
principale productoare ale unei game de produse:

Tabelul nr.58
Firma
Capitalul utilizat
(mil.lei)
Vnzri
(mil.lei)
F
1
20,46 75,6
F
2
13,36 35,7
F
3
25,31 104,9
F
4
33,73 129,6
F
5
25,40 71,8
F
6
35,82 179,7
F
7
13,35 53,7
F
8
22,76 65,3
F
9
21,23 74,3
F
10
19,28 55,3
Not: date convenionale

Aflai dac ntre cele dou variabile exist legtur, de ce
sens i de ce intensitate?
Pentru a calcula coeficienii Kendall i Spearman aezm
datele de lucru ntr-un tabel de forma:


Tabelul nr.59
Rangul dup
Firma
x y

d

d
2

P

Q
P-Q
F
6
1 1 0 0 9 0 9
F
4
2 2 0 0 8 0 8
F
5
3 6 -3 9 4 3 1
F
3
4 3 1 1 6 0 5
F
8
5 7 -2 4 3 2 1
F
9
6 5 1 1 3 1 2
F
1
7 4 3 9 3 0 3
F
10
8 8 0 0 2 0 2
F
2
9 10 -1 1 0 1 -1
F
7
10 9 1 1 0 0 0
Total - - 0 26 37 7 30

Coeficientul Kendall,
67 , 0
) 1 10 ( 10
30 2
) 1 n ( n
) Q P ( 2
k =

= sau 67%

Coeficientul Spearman,
84 , 0
) 1 100 ( 10
26 6
) 1 n ( n
d 6
1 c
2
2
=

=

sau 84%

Apreciem c ntre caracteristica volumul capitalului
utilizat i caracteristica volumul vnzrilor exist o
legtur destul de puternic.
!!! Coeficientul rangurilor calculat dup formula lui Kendall
este, de obicei, mai mic dect cel calculat dup formula lui
Spearman.

Coeficientul lui Fechner


Se mai numete i coeficientul concordanei
semnelor.
Calculul acestui coeficient se bazeaz pe
concordana sau discordana ntre semnele abaterilor
perechi:
x
i
= (x
i
-x
i-1
)
y
i
= (y
i
-y
i-1
) i = 1, , n
Se calculeaz dup formula:
D C
D C
f
+

=
Unde:
C = numrul perechilor cu semne concordante
D = numrul perechilor cu semne discordante
C+D = numrul total al perechilor de abateri, adic
chiar numrul unitilor cercetate.
!!! ntr-o alt accepie elementele formulei au urmtoarea
semnificaie:
C = suma produselor abaterilor de la medie pentru perechile
concordante.
D = suma produselor abaterilor de la medie pentru perechile
discordante.
Semnificaia coeficientului:
-semnul indic sensul legturii + legtur direct
- legtur invers
- apropierea de zero = legtur slab sau inexistent
- apropierea de 1 = legtur puternic
Exemplu:
Se cunosc urmtoarele date privind salariul negociat i
vechimea n munc pentru 10 angajai ai unei firme:

Tabelul nr.60
Nr
crt.
Vechimea n
munc
Salariul negociat
1 5 600
2 6 500
3 8 900
4 10 1,300
5 13 1,200
6 15 1,400
7 17 1,600
8 18 1,800
9 19 2,000
10 20 1,900
Aflai n ce msur cele dou variabile se coreleaz.
Vom folosi metoda Fechner, pentru care aezm datele n
urmtorul tabel:
Tabelul nr.61
Nr
crt.
Vechi
mea n
munc
Salariul
negociat

x
i

y
i
C
sau
D
1 5 600 - - -
2 6 500 1 -100 D
3 8 900 2 400 C
4 10 1,300 2 400 C
5 13 1,200 3 -100 D
6 15 1,400 2 200 C
7 17 1,600 2 200 C
8 18 1,800 1 200 C
9 19 2,000 1 0 C
10 20 1,900 1 100 D
Total D=3
C=6
33 . 0
9
3
3 6
3 6
= =
+

=
+

=
D C
D C
f sau 33%
n cazul dat cele dou variabile se coreleaz slab.
Aplicnd cea de-a doua variant a formulei gsim:

Tabelul nr.62
Nr crt. Vechimea n
munc
Salariul
negociat

x
i

y
i
C
sau
D
1 5 600 -9,1 -720 +6552
2 6 500 -8,1 -820 +6642
3 8 900 -6,1 -420 +2562
4 10 1,300 -4,1 +20 +82
5 13 1,200 -1,1 -120 +132
6 15 1,400 +0,9 +80 +72
7 17 1,600 +2,9 +280 +812
8 18 1,800 +3,9 +480 +1872
9 19 2,000 +4,9 +680 +3332
10 20 1,900 +5,9 +580 +3422
Total
1 , 14 = x i 1320 = y
D=0
C=25480

f = 100%
!!! Se observ diferena de nivel nregistrat de cele dou
variante ale indicatorului. Aceasta diferen se explic prin
faptul c n prima variant se ine seama numai de numrul de
valori perechi concordante sau discordante i nu si de diferena
efectiv care definete concordana sau discordana.


Coeficientul de asociere
Permite msurarea rapid a legturii dintre dou variabile
numerice dar i nenumerice.
Se utilizeaz atunci cnd populaia statistic este grupat sau
se poate grupa dup o caracteristic alternativ.
Se calculeaz pe baza tabelului de asociere de forma:

Tabelul nr.63
y
x
Y
1
Y
2
Total
X
1
a b a+b
X
2
c d c+d
Total a+c b+d a+b+c+d

produsul ad arat gradul de realizare a legturii directe
dintre x i y, iar produsul bc arat gradul de legtur invers
ntre cele dou variabile.
Formula de calcul este cea propus de Yule

bc ad
bc ad
q
+

=

Exemple:
Se cunosc urmtoarele date cu privire la structura a 50
uniti de alimentaie public dup procentul de cretere a
numrului de sortimente i procentul de cretere a ncasrilor
acestora.
Tabelul nr.64
Grupe dupa cresterea
incasarilor


Grupe dupa cresterea

Sub
7%

Peste
7%

Total
nr. de sortimente
Sub 7% 23 3 26
Peste 7% 7 17 24
Total 30 20 50

Analizai existena legturii ntre creterea numrului de
sortimente i creterea ncasrilor, sensul i intensitatea
acesteia.
Calculm coeficientul de asociere dup formula lui Yule:
90 , 0
412
370
) 3 7 ( ) 17 23 (
) 3 7 ( ) 17 23 (
q = =
+

= sau 90%
Apreciem c ntre cele dou variabile exist legtur direct
de intensitate mare.
Se cunosc urmtoarele date cu privire la situaia la
disciplina management n timpul anului i la examenul
final, pentru o grup de studeni.

Tabelul nr.65
Grupe dupa
nota la examen

Grupe dupa nota
n cursul anului

Sub
7
7 i
peste

Total
Sub 7 1 1 2
7 i peste 5 16 21
Total 6 17 23
Exist legtur ntre pregtirea n cursul anului i nota la
examen la aceast disciplin? Ce fel de legtur i de ce
intensitate?
52 , 0
21
11
) 1 5 ( ) 16 1 (
) 1 5 ( ) 16 1 (
q = =
+

= sau 52%
Apreciem c exist o legtur direct de intensitate medie.
Dac Francisc Galton n anii 1890 a gsit corelaie n
domeniul ereditii (ntre nlimea medie a prinilor i cea
a copiilor) punnd bazele teoriei corelaiei i a regresiei,
trebuie amintit faptul c mai trziu G.U.Yule introduce

expresia corelaii fr sens adic, corelaii care ntr-un
firesc al lucrurilor nu pot exista. El a gsit prin calcule un
coeficient de corelaie foarte mare, de 98,8%, ntre numrul
aparatelor radio din Anglia n perioada 1929 1937 i
numrul bolnavilor mintali din aceeai perioad.

!!! Coninutul economic sau social al unei formule
matematice sau al unei proceduri statistice l d omul
(economistul, sociologul,)i numai el.

Regresie i corelaie parametric.

Modelele de regresie au ca scop rezumarea legii de
evoluie a unui fenomen prin linia (curba) de regresie
reprezentnd corespondena ntre perechile de valori (x
i
,y
i
)
numit i linia (curba) de regresie a variabilei y n x.
Funcia de regresie exprim statistic modul n care
caracteristica rezultativ y s-ar modifica dac ar varia numai
valorile caracteristicii factoriale x iar ceilali factori ar fi
considerai cu aciune constant n toate cazurile observate.
Demersul analizei de regresie presupune :
- construirea corelogramei.
- aproximarea pe baza corelogramei a formei legturii i
scrierea ecuaiei (de tendin) corespunztoare modelului de
regresie ales.
- estimarea parametrilor ecuaiei de regresie pe baza
metodei celor mai mici ptrate.
Se ntlnesc cazuri:
- regresie unifactorial (simpl)
liniar
curbilinie
- regresie multifactorial
liniar
curbilinie

Regresia simpl liniar

n cazul n care prin reprezentarea grafic se observ o
tendin de legtur de tip liniar n care variaia
caracteristicii rezultative prezint o anumit tendin de
uniformitate a modificrii sale sub influena caracteristicii
factoriale, ecuaia care exprim aceast form de legtur va
fi:
y = a + bx
i are un caracter de medie deoarece mrimea sa exprim
tendina de realizare a corelaiei dintre cele dou variabile.

Dac ecuaia modeleaz corect legtura, dac ntr-adevr
legtura este liniar i factorul x determinant, atunci valorile
calculate pentru toate unitile observate trebuie s prezinte
abateri minime fa de valorile empirice.
Parametrii a i b ai modelului au de asemenea coninut de
valori medii.
parametrul a are valoare de mrime medie n sensul c
arat la ce nivel ar fi ajuns valoarea caracteristicii y dac toi
factorii, mai puin cel nregistrat, ar fi avut o aciune
constant asupra formrii ei (valorile individuale pentru y ar
fi fost egale ntre ele i egale cu media lor).
parametrul b se mai numete i coeficient de regresie
i exprim n sens geometric panta liniei drepte. Acesta arat
cu ct se schimb n medie variabila y n cazul n care
variabila x se modific cu o unitate i n ce sens se produce
modificarea: direct (b>0) sau indirect (b<0). Dac b=0
variabilele sunt independente.
n determinarea parametrilor a i b se pornete de la ideea c
dac y depinde de x atunci trebuie s se ndeplineasc
condiia ca suma ptratelor abaterilor valorilor empirice de
la valorile calculate s fie minim:

= = im min ) y y ( S
2
c i

adic: [ ] im min ) bx a ( y
2
i i
= +



se deriveaz aceast sum n raport cu derivatele celor doi
parametrii:
[ ) 1 ( ) bx a ( y 2
a
S
i i
+ =


[ ]

+ = ) x ( ) bx a ( y 2
b
S
i i i



Anulnd derivatele pariale i simplificnd cu 2 obinem:


= +
i i
y x b na


= +
i i
2
i i
y x x b x a

Un procedeu mai simplu pentru obinerea sistemului de
ecuaii normale necesar calculului parametrilor a i b, este
urmtorul:
- se nmulete pe rnd ecuaia dreptei cu coeficienii lui a i
b respectiv cu 1 i x,
y bx a = +
xy bx ax
2
= +
- se nsumeaz toate ecuaiile corespunztoare celor n
termeni,


= +
i i
y x b na


= +
i i
2
i i
y x x b x a
Rezolvnd sistemul se obin valorile pentru a i b i se
ajusteaz seria.

Ajustarea unei serii statistice const n nlocuirea
termenilor empirici (obinui prin observare) cu termeni
teoretici calculai pe baza modelului matematic.
Exemplu:
Se dau urmtoarele date cu privire la vechimea n munc i
salariul net ntr-un compartiment cu 10 persoane.
Tabelul nr.66
Nr.crt
.
Vechime n
munc (x
i
)
Salariul net
(mii lei) (y
i
)
1 16 860
2 27 970
3 9 870
4 16 910
5 20 950
6 6 850
7 22 930
8 18 910
9 29 970
10 11 870

Apreciai forma legturii dintre cele dou variabile i
gsii expresia matematic care o modeleaz. .

840
860
880
900
920
940
960
980
0 10 20 30 40
vechime (ani)
s
a
l
a
r
i
u
l

n
e
t

(
m
i
i

l
e
i
)
Figura nr.18 Corelograma
Din graficul de corelaie a celor dou serii empirice se
apreciaz c legtura este de tip liniar.
Pentru a afla valorile parametrilor a i b care alctuiesc
funcia rezolvm sistemul de ecuaii normale folosind
metoda determinanilor:

( )

=
2
i
2
i
i i i
2
i i
x x n
x y x x y
a
( )

=
2
i
2
i
i i i i
x x n
y x y x n
b

Aezm elementele necesare rezolvrii acestui sistem i
gsirii formei funciei, ntr-un tabel de forma:



Tabelul nr.67
Nr
.cr
t.
x
i
y
i
x
i
2
x
i
y
i
y
i
2
Y=811,15
+5,624x
1 6 850 36 5.100 722.500 844,892
2 9 870 81 7.830 756.900 861,763
3 11 870 121 9.570 756.900 873,010
4 16 910 256 14.560 828.100 901,127
5 16 860 256 13.760 739.600 901,127
6 18 910 324 16.380 828.100 912,374
7 20 950 400 19.000 902.500 923,621
8 22 930 484 20.460 864.900 934,868
9 27 970 729 26.190 940.900 962,986
10 29 970 841 28.130 940.900 974,233
To
tal
174 9.090 3.528 160.980 8.281.300 9090,001

Pe baza elementelor din tabel sistemul de ecuaii este:
10a+ 174b = 9.090
174a+3.528b = 160.980
Rezolvnd sistemul obinem parametrii:
a= 811,151
b= 5,624
Deci forma funciei liniare care modeleaz legtura dintre
variabile este: y
c
= 811,151+5,624x

Coeficientul de regresie, b = 5,624 semnific: pentru
datele luate n calcul, la o cretere cu un an a vechimii n
munc, salariul a crescut n medie cu 5,624 mii lei.
Pentru verificarea calculului parametrilor funciei de
regresie, i a corectitudinii modelului gsit, folosim relaia:


=
c i
y y
Urmrind ultima coloan din Tabelul nr.87 constatm c
prin ajustare se realizeaz de fapt o redistribuire a influenei
factorilor astfel nct factorul nregistrat s influeneze
sistematic n toate cazurile supuse observrii.

!!! Funcia de regresie este numai o ipotez statistic care
exprim regularitatea, tendina medie de manifestare a
legturii dintre cele dou caracteristici, considernd ca
variabil numai factorul nregistrat. ntre valorile empirice i
cele teoretice (estimate) apar abateri mai mari sau mai mici
dup cum influena celorlali factori considerai cu caracter
ntmpltor, este mai mare sau mai mic.

Coeficientul de corelaie liniar
Este indicatorul care permite msurarea gradului de
intensitate a legturii dintre caracteristica factorial i cea
rezultativ.
Se calculeaz ca o medie aritmetic simpl a produselor
abaterilor normate ale celor dou variabile.
Abaterile normate sunt:

x
i
x x

i
y
i
y y


iar coeficientul de corelaie liniar simpl este:

( )( )
y x
i i
y
i
x
i
x / y
n
y y x x
n
y y x x
c



=
Indicatorul ia valori ntre 1 i +1, cu urmtoarea
semnificaie:
Dac c
y/x
este negativ ntre variabile este legtur
invers.
Dac c
y/x
este pozitiv ntre variabile este legtur
direct.
Dac c
y/x
se apropie de zero legtura este slab.
Dac c
y/x
se apropie de 1 sau 1 legtura este
puternic.
nlocuind mediile i abaterile medii ptratice cu
formulele lor de calcul obinem urmtoarea form a
coeficientului de corelaie liniar:
( )( )
( ) [ ] ( ) [ ]
2
i
2
i
2
i
2
i
i i i i
x / y
y y n x x n
y x y x n
c




=

Folosind datele din Tabelul nr. 66, gsim:
( ) [ ] ( ) [ ]
9251 , 0
090 . 9 300 . 281 . 8 10 172 528 . 3 10
090 . 9 174 980 . 160 10
c
2 2
x / y
=


=

Nr.crt.
x
i
y
i
1 6 850
2 9 870
3 11 870 a (INTERCEPT) 811,151079
4 16 910 b (SLOPE) 5,6235012
5 16 860
6 18 910 CORREL 0,92511769
7 20 950
8 22 930 TTEST 8,409E-14
9 27 970 TDIST 6,3503E-10
10 29 970
Total 174 9.090
Figura nr.19 EXCEL - regresia liniar simpl.

Regresia simpla curbilinie
n realitatea economic i social influena unor variabile
asupra altora n majoritatea cazurilor nu se realizeaz liniar
ci n forme curbilinii specifice.
n aceste cazuri este necesar ca pe baza corelogramei s se
aleag acea form a funciei care s prezinte abateri minime
de la linia valorilor empirice. Dac din corelogram nu se
desprinde clar forma funciei atunci este necesar s se
calculeze mai multe ecuaii de estimare cu care s se
ajusteze datele i s se aleag apoi aceea pentru care se
calculeaz cea mai mic eroare de ajustare.
Cele mai frecvente cazuri ntlnite sunt:
Legtura statistic de forma unei parabole de gradul 2:
2
cx bx a y + + =
Legtura statistic de forma unei hiperbole:
b
x
1
a y + =
Legtura statistic de form exponenial:
x
b a y + =
Raportul de corelaie
Este indicatorul care msoar intensitatea legturii
curbilinii.
Formula de calcul, forma general este:
( )
( )

=
2
i
2
c i
x / y
y y
y y
1 R
Unde: y
i
= valori empirice
y
c
= valori teoretice (calculate, ajustate)
y = nivelul mediu al variabilei rezultative
Semnificaia raportului de corelaie este aceeai ca i cea a
coeficientului de corelaie.
Nr.crt.
x
i
y
i
1 6 850
2 9 870
3 11 870
4 16 910
5 16 860
6 18 910
7 20 950
8 22 930
9 27 970
10 29 970
Total 174 9.090
y =815,56e
0,0062x
R
2
=0,8537
820
840
860
880
900
920
940
960
980
1000
0 10 20 30
vechime in munca
s
a
l
a
r
i
u
l

n
e
t
(
m
i
i

l
e
i
)

Figura nr.20 EXCEL - regresia unifactorial curbilinie

























Teme propuse


tr xpoziie au fost expuse zece variante dintr-un produs

68




n -o e
.A
nou. n cadrul expoziiei s-a realizat un sondaj cu privire la
preferinele pentru aceste variante de produs. Urmare
prelucrrii datelor sondajului s-au stabilit urmtoarele:


Tabelul nr.
Locul ocupat n funcie de Produsul
pre preferine
P
1
1 8
P
2
2 5
P
3
3 10
P
4
4 6
P
5
5 4
P
6
6 2
P
7
7 3
P
8
8 7
P
9
9 1
P
10
10 9

nalizai dac ntre pre i preferin exist legtur,
n ce sens i de ce intensitate?
A





Printr-un sondaj de pia pe un eantion de 1000 de
soane s-a stabilit c produsul Santal-pere a ptruns n per
consumul populaiei dup cum urmeaz:
Tabelul nr.69

Structura eantionului
pe sexe Pe grupe de vrst (ani)
M F Peste50 Sub20 20-35 35-50
Consum
curent
1 269 29 107 146 174 132
Consum
ocazional
221 219 93 96 116 136
Total 490 510 200 242 290 268

S se stabile a n l p ulu ta re se
diferen semnificativ funcie de sexul i vrsta
Folosind datele din Tabelul nr.93 calculai coeficienii de
corela tatistic i stabilii dac exist legtur ntre
-n mii dolar SUA
ara
asc d c co sumu rodus i San l pe
iaz
persoanelor consumatoare.


ie s
PNB/locuitor i volumul exporturilor pe locuitor, ce fel de
legtur i de ce intensitate?
Tabelul nr.70

PNB/loc Export/loc
Australia 17.260 2,544
Austria 22.380 5.638
Belgia 20.880 11.845
Brazilia 2.770 0.229
B
C
Canada 20.710 4.892
Danemara 26.000 7.689
Elveia 36.080 9.534
Finlanda 21.970 4.669
Frana 22.260 4.043
Germania 23.030 5.340
Grecia 7.290 0.921
India 0.310 0.021
Italia 20.460 3.143
Japonia 28.190 2.738
Norvegia 25.820 8.193
Olanda 20.480 9.220
Regatul
Unit
17.790 3.293
Spania 13.970 1.646
SUA 23.240 1.757
Suedia 27.010 6.454
Sur rul Statis omniei.

Analiz i corelaia ntre variabilele populaie i producie
industrial pentru apte judee folosind metoda Fechner i
Prod.ind.
sa:Anua tic al R


a
coeficienii de corelaie a rangurilor Kendall i Spearman.
Comentai comparativ rezultatele.
Tabelul nr.71
Judeul Populaia
(mii loc.) (mld.lei)
A 5 387 189
B 65 308 16
C 435 2055
D 178 1495
E 241 1397
F 363 1970
G 960 3070
D


ca ul unui experiment n probleme de ergonomie a fost
rm uzicii asupra productivitii a cinci operatoare

Zile
Operatoa

n dr
rit efectul m u
dintr-o firm de calculatoare. Patru programe muzicale diferite
A, B, C i D au fost comparate cu o situaie fr muzic, F.
Au fost efectuate msurtori cinci zile lucrtoare succesive.
Datele studiului s-au sistematizat ntr-un tabel de forma:

Tabelul nr.72

re
L M Mr. J V Total
O1
A
(12
B
(11
D
(1 ) )
C
(12) 5)
F
(9)
59
O2
E
B
(10)
C
(12)
D
(13)
F
(10)
A
(14)
59
O3
C
(11) (13)
F
(10) (12) (14)
60
D A B
O4
(13) (11) (12) (18) (16)
70
D F A B C
O5
(10) (14) (17) (13) (12)
66
F A B C D
Total 56 314 61 64 68 65

nsum volum v ic a ontr or
realizate pe tipuri de muzic ascultat, gsim:
i con luz neaz semnificativ
produc vita
d testul F.
Dac m ul alor l c actel
A 12+14+12+12+14= 64
B 11+10+14+18+17= 70
C 12+12+11+16+13= 64
D 15+13+13+13+12= 66
F 9+10+10+11+10= 50
c ionm c muzica influe
ti tea operatoarelor.
Testai semnificaia statistic a efectului muzicii asupra
activitii operatoarelor folosin






Volumul vnzrilor de mrfuri i nivelul cheltuielilor
ubli are pentru 50 de uniti dintr-un lan de magazine se
Vnzri

h.
6
0

-

8
0

8
0

-

1
0
0

1
0
0

-

1
2
0

1
2
0

-

1
4
0

1
4
0


1
6
0


1
6
0

-

1
8
0

1
8
0

-

2
0
0

2
0
0

-

2
2
0

T
o
t
a
l

F
p cit
prezint astfel:
Tabelul nr.73


C
4 - 6 3 1 - - - - - - 4
6 - 8 3 - 1 - - - - - 4
8 - 10 2 2 1 - - - - - 5
10 - 12 - 3 2 - - - - - 5
12 14 - 3 1 3 3 - - - 10
14 16 - - 1 4 2 2 - - 9
16 18 - - - 1 1 3 2 1 8
18 - 20 - - - - - - 2 3 5
Total 8 9 6 8 6 5 4 4 50

Se
Caracterizai variaia volumului vnzrilor n funcie de
velul cheltuielilor publicitare.

ia de regresie
Test

cere:
ni
Verificai dac exist legtur ntre cele dou variabile.
Dac da, stabilii forma legturii.
Ajustai volumul vnzrilor n funcie de nivelul
cheltuielilor publicitare folosind func
adecvat.
ai semnificaia corelaiei i a funciei de regresie.








BIBLIOGRAFIE
C., Zaharia R, Marketing probleme,
teste, Editura Expert, Bucureti, 1996 p.87.
996, p.161-188
98, p.188-254.
ti, 1999, p.240-278
,1993, p.492-571.
A., Mitru C-tin, Voineagu V, Statistica pentru
a 6,
C, Cluj, 1997, p.124-179.
, 1999, p.255-329.

Anghel L., Florescu
Coord. T.Baron, E.Biji, Statistica teoretic i economic,
Editura didactic i pedagogic, Bucureti, 1
Baron T.,Anghelache C-tin, ian E., Statistica, Editura
Economic, 1996, p.138-168.
Bdi M., Baron T., Korka M., Statistic pentru afaceri,
Editura Eficient, Bucureti, 19
Bernard Delmas, Statistique Descriptive, Nathan Universit,
p. 213-228
Biji E., Wagner P., Lilea E., Statistic, Editura Didactic i
Pedagogic, Bucure
George C. Canavos, Don M. Miller, An Introduction to
modern business statistics, Duxbury Press
Goschin Zizi, Statistic, Editura Expert, Bucureti ,1999,
p.137-169
Jaba E., Statistica, Editura Economic, 1998, p.325-373.
Maniu
m nagementul afacerilor, Editura Economic, Bucureti, 199
p.171-216.
Merce E., Mru P., Statistica economic n turism i
comer, UD
Negoescu Gh., Ciobanu Rodica, Bazele statisticii pentru
afaceri, Editura ALL BECK, Bucureti
Porojan Dumitru, Statistica i teoria sondajului, Editura
SANSA, Bucureti, 1993, p.96-124.
Stanciu S., Andrei T., Statistica teorie i aplicaii, Editura
ALL, Bucureti, 1995, p.252-358.