Sunteți pe pagina 1din 36

Parcurgnd acest capitol vei putea fi n stare s

rspundei la urmtoarele ntrebri:

Ce tipuri de legturi se stabilesc ntre fenomenele economice


si sociale?
Prin ce metode se pot analiza intensitatea acestor legturi
statistice?
Ce indicatori ai corelaiei neparametrice cunoatei?
Prezentai testul Hi-ptrat.
Prezentai comparativ coeficienii Kendall, Spearman,
Fechner.
Care este importana regresiei (liniar sau curbilinie) ntr-o
analiz statistic?
Care este metoda standard pentru determinarea dreptei de
regresie?
n ce fel se folosete programul EXCEL n determinarea
modelelor se regresie?
Cum se realizeaz estimarea nivelului unui fenomen
economic sau social folosind linia de regresie?
Originea,
modelului statistic de analiz de regresie i corelaie se
afl n cercetrile lui Francis Galton (1822-1911) cu privire la
ereditatea membrilor unei familii. Mai apoi au adus
contribuii K. Pearson n corelaia pentru trei variabile,
G.U.Yule n corelaia multipl, Spearman i Kendal n
corelaia rangurilor precum i Mosteller i Tukey n corelaia
robust.

Concepte, noiuni n analiza de regresie i corelaie

Regresia,
exprim o legtur de tip statistic i anume regresia n
medie cu privire la comportamentul unor variabile.
Corelaia,
exprim raporturi reciproce ntre anumite caracteristici.
Covariaia,
exprim variaia simultan a dou variabile ntre care
exist dependen. Se msoar cu ajutorul covarianei.
Analiza de regresie,
este metoda statistic care permite studierea i msurarea,
relaiei dintre dou sau mai multe variabile, adic permite
estimarea valorilor unei variabile n funcie de o alt variabil
sau de mai multe.
Analiza de corelaie,
este metoda statistic prin care se msoar intensitatea
legturii dintre variabile, adic se evideniaz gradul de
influen a variabilei sau variabilelor factoriale asupra
variabilei rezultative.
Variabila factorial,
se mai numete independent, cauz, exogen, explicativ
se noteaz prin x
explic variaia altei variabile, celei rezultative.
Variabila rezultativ,
se mai numete dependent, efect, endogen, explicat
se noteaz prin y
Variabila reziduu,
sau eroarea de modelare, sintetizeaz influena tuturor
factorilor neinclui n model.
se noteaz prin e
Model de regresie,
este expresia matematic care exprim legtura dintre
variabile i care n forma cea mai general poate fi scris:
y = f ( x1, x2, x3, xn ) + e

Tipuri de legturi statistice:

Dup numrul variabilelor corelate,


- legturi simple, exprim variaia variabilei rezultative y n
funcie de o singur variabil factorial x.
- legturi multiple, exprim variaia variabilei rezultative y
n funcie de variaia simultan a mai multor variabile
factoriale x.

Dup sensul legturii,


- legturi directe, care exprim modificarea variabilei y n
acelai sens cu variaia variabilei x.
- legturi inverse, care exprim modificarea variabilei y n
sens contrar cu variaia variabilei x.

Dup forma legturii,


- legturi liniare
- legturi curbilinii

Etape n analiza de regresie i corelaie


Identificarea existenei legturii, se face prin analiza
logic a posibilitii de existen a unei legturi ntre
variabilele analizate.
Stabilirea sensului i formei legturii prin metode
specifice analizei de regresie.
Determinarea gradului de intensitate a legturii cu
ajutorul indicatorilor parametrici sau neparametrici ai
intensitii corelaiei.

Metode de analiz a legturilor statistice

Se cunosc: - metode elementare


- metode analitice

Metode elementare

1. Metoda seriilor paralele interdependente:


const n compararea termenilor a dou serii ntre care se
presupune c exist legtur, interdependen.
se aplic n cazul seriilor cu un numr mic de variante.
cnd se compar dou serii de timp termenii acestora se
ordoneaz cronologic.
cnd se compar dou serii, de spaiu sau de frecvene,
termenii seriilor comparate se ordoneaz cresctor sau
descresctor dup variabila factorial x i se aliniaz
corespunztor seria dup variabila rezultativ z.
se pot ntlni urmtoarele situaii:
- dac variaia celor dou variabile este n acelai
sens, exist legtur direct.
- dac variaia acestora este n sens diferit, corelaia
este invers.
- Dac cele dou variabile variaz n mod
independent sau una rmne constant, nu exist
legtur.

Metoda se aplic aeznd datele dup urmtorul model:

x x1 x2 . xi . xn
y y1 y2 . yi . yn

Exemple:
Se cunosc urmtoarele date cu privire la cheltuielile cu
publicitatea i nivelul vnzrilor unei firme n ultimele luni
de activitate.
Tabelul nr.49
Cheltuieli cu
publicitatea 6 10 14 12 13,6 16
(mil.lei)
Nivelul
vnzrilor 10 50 140 90 120 180
(mld.lei)

7 8 9 13 14,8 15,6 17
24 30 54 110 150 160 190

Ordonm cresctor dup variabila factorial cheltuieli cu


publicitatea i aliniem corespunztor dup variabila
rezultativ nivelul vnzrilor.

Tabelul nr.50
13,6

14,8

15,6
10

12

13

14

16

17
x

110

120

140

150

160

180

190
10

24

30

54

50

90
y

Concluzie: cnd variabila factorial crete se nregistreaz o


cretere corespunztoare a variabilei rezultative deci ntre
cele dou exist legtur direct
Cu privire la numrul accidentelor rutiere i numrul
persoanelor alcoolice nregistrate n lunile iulie i august n
apte localiti ale unui jude se cunosc urmtoarele:

Tabelul nr.51
Nr.
alcoolici 14 19 27 34 41 47 51
(x)
Nr.
accidente
8 10 13 15 16 21 37
rutiere
(y)

Concluzie: legtur direct.

Se cunosc urmtoarele date cu privire la capitalul social (K)


i preul practicat (P) de apte firme productoare ale
aceluiai produs:

Tabelul nr.52
K(mil) 3 7 12 17 19 21 2
P (mii) 23 1 19 13 21 20 5

Concluzie: nu exist legtur.

2. Metoda gruprilor
const n gruparea valorilor variabilei factoriale x pe
intervale de variaie (cresctor sau descresctor) i
calcularea valorilor medii corespunztoare ale variabilei y.
Se urmrete variaia perechii de valori ( xi , y i ).
se aplic n cazul cnd cele dou variabile corelate
prezint un numr mare de variante.
metoda se aplic aeznd datele dup urmtorul model:
Tabelul nr.53
Valoarea
Variabila x grupat medie a
Frecvenele pe
pe intervale de variabilei y
grupe de variaie
variaie pe grupe
dup x

x0 - x1 f1
y1

xi-1 - xi fi
yi

xn-1 - xn fn
yn

Total
f
i
i y

Exemplu:
Printr-o sistematizare a datelor primare dintr-o firm s-a
obinut urmtoarea situaie cu privire la productivitatea
muncii i salariul celor 50 de angajai ai firmei.

Tabelul nr.54
Salariul mediu
Grupe de salariai Numr al angajailor
dup producia de pe grupe dup
realizat (buc) angajai prod. realizat
(mii lei)
9 14 3 731
14 19 9 810
19 24 12 1.100
24 29 11 1.370
29 34 9 1.530
34 - 39 6 1.717
Total 50 1.390
Concluzie: ntre cele dou variabile exist legtur direct.
Productivitatea muncii unui angajat influeneaz direct
salariul primit de acesta.

3. Metoda tabelului de corelaie


const n gruparea unitilor unei populaii simultan
dup ambele variabile corelate, dup cea factorial x i dup
cea rezultativ y
se recomand s se foloseasc gruparea pe intervale
egale i s se formeze aproximativ acelai numr de grupe
dup ambele variabile.
n funcie de modul de distribuie a frecvenelor fij n
tabel se poate aprecia existena, direcia i intensitatea
legturii.
se pot ntlni urmtoarele situaii:
- dac frecvenele fij sunt dispersate relativ
uniform pe toat suprafaa tabelului ntre variabilele
considerate nu exist legtur.
- cu ct frecvenele fij se concentreaz mai mult n jurul
uneia din diagonalele tabelului (n funcie de aezarea
variabilelor n tabel), cu att corelaia este mai intens.
Metoda se aplic aeznd datele dup urmtorul model:

Tabelul nr.55
Grupe Total uniti
Grupe dup y pe grupe
y1.. yj .. ym
dup x (fi)
x1 f11.. f1j.. f1m f1
. . .
xi fi1.. fij .. fim fi
. . .
xn fn1.. fnj.. fnm fn
Total uniti pe n m
subgrupe (fj)
f1 fj fm f
i =1 j =1
ij
4. Metoda grafic
const n reprezentarea grafic a perechilor de valori ale
variabilelor ntr-un sistem de axe de coordonate rezultnd un
grafic de corelaie numit corelogram sau nor de puncte.
prin aceast metod se stabilete existena, sensul, forma
i intensitatea legturii.
cele mai frecvente tipuri de corelogram sunt prezentate
n Figura nr.20.

Metode analitice
permit exprimarea matematic a formei legturii i
msurarea numeric a intensitii acesteia.
Se folosesc:
- metode neparamerice de apreciere i msurare a
intensitii legturilor dintre variabile (corelaia
neparametric).
- regresia i corelaia parametric.

Corelaia neparametric

se folosete pentru msurarea intensitii legturilor


statistice fr a ine seama de forma lor sau de parametrii
funciilor de modelare.
Cele mai largi aplicaii n cercetarea legturilor statistice
n acest sens sunt:
- Testul 2 al lui Pearson de verificare a existenei
legturii,
- Coeficientul de contingen al lui Pearson,
- Raportul de corelaie al lui Pearson,
- Coeficienii simplii de corelaie a rangurilor ai lui
Kendall i Spearmann
- Coeficientul generalizat de corelaie a rangurilor al lui
Kendall (pentru legturi multiple),
- Coeficientul lui Fechner (pentru concordana
semnelor),
- Coeficientul corelaiei informaionale al lui Octav
Onicescu

Figura nr.17 Modele de corelogram

Testul 2 al lui Pearson


Formula de calcul este urmtoarea:

c =
2
( f ij f ij* )
2

i j f ij*

Unde:
fij = frecvenele observate (din datele primare)
fij* = frecvenele calculate (dup modelul teoretic)
Se pornete de la presupunerea
H 0 : f ij = f ij* (ipoteza nul)
sau H 1 : f ij f ij* (ipoteza complementar)
Valoarea Hi-ptrat astfel calculat se compar cu valoarea
tabelar a lui Hi-ptrat pentru o anumit probabilitate de eroare
() i numrul gradelor de libertate corespunztoare (g).
Cum definim gradele de libertate?

fiecare dintre variabilele independente


care caracterizeaz modificarea, variaia
parametrului.

n acest caz numrul gradelor de libertate se stabilete dup


relaia:
g = ( m-1 ) ( n-1 )
Unde:
m = numrul de variante sau intervale dup caracteristica y
n = numrul de variante sau intervale dup caracteristica x

Se ntlnesc urmtoarele situaii:


- Dac c2 < 2g , atunci ntre cele dou caracteristici nu
exist legtur, ipoteza nul H0 se verific.
- Dac c2 > 2g , atunci ntre cele dou caracteristici
exist legtur, ipoteza nul H0 se respinge.
Se apreciaz c legtura este cu att mai intens cu ct
distana ntre cele dou variabile2 este mai mare.
Exemplu:
S-a efectuat un sondaj pe un eantion de 1.200 de
consumatori pentru a analiza cererea pentru un anumit produs
i modul de apreciere a acestuia sub influena diferiilor
factori. Un segment din prelucrarea datelor este evideniat n
tabelul urmtor:
Tabelul nr.56
Aprecieri Grupe de vrst (ani) Total
sub 30 - Peste
30 50 50
favorabile 193 232 139 564
nefavorabile 230 241 165 636
Total 423 473 304 1.200

S se stabileasc dac vrsta influeneaz semnificativ


aprecierea produsului alegnd un nivel de semnificaie
=0,05.

Folosim testul 2 .
Emitem ipoteza nul H0 conform creia aprecierea total
(favorabil+nefaforabil) are aceleai proporii n cadrul
fiecrei subgrupe de vrst. n acest caz frecvenele n
fiecare subgrup ar trebui s fie urmtoarele:

Tabelul nr.57
Grupe de vrst (ani)
Aprecieri Total
Sub 30 30 50 Peste 50
199 222 143 564
Favorabil
(47%42 (47%47 (47%30 (47%
e
3) 3) 4) )
224 251 161 636
Nefavora
(53%42 (53%47 (53%30 (53%
bile
3) 3) 4) )
1.200
423 473 304
100
Total ( 100% ) ( 100% ) ( 100% )
%

Pe baza Tabelului nr.64 i a Tabelului nr.65 se calculeaz:


(f f ij* )
2
(193199) 2 (232 222) 2 (139143) 2
=
ij
2
c = + + +
i j f ij* 199 222 143
(230 224) 2 (421 251) 2 (165161) 2
+ + + = 1,401
224 251 161
Hi-ptrat calculat se compar cu Hi-ptrat tabelar folosind
Anexa1.
Pentru = 0,05 i g = (2-1)(3-1) = 2 , 2 = 5,991.
Deoarece
calculat
2
= 1 ,401 < tabelar
2
= 5 ,991
ipoteza nul se admite, mai corect spus ipoteza nul nu se
respinge, adic aprecierile persoanelor privind produsul nu
sunt influenate de vrst.

Coeficientul Pearson
2
Se calculeaz dup formula C Pearson =
n+ 2
i ia valori ntre 0 i 1.
Apropierea de zero nseamn legtur slab.
Apropierea de 1 nseamn legtur puternic.
Pentru exemplul de mai sus
1 ,401
C Pearson = = 0 ,0012
1200 + 1 ,401
confirm faptul c ntre vrst i aprecierea persoanelor
privind produsul nu exist legtur.

Coeficienii simplii de corelaie a rangurilor


se numesc ai rangurilor pentru c n calculul acestora
se folosesc rangurile atribuite unitilor statistice i nu valorile
care le caracterizeaz.
pentru calculul acestora se procedeaz astfel:
- se acord fiecrei uniti statistice cte un rang n raport
cu fiecare caracteristic.
- Se ordoneaz rangurile dup variabila factorial i se
aliniaz corespunztor corespunztor, pe irul al doilea,
rangurile acordate dup cea de-a doua variabil (cea
rezultativ)
- ntre rangurile perechi poate exista concordan,
discordan.
Coeficientul Kendall
Kendall, pornind de la concordana i discordana dintre
dou variabile, propune calculul urmtorului coeficient:
PQ 2( P Q )
k= =
n(n 1) n(n 1)
2
Unde:
P semnific situaia de concordan dintre variabile,
exprimat prin numrul rangurilor mai mari dect un rang
dat
Q semnific situaia de discordan dintre variabile
exprimat prin numrul rangurilor mai mici dect un rang
dat

Semnificaia indicatorului este urmtoarea:


- Semnul coeficientului arat sensul legturii:
Cnd k > 0 (adic P>Q) ntre variabile exist
legtur direct
Cnd k < 0 (adic P< Q) ntre variabile exist
legtur invers
- Nivelul numeric al coeficientului sugereaz intensitatea
legturii:
Cnd k tinde spre 1 (adic P sau Q tinde spre valoarea
maxim) legtura ntre cele dou variabile este mai
intens.
Cnd k tinde spre zero (adic P i Q sunt apropiai)
legtura ntre cele dou variabile este mai slab.

Coeficientul Spearman

Autorul construiete indicatorul pornind de la distanele


dintre rangurile perechi ale variabilelor analizate, astfel:
6 d 2
cz / x = 1
n(n 2 1)
Semnificaia nivelului i semnului coeficientului Spearman este
aceeai ca i a coeficientului Kendall.

Exemplu:
Se cunosc urmtoarele date cu privire la capitalul utilizat i
volumul vnzrilor dintr-o lun, pentru zece firme,
principale productoare ale unei game de produse:

Tabelul nr.58
Capitalul utilizat Vnzri
Firma
(mil.lei) (mil.lei)
F1 20,46 75,6
F2 13,36 35,7
F3 25,31 104,9
F4 33,73 129,6
F5 25,40 71,8
F6 35,82 179,7
F7 13,35 53,7
F8 22,76 65,3
F9 21,23 74,3
F10 19,28 55,3
Not: date convenionale

Aflai dac ntre cele dou variabile exist legtur, de ce


sens i de ce intensitate?
Pentru a calcula coeficienii Kendall i Spearman aezm
datele de lucru ntr-un tabel de forma:

Tabelul nr.59
Firma Rangul dup P-Q
x y d d2 P Q
F6 1 1 0 0 9 0 9
F4 2 2 0 0 8 0 8
F5 3 6 -3 9 4 3 1
F3 4 3 1 1 6 0 5
F8 5 7 -2 4 3 2 1
F9 6 5 1 1 3 1 2
F1 7 4 3 9 3 0 3
F10 8 8 0 0 2 0 2
F2 9 10 -1 1 0 1 -1
F7 10 9 1 1 0 0 0
Total - - 0 26 37 7 30

Coeficientul Kendall,
2( P Q ) 2 30
k= = = 0 ,67 sau 67%
n( n 1 ) 10( 10 1 )

Coeficientul Spearman,
6 d 2 6 26
c = 1 = = 0 ,84 sau 84%
n( n 1 ) 10( 100 1 )
2

Apreciem c ntre caracteristica volumul capitalului


utilizat i caracteristica volumul vnzrilor exist o
legtur destul de puternic.
!!! Coeficientul rangurilor calculat dup formula lui Kendall
este, de obicei, mai mic dect cel calculat dup formula lui
Spearman.

Coeficientul lui Fechner


) Se mai numete i coeficientul concordanei
semnelor.
) Calculul acestui coeficient se bazeaz pe
concordana sau discordana ntre semnele abaterilor
perechi:
xi = (xi-xi-1)
yi = (yi-yi-1) i = 1, , n
Se calculeaz dup formula:
CD
f =
C+D
Unde:
C = numrul perechilor cu semne concordante
D = numrul perechilor cu semne discordante
C+D = numrul total al perechilor de abateri, adic
chiar numrul unitilor cercetate.
!!! ntr-o alt accepie elementele formulei au urmtoarea
semnificaie:
C = suma produselor abaterilor de la medie pentru perechile
concordante.
D = suma produselor abaterilor de la medie pentru perechile
discordante.
Semnificaia coeficientului:
-semnul indic sensul legturii + legtur direct
- legtur invers
- apropierea de zero = legtur slab sau inexistent
- apropierea de 1 = legtur puternic
Exemplu:
Se cunosc urmtoarele date privind salariul negociat i
vechimea n munc pentru 10 angajai ai unei firme:

Tabelul nr.60
Nr Vechimea n Salariul negociat
crt. munc
1 5 600
2 6 500
3 8 900
4 10 1,300
5 13 1,200
6 15 1,400
7 17 1,600
8 18 1,800
9 19 2,000
10 20 1,900

Aflai n ce msur cele dou variabile se coreleaz.


Vom folosi metoda Fechner, pentru care aezm datele n
urmtorul tabel:
Tabelul nr.61
Nr Vechi Salariul C
crt. mea n negociat xi yi sau
munc D
1 5 600 - - -
2 6 500 1 -100 D
3 8 900 2 400 C
4 10 1,300 2 400 C
5 13 1,200 3 -100 D
6 15 1,400 2 200 C
7 17 1,600 2 200 C
8 18 1,800 1 200 C
9 19 2,000 1 0 C
10 20 1,900 1 100 D
Total D=3
C=6
C D 63 3
f = = = = 0.33 sau 33%
C + D 6+3 9
n cazul dat cele dou variabile se coreleaz slab.
Aplicnd cea de-a doua variant a formulei gsim:

Tabelul nr.62
Nr crt. Vechimea n Salariul C
munc negociat xi yi sau
D
1 5 600 -9,1 -720 +6552
2 6 500 -8,1 -820 +6642
3 8 900 -6,1 -420 +2562
4 10 1,300 -4,1 +20 +82
5 13 1,200 -1,1 -120 +132
6 15 1,400 +0,9 +80 +72
7 17 1,600 +2,9 +280 +812
8 18 1,800 +3,9 +480 +1872
9 19 2,000 +4,9 +680 +3332
10 20 1,900 +5,9 +580 +3422
Total D=0
C=25480
x = 14,1 i y = 1320

f = 100%
!!! Se observ diferena de nivel nregistrat de cele dou
variante ale indicatorului. Aceasta diferen se explic prin
faptul c n prima variant se ine seama numai de numrul de
valori perechi concordante sau discordante i nu si de diferena
efectiv care definete concordana sau discordana.

Coeficientul de asociere
Permite msurarea rapid a legturii dintre dou variabile
numerice dar i nenumerice.
Se utilizeaz atunci cnd populaia statistic este grupat sau
se poate grupa dup o caracteristic alternativ.
Se calculeaz pe baza tabelului de asociere de forma:

Tabelul nr.63
y Y1 Y2 Total
x
X1 a b a+b
X2 c d c+d
Total a+c b+d a+b+c+d

produsul ad arat gradul de realizare a legturii directe


dintre x i y, iar produsul bc arat gradul de legtur invers
ntre cele dou variabile.
Formula de calcul este cea propus de Yule

ad bc
q=
ad + bc

Exemple:
Se cunosc urmtoarele date cu privire la structura a 50
uniti de alimentaie public dup procentul de cretere a
numrului de sortimente i procentul de cretere a ncasrilor
acestora.
Tabelul nr.64
Grupe dupa cresterea
incasarilor
Sub Peste
Total
7% 7%
Grupe dupa cresterea
nr. de sortimente
Sub 7% 23 3 26
Peste 7% 7 17 24
Total 30 20 50

Analizai existena legturii ntre creterea numrului de


sortimente i creterea ncasrilor, sensul i intensitatea
acesteia.
Calculm coeficientul de asociere dup formula lui Yule:
( 23 17 ) ( 7 3 ) 370
q= = = 0 ,90 sau 90%
( 23 17 ) + ( 7 3 ) 412
Apreciem c ntre cele dou variabile exist legtur direct
de intensitate mare.
0 Se cunosc urmtoarele date cu privire la situaia la
disciplina management n timpul anului i la examenul
final, pentru o grup de studeni.

Tabelul nr.65
Grupe dupa
nota la examen
7 i
Sub
peste Total
Grupe dupa nota 7
n cursul anului
Sub 7 1 1 2
7 i peste 5 16 21
Total 6 17 23
Exist legtur ntre pregtirea n cursul anului i nota la
examen la aceast disciplin? Ce fel de legtur i de ce
intensitate?
( 1 16 ) ( 5 1 ) 11
q= = = 0 ,52 sau 52%
( 1 16 ) + ( 5 1 ) 21
Apreciem c exist o legtur direct de intensitate medie.
Dac Francisc Galton n anii 1890 a gsit corelaie n
domeniul ereditii (ntre nlimea medie a prinilor i cea
a copiilor) punnd bazele teoriei corelaiei i a regresiei,
trebuie amintit faptul c mai trziu G.U.Yule introduce

expresia corelaii fr sens adic, corelaii care ntr-un


firesc al lucrurilor nu pot exista. El a gsit prin calcule un
coeficient de corelaie foarte mare, de 98,8%, ntre numrul
aparatelor radio din Anglia n perioada 1929 1937 i
numrul bolnavilor mintali din aceeai perioad.

!!! Coninutul economic sau social al unei formule


matematice sau al unei proceduri statistice l d omul
(economistul, sociologul,)i numai el.

Regresie i corelaie parametric.

Modelele de regresie au ca scop rezumarea legii de


evoluie a unui fenomen prin linia (curba) de regresie
reprezentnd corespondena ntre perechile de valori (xi,yi)
numit i linia (curba) de regresie a variabilei y n x.
Funcia de regresie exprim statistic modul n care
caracteristica rezultativ y s-ar modifica dac ar varia numai
valorile caracteristicii factoriale x iar ceilali factori ar fi
considerai cu aciune constant n toate cazurile observate.
Demersul analizei de regresie presupune :
- construirea corelogramei.
- aproximarea pe baza corelogramei a formei legturii i
scrierea ecuaiei (de tendin) corespunztoare modelului de
regresie ales.
- estimarea parametrilor ecuaiei de regresie pe baza
metodei celor mai mici ptrate.
Se ntlnesc cazuri:
- regresie unifactorial (simpl)
liniar
curbilinie
- regresie multifactorial
liniar
curbilinie

Regresia simpl liniar

n cazul n care prin reprezentarea grafic se observ o


tendin de legtur de tip liniar n care variaia
caracteristicii rezultative prezint o anumit tendin de
uniformitate a modificrii sale sub influena caracteristicii
factoriale, ecuaia care exprim aceast form de legtur va
fi:
y = a + bx
i are un caracter de medie deoarece mrimea sa exprim
tendina de realizare a corelaiei dintre cele dou variabile.

Dac ecuaia modeleaz corect legtura, dac ntr-adevr


legtura este liniar i factorul x determinant, atunci valorile
calculate pentru toate unitile observate trebuie s prezinte
abateri minime fa de valorile empirice.
Parametrii a i b ai modelului au de asemenea coninut de
valori medii.
parametrul a are valoare de mrime medie n sensul c
arat la ce nivel ar fi ajuns valoarea caracteristicii y dac toi
factorii, mai puin cel nregistrat, ar fi avut o aciune
constant asupra formrii ei (valorile individuale pentru y ar
fi fost egale ntre ele i egale cu media lor).
parametrul b se mai numete i coeficient de regresie
i exprim n sens geometric panta liniei drepte. Acesta arat
cu ct se schimb n medie variabila y n cazul n care
variabila x se modific cu o unitate i n ce sens se produce
modificarea: direct (b>0) sau indirect (b<0). Dac b=0
variabilele sunt independente.
n determinarea parametrilor a i b se pornete de la ideea c
dac y depinde de x atunci trebuie s se ndeplineasc
condiia ca suma ptratelor abaterilor valorilor empirice de
la valorile calculate s fie minim:
S = ( y i y c ) 2 = min im
adic: [ y i ( a + bx i )] = min im
2

se deriveaz aceast sum n raport cu derivatele celor doi


parametrii:
S
= 2 [ y i ( a + bx i )]( 1 )
a
S
= 2 [ y i ( a + bx i )]( x i )
b

Anulnd derivatele pariale i simplificnd cu 2 obinem:


na + b xi = yi
a x i + b x i2 = x i y i

Un procedeu mai simplu pentru obinerea sistemului de


ecuaii normale necesar calculului parametrilor a i b, este
urmtorul:
- se nmulete pe rnd ecuaia dreptei cu coeficienii lui a i
b respectiv cu 1 i x,
a + bx = y
ax + bx 2 = xy
- se nsumeaz toate ecuaiile corespunztoare celor n
termeni,
na + b x i = y i
a x i + b x i2 = x i y i
Rezolvnd sistemul se obin valorile pentru a i b i se
ajusteaz seria.
Ajustarea unei serii statistice const n nlocuirea
termenilor empirici (obinui prin observare) cu termeni
teoretici calculai pe baza modelului matematic.
Exemplu:
Se dau urmtoarele date cu privire la vechimea n munc i
salariul net ntr-un compartiment cu 10 persoane.
Tabelul nr.66
Nr.crt Vechime n Salariul net
. munc (xi) (mii lei) (yi)
1 16 860
2 27 970
3 9 870
4 16 910
5 20 950
6 6 850
7 22 930
8 18 910
9 29 970
10 11 870

Apreciai forma legturii dintre cele dou variabile i


gsii expresia matematic care o modeleaz. .

980
960
salariul net (mii lei)

940
920
900
880
860
840
0 10 20 30 40
vechime (ani)

Figura nr.18 Corelograma


Din graficul de corelaie a celor dou serii empirice se
apreciaz c legtura este de tip liniar.
Pentru a afla valorile parametrilor a i b care alctuiesc
funcia rezolvm sistemul de ecuaii normale folosind
metoda determinanilor:

a=
y x x y x
i
2
i i i i

n x ( x ) 2 2
i i

n x y x y
i i i i
b=
n x ( x ) 2 2
i i

Aezm elementele necesare rezolvrii acestui sistem i


gsirii formei funciei, ntr-un tabel de forma:

Tabelul nr.67
Nr
Y=811,15
.cr xi yi xi2 xiyi yi2
+5,624x
t.
1 6 850 36 5.100 722.500 844,892
2 9 870 81 7.830 756.900 861,763
3 11 870 121 9.570 756.900 873,010
4 16 910 256 14.560 828.100 901,127
5 16 860 256 13.760 739.600 901,127
6 18 910 324 16.380 828.100 912,374
7 20 950 400 19.000 902.500 923,621
8 22 930 484 20.460 864.900 934,868
9 27 970 729 26.190 940.900 962,986
10 29 970 841 28.130 940.900 974,233
To
174 9.090 3.528 160.980 8.281.300 9090,001
tal

Pe baza elementelor din tabel sistemul de ecuaii este:


10a+ 174b = 9.090
174a+3.528b = 160.980
Rezolvnd sistemul obinem parametrii:
a= 811,151
b= 5,624
Deci forma funciei liniare care modeleaz legtura dintre
variabile este: yc = 811,151+5,624x
Coeficientul de regresie, b = 5,624 semnific: pentru
datele luate n calcul, la o cretere cu un an a vechimii n
munc, salariul a crescut n medie cu 5,624 mii lei.
Pentru verificarea calculului parametrilor funciei de
regresie, i a corectitudinii modelului gsit, folosim relaia:
yi = yc
Urmrind ultima coloan din Tabelul nr.87 constatm c
prin ajustare se realizeaz de fapt o redistribuire a influenei
factorilor astfel nct factorul nregistrat s influeneze
sistematic n toate cazurile supuse observrii.

!!! Funcia de regresie este numai o ipotez statistic care


exprim regularitatea, tendina medie de manifestare a
legturii dintre cele dou caracteristici, considernd ca
variabil numai factorul nregistrat. ntre valorile empirice i
cele teoretice (estimate) apar abateri mai mari sau mai mici
dup cum influena celorlali factori considerai cu caracter
ntmpltor, este mai mare sau mai mic.

Coeficientul de corelaie liniar

Este indicatorul care permite msurarea gradului de


intensitate a legturii dintre caracteristica factorial i cea
rezultativ.
Se calculeaz ca o medie aritmetic simpl a produselor
abaterilor normate ale celor dou variabile.
Abaterile normate sunt:
xi x yi y
i
x y
iar coeficientul de corelaie liniar simpl este:
x i x y i y
( )( )
cy/ x =
x y = xi x yi y
n n x y
Indicatorul ia valori ntre 1 i +1, cu urmtoarea
semnificaie:
Dac cy/x este negativ ntre variabile este legtur
invers.
Dac cy/x este pozitiv ntre variabile este legtur
direct.
Dac cy/x se apropie de zero legtura este slab.
Dac cy/x se apropie de 1 sau 1 legtura este
puternic.
nlocuind mediile i abaterile medii ptratice cu
formulele lor de calcul obinem urmtoarea form a
coeficientului de corelaie liniar:
n x i y i ( x i )( y i )
cy/ x =
[ ][
n x i2 ( x i ) n y i2 ( y i )
2 2
]
Folosind datele din Tabelul nr. 66, gsim:
10 160.980 174 9.090
cy/ x = = 0 ,9251
[ ][
10 3.528 (172 ) 10 8.281.300 (9.090 )
2 2
]
Nr.crt. xi yi

1 6 850
2 9 870
3 11 870 a (INTERCEPT) 811,151079
4 16 910 b (SLOPE) 5,6235012
5 16 860
6 18 910 CORREL 0,92511769
7 20 950
8 22 930 TTEST 8,409E-14
9 27 970 TDIST 6,3503E-10
10 29 970
Total 174 9.090

Figura nr.19 EXCEL - regresia liniar simpl.


Regresia simpla curbilinie
n realitatea economic i social influena unor variabile
asupra altora n majoritatea cazurilor nu se realizeaz liniar
ci n forme curbilinii specifice.
n aceste cazuri este necesar ca pe baza corelogramei s se
aleag acea form a funciei care s prezinte abateri minime
de la linia valorilor empirice. Dac din corelogram nu se
desprinde clar forma funciei atunci este necesar s se
calculeze mai multe ecuaii de estimare cu care s se
ajusteze datele i s se aleag apoi aceea pentru care se
calculeaz cea mai mic eroare de ajustare.
Cele mai frecvente cazuri ntlnite sunt:
Legtura statistic de forma unei parabole de gradul 2:
y = a + bx + cx 2
Legtura statistic de forma unei hiperbole:
1
y=a+ b
x
Legtura statistic de form exponenial:
y = a + bx

Raportul de corelaie
Este indicatorul care msoar intensitatea legturii
curbilinii.
Formula de calcul, forma general este:
(y y )
2
i c
Ry / x = 1
(y y )
2
i

Unde: yi = valori empirice


yc = valori teoretice (calculate, ajustate)
y = nivelul mediu al variabilei rezultative
Semnificaia raportului de corelaie este aceeai ca i cea a
coeficientului de corelaie.
Nr.crt. xi yi

1 6 850
2 9 870 1000 0,0062x
3 11 870 980 y = 815,56e

salariul net(mii lei)


2
4 16 910 960 R = 0,8537
940
5 16 860
920
6 18 910 900
7 20 950 880
8 22 930 860
840
9 27 970 820
10 29 970 0 10 20 30
Total 174 9.090 vechime in munca

Figura nr.20 EXCEL - regresia unifactorial curbilinie


Teme propuse

.A
ntr-o expoziie au fost expuse zece variante dintr-un produs
nou. n cadrul expoziiei s-a realizat un sondaj cu privire la
preferinele pentru aceste variante de produs. Urmare
prelucrrii datelor sondajului s-au stabilit urmtoarele:

Tabelul nr.68
Produsul Locul ocupat n funcie de
pre preferine
P1 1 8
P2 2 5
P3 3 10
P4 4 6
P5 5 4
P6 6 2
P7 7 3
P8 8 7
P9 9 1
P10 10 9

Analizai dac ntre pre i preferin exist legtur,


n ce sens i de ce intensitate?
B
Printr-un sondaj de pia pe un eantion de 1000 de
persoane s-a stabilit c produsul Santal-pere a ptruns n
consumul populaiei dup cum urmeaz:
Tabelul nr.69

Structura eantionului
pe sexe Pe grupe de vrst (ani)
M F Sub20 20-35 35-50 Peste50
Consum 269 291 107 146 174 132
curent
Consum 221 219 93 96 116 136
ocazional
Total 490 510 200 242 290 268

S se stabileasc dac consumul produsului Santal pere se


difereniaz semnificativ funcie de sexul i vrsta
persoanelor consumatoare.

C
Folosind datele din Tabelul nr.93 calculai coeficienii de
corelaie statistic i stabilii dac exist legtur ntre
PNB/locuitor i volumul exporturilor pe locuitor, ce fel de
legtur i de ce intensitate?
Tabelul nr.70
-n mii dolar SUA
ara PNB/loc Export/loc
Australia 17.260 2,544
Austria 22.380 5.638
Belgia 20.880 11.845
Brazilia 2.770 0.229
Canada 20.710 4.892
Danemara 26.000 7.689
Elveia 36.080 9.534
Finlanda 21.970 4.669
Frana 22.260 4.043
Germania 23.030 5.340
Grecia 7.290 0.921
India 0.310 0.021
Italia 20.460 3.143
Japonia 28.190 2.738
Norvegia 25.820 8.193
Olanda 20.480 9.220
Regatul 17.790 3.293
Unit
Spania 13.970 1.646
SUA 23.240 1.757
Suedia 27.010 6.454
Sursa:Anuarul Statistic al Romniei.

D
Analizai corelaia ntre variabilele populaie i producie
industrial pentru apte judee folosind metoda Fechner i
coeficienii de corelaie a rangurilor Kendall i Spearman.
Comentai comparativ rezultatele.
Tabelul nr.71
Judeul Populaia Prod.ind.
(mii loc.) (mld.lei)
A 387 1895
B 308 1665
C 435 2055
D 178 1495
E 241 1397
F 363 1970
G 960 3070
E

n cadrul unui experiment n probleme de ergonomie a fost


urmrit efectul muzicii asupra productivitii a cinci operatoare
dintr-o firm de calculatoare. Patru programe muzicale diferite
A, B, C i D au fost comparate cu o situaie fr muzic, F.
Au fost efectuate msurtori cinci zile lucrtoare succesive.
Datele studiului s-au sistematizat ntr-un tabel de forma:

Tabelul nr.72
Zile
L M Mr. J V Total
Operatoare
A B C D F
O1 59
(12) (11) (12) (15) (9)
B C D F A
O2 59
(10) (12) (13) (10) (14)
C D F A B
O3 60
(11) (13) (10) (12) (14)
D F A B C
O4 70
(13) (11) (12) (18) (16)
F A B C D
O5 66
(10) (14) (17) (13) (12)
Total 56 61 64 68 65 314

Dac nsumm volumul valoric al contractelor


realizate pe tipuri de muzic ascultat, gsim:
A 12+14+12+12+14= 64
B 11+10+14+18+17= 70
C 12+12+11+16+13= 64
D 15+13+13+13+12= 66
F 9+10+10+11+10= 50
i concluzionm c muzica influeneaz semnificativ
productivitatea operatoarelor.
Testai semnificaia statistic a efectului muzicii asupra
activitii operatoarelor folosind testul F.
F
Volumul vnzrilor de mrfuri i nivelul cheltuielilor
publicitare pentru 50 de uniti dintr-un lan de magazine se
prezint astfel:
Tabelul nr.73
Vnzri

140 160
100 - 120

120 - 140

160 - 180

180 - 200

200 - 220
80 - 100
60 - 80

Total
Ch.
4-6 3 1 - - - - - - 4
6-8 3 - 1 - - - - - 4
8 - 10 2 2 1 - - - - - 5
10 - 12 - 3 2 - - - - - 5
12 14 - 3 1 3 3 - - - 10
14 16 - - 1 4 2 2 - - 9
16 18 - - - 1 1 3 2 1 8
18 - 20 - - - - - - 2 3 5
Total 8 9 6 8 6 5 4 4 50

Se cere:
Caracterizai variaia volumului vnzrilor n funcie de
nivelul cheltuielilor publicitare.
Verificai dac exist legtur ntre cele dou variabile.
Dac da, stabilii forma legturii.
Ajustai volumul vnzrilor n funcie de nivelul
cheltuielilor publicitare folosind funcia de regresie
adecvat.
Testai semnificaia corelaiei i a funciei de regresie.
BIBLIOGRAFIE

Anghel L., Florescu C., Zaharia R, Marketing probleme,


teste, Editura Expert, Bucureti, 1996 p.87.
Coord. T.Baron, E.Biji, Statistica teoretic i economic,
Editura didactic i pedagogic, Bucureti, 1996, p.161-188
Baron T.,Anghelache C-tin, ian E., Statistica, Editura
Economic, 1996, p.138-168.
Bdi M., Baron T., Korka M., Statistic pentru afaceri,
Editura Eficient, Bucureti, 1998, p.188-254.
Bernard Delmas, Statistique Descriptive, Nathan Universit,
p. 213-228
Biji E., Wagner P., Lilea E., Statistic, Editura Didactic i
Pedagogic, Bucureti, 1999, p.240-278
George C. Canavos, Don M. Miller, An Introduction to
modern business statistics, Duxbury Press,1993, p.492-571.
Goschin Zizi, Statistic, Editura Expert, Bucureti ,1999,
p.137-169
Jaba E., Statistica, Editura Economic, 1998, p.325-373.
Maniu A., Mitru C-tin, Voineagu V, Statistica pentru
managementul afacerilor, Editura Economic, Bucureti, 1996,
p.171-216.
Merce E., Mru P., Statistica economic n turism i
comer, UDC, Cluj, 1997, p.124-179.
Negoescu Gh., Ciobanu Rodica, Bazele statisticii pentru
afaceri, Editura ALL BECK, Bucureti, 1999, p.255-329.
Porojan Dumitru, Statistica i teoria sondajului, Editura
SANSA, Bucureti, 1993, p.96-124.
Stanciu S., Andrei T., Statistica teorie i aplicaii, Editura
ALL, Bucureti, 1995, p.252-358.

S-ar putea să vă placă și