Sunteți pe pagina 1din 16

SINTEZA PENTRU TEST 1

REGRESIE I CORELAIE STATISTIC



Cuprins
6.1 Legtura statistic noiuni eseniale i clasificare
6.2 Regresia statistic i valorificarea ei n contabilitatea practic
6.3 Corelaia statistic i valorificarea ei n contabilitatea practic
6.4 Test de autoevaluare i aplicaii statistice n contabilitate

Obiective:. Obiectivul esenial al capitolului este legat de nsuirea metodei regresiei i
corelaiei. Identificarea legturilor statistice ntre fenomenele economice se transpune
n nelegerea i abstractizarea unei forme de realitate superioar a vieii economice.
Investigaia prin metoda regresiei i corelaiei debuteaz cu intuiia grafic i este
urmat de aplicarea metodei celor mai mici ptrate, combinat i finalizat cu
abstractizarea succesiv a factorilor conform principiul stabilitii anumitor elemente
ale analizei statistice (caeteribus paribus). Rolul regresiei sau este completat de
capacitatea de analiz multicauzal a corelaiei. Determinaia se mpletete cu
nedeterminaia, parialitatea cu eroarea i rezidualitatea n nelegerea profund a
fenomenului economic. Dobndirea de competene privind identificarea existenei,
sensului i intensitii legturilor statistice i capacitatea de a interpreta valorile unor
indicatori speciali (coeficient de regresie i de corelaie, raport de corelaie i
determinaie) sunt elemente de mare impact n formarea gndirii statistice a studenilor
care vor lucra n domeniul deciziei contabile.
Cuvinte cheie: legtur, dependen i interdependen statistic, asociere, coeficient
de asociere, de interdependen i ptratul de contingen, metoda seriilor paralele
interdependente, gruprii, tabelului de corelaie, corelograma, regresia uni i
multifactorial, coeficient de regresie i corelaie, raport de corelaie, coeficient de tip
Spearman i Kendall, Fechner i Bravais-Pearson, coeficient de corelaie cu decalaj,
coeficient de elasticitate.
Bibliografie
Biji,M., Biji,E.,Lilea,E, Anghelache,C.,Tratat de statistic, Ed.Economic,Bucureti, 2002.
Isaic-Maniu, Al., (coord), Dicionar de statistic general, Ed.Economic, Bucureti, 2003.
M.Korka,L.,Begu,E.Tusa,Bazele statisticii pentru economiti, Ed.Tribuna Economic, 2002
C., Moineagu, I., Negur, V., Urseanu, Statistica, Ed.tiinific, Bucureti,1976.
G. Svoiu, Statistic general.Argumente n favoarea formrii gndirii statistice, Ed. Independena
Economic, Piteti, 2003.
G. Svoiu, Statistic aplicat n domeniul economic i social. Elemente teoretice, teste tip gril,
aplicaii i studii de caz, Ed. Independena Economic, Piteti, 2004.
G. Svoiu, Statistica.Un mod tiinific de gndire, Ed.Universitar, Bucureti, 2007.
G. Svoiu, Statistica.Mod de gndire i metode, Ed.Universitar, Bucureti, 2009.
G., Svoiu, Statistica pentru afaceri, Ed.Universitar, Bucureti, 2011.
V.Trebici, Mica enciclopedie de statistic,Ed.tiinific i enciclopedic,Bucureti, 1985.
M. arc,Tratat de statistic aplicat, Ed. didactic i pedagogic R.A. Bucureti, 1998.
Webografie
***http://www. insse.ro i ***http://epp.eurostat.ec.europa.eu/ i *** http://www. bnr.ro

2
6.1 Legtura statistic noiuni eseniale i clasificare

n varianta extins sau generalizat, legtura statistic a dou sau mai multe
variabile reprezint influena unidirecional (reciproc), manifestat prin
dependene sau interdependene, care conduc la schimbarea nivelului de dezvoltare
final. Aceast variaie unidirecional sau reciproc poate fi numit, fie variaie a
caracteristicii dependente n raport cu o alt caracteristic independent, fie
covariaie sau legtur prezent ntre cele dou variabile. Variabila independent
este numit explicativ, cauzal sau factorial, n timp ce variabila dependent
apare ca rezultativ, explicat sau ca efect. Legturile sau covariaiile dintre diverse
fenomene sau procese din natur i din societate se afl sub o permanent influen
a legilor dinamice sau de tip statistic. O lege dinamic, transpus simplificat,
genereaz o legtur dinamic (cauzal), sintetic exprimat prin afirmaia: unei
cauze x
i
i corespunde un efect y
i
, respectiv unui nivel x
i
i corespunde un anumit
nivel y
i
. O lege de tip statistic, esenializat ntr-o legtur de tip statistic, este
caracterizat prin formularea: variabila y
i
depinde de mai multe cauze x
1
,x
2
,,x
i

,x
n
. Rezult c legea statistic este caracterizat de o relaie de multicauzalitate,
unele variabile explicative, independente, factoriale deinnd un caracter esenial,
altele unul ntmpltor.Legtura dinamic dintre x i y devine matematic o funcie
univoc sau unifactorial y
i
= f(x
i
), n timp ce legtura statistic se transform ntr-o
funcie multifactorial y
i
= f(x
1
, x
2
,, x
i
,,x
n
).n mod concret, coninutul relaiilor
existente ntre familia factorilor explicativi x
1
,x
2
,,x
i
,x
n
i efectul y
i
descrie: a) o
dependen statistic (legtur univoc sau dinamic); b)o interdependen
statistic (legtur biunivoc); c) o interdependen fals (aparent), care dezvluie
n profunzime o cauz comun; d) o dubl dependen compensat al rezultat final
asupra lui y este nul; e) descrie un simplu paralelism variaional ntre cele dou
variabile, ce las impresia unei legturi statistice (x
k
nefiind un factor al lui y).
Dintre cele cinci cazuri descrise, numai primele dou merit i pot fi caracterizate
numeric, pentru a intensifica gradul de cunoatere al variaiei lui y
i
, n raport cu
factorii x
1
,x
2
,,x
i
,,x
n .
Cazurile c, i d nu precizeaz pentru moment informaii
cantitative relevante, iar cazul e este tipic pentru un paralelism variaional de scurt
sau lung durat, lipsit de semnificaie n aprofundarea variaiei lui y
i
.n cazul unui
asemenea conglomerat dinamic de factori nu este posibil ca relaia dintre cauz i
efect s poat fi constatat la fiecare manifestare (x
i
y
i
). Relaia dintre variabila
explicativ i variabila explicat poate fi ns sesizat ca o tendin medie specific
unui numr suficient de mare de manifestri, elemente, indivizi. Analiza legturilor
i stabilirea unei regresii sau corelaii d rezultate bune atunci cnd: a) exist un
numr suficient de mare de cazuri individuale (perechi x
i
, y
i
); b) distribuia
abaterilor este o distribuie normal sau aproximativ normal; c) abstractizarea
factorilor se realizeaz succesiv. Legtura statistic, n forma ei generic numit
corelaie statistic, reprezint deci o reflectare ntr-o form numeric adecvat a
interdependenei dintre fenomenele, procesele, indicatorii diverselor fenomene
cercetate, n ceea ce privete natura, forma, direcia (sensul) i gradul de
intensitate. Tipologia legturilor statistice este una dintre cele mai diverse, avnd la
baz o gam variat de criterii. Principalele clasificri se realizeaz n raport de:
a) natura relaiei de cauzalitate [legturi funcionale, univoce sau de cauzalitate
3
simpl de tipul y
i
=f(x
i
),precum i legturi statistice (stohastice sau multicauzale) de
tipul y
i
= f(x
1
,x
2
,...,x
i
,x
n )
];
b) numrul caracteristicilor factori sau al variabilelor luate n analiz (legturi
statistice simple, n care apare o singur variabil rezultativ, dependent,
explicativ sau efect y
i
i se abstractizeaz sau se izoleaz din mulimea de cauze
posibile numai una singur x
i
, numit i variabil independent sau explicativ,
precum i legturi statistice multiple, n care efectul y
i
este rezultatul a dou sau
mai multe variabile factoriale, cauzale concomitente sau asincrone);
c) tipul i natura caracteristicilor (legturi referitoare exclusiv la variabilele
cantitative i asociaii statistice, nerestricionate dar specifice celor calitative);
d) forma legturii dintre variabile [legturi liniare exprimate prin ecuaia unei
drepte (y
i
=a+bx
i
) i legturi curbilinii, exprimate prin ecuaia unei funcii
exponeniale (y
i
=ab
x
), parabolice (y
i
= a+bx
i
+
2
i
cx ), hiperbolice (y
i
=a+b
1
x
i
) etc. ];
e) direcia sau sensul n care se produc (legturi directe sau de acelai sens i
legturi inverse sau de sens contrar);
f) timpul efectiv n care se realizeaz (legturi sincrone sau concomitente i
legturi asincrone sau cu decalaj);
g) coninutul relaiei dintre variabile (dependene i interdependene).
n lipsa unor serii lungi de date, n practica statistic dependenele i
interdependenele false, compensate sau paralele - cu sensul de legturi artificiale-
se las greu identificate sau descoperite i necesit alturi de testri semnificative i
o analiza conceptual, structural i funcional economic i social.

6.2 Regresia statistic i valorificarea ei n contabilitatea practic

n mod curent, pentru identificarea i caracterizarea sumar a legturilor statistice
se utilizeaz urmtoarele metode elementare: metoda seriilor paralele
interdependente, metoda gruprii, metoda tabelului de corelaie, metoda grafic sau
corelograma, ultima fiind cea mai des folosit. Prima utilizare a conceptului de
origine latin regresie (regressio = ntoarcere) aparine lui Francis Galton i a
aprut n Regression toward mediocrity in hereditary stature (1886), din lucrarea
Natural inheritance (1889), unde cu ajutorul tabelului de corelaie i al seriilor de
medii legate, prezint rezultatele prelucrrii observaiilor culese despre nlimea
prinilor i nlimea fiilor acestora n 928 cazuri, postulnd existena unei regresii
ctre valoarea medie: din prini cu talie superioar regreseaz copii cu talie
inferioar i invers. De aici au aprut dou aspecte majore n teoria
regresiei:ecuaia matematic a regresiei i intensitatea diferit a tendinei de
regresie, n grupuri diferite. Rspunsul matematic avea s fie dat de ctre Karl
Pearson, la primul aspect prin indicarea funciei liniare simple ca fiind singura
adecvat problemei lui Francis Galton i la al doilea aspect prin introducerea
celebrului su coeficient de corelaie. n anul 1909, G.U.Yule a propus, n locul
termenului de regresie, impropriu utilizat, un altul de estimare sau de ecuaie de
estimare. S-a constatat ns, c ncercarea era tardiv, termenul de regresie intrase
i se extinsese rapid n gndirea statistico-matematic, conform expresiilor analiza
4
de regresie, ecuaia de regresie, linia de regresie, coeficientul de regresie etc.
Regresia statistic sau metoda regresiei selecteaz funcia, ce aparine unei clase de
funcii matematice, care realizeaz cea mai bun descriere a variaiei lui y
i
,
bazndu-se pe relaia existent ntre x
i
i y
i
, o relaie liniar de tipul
y
i
=a+bx
i
.Determinarea rapid a parametrilor regresiei liniare se realizeaz prin
intermediul metodei celor mai mici ptrate. Metoda este aplicabil numai acelor
funcii care sunt de form polinomial sau pot fi aduse la o form polinomial
printr-un artificiu de calcul. Prin mulimea punctelor care alctuiesc corelograma
sau diagrama de corelaie se pot trasa practic o infinitate de drepte aparinnd
aceleiai clase de funcii. Pentru a determina parametrii funciei care se apropie cel
mai mult de mulimea punctelor din grafic se recurge la minimizarea sumei
ptratelor diferenelor dintre punctele graficului P
i
(x
i
,y
i
) i punctele situate pe
dreapta de regresie P
i
(x
i
, y
i
= a+bx
i
). n ipoteza avansat a unei legturi liniare (y
i

depinznd liniar de x
i
), respectiv y
i
= y
(xi)
= a + bx
i
, condiia matematic impus
devine:
2
( )
( )
i
i x
y y

=minim, echivalent practic cu:


2
( )
i i
f y a bx =

=
minim. Pentru a stabili valoarea parametrilor a i b care definesc ecuaia regresiei
liniare, minimul funciei f se obine calculnd derivatele (pariale) de ordinul nti
n raport cu cei doi parametrii menionai, derivate ce sunt egalate cu zero:

2 ( )( 1) 0
i i
f
y a bx
a
c
= =
c



2 ( )( ) 0
i i
f
y a bx b
b
c
= =
c


Apoi, simplificnd cu 2, nmulind cu cei doi coeficieni (-1) i (-x
i
) i nsumnd
ecuaiile pentru toate valorile caracteristicilor xi i yi se obine sistemul:


1 1 1
0
n n n
i i
i i i
a bx y
= = =
+ =


1 1
n n
i i
i i
na b x y
= =
+ =



2
1 1 1
0
n n n
i i i i
i i i
ax bx x y
= = =
+ =


2
1 1 1
n n n
i i i i
i i i
a x b x x y
= = =
+ =



Apelnd la metoda determinanilor, sistemul va avea urmtoarele soluii
redactate simplificat, fr a se mai preciza operatorului sum () limitele:
2 2
2 2
2
det
( )
det
y x
i i
x y x y x x x y
i i i i i i i i
a
n x
i n x x
i i
x x
i i
| |
|
|

\ .
= =
| |

|
|

\ .

2 2
2
det
( )
det
n y
i
x x y n x y x y
i i i i i i i
b
n x
i n x x
i i
x x
i i


= =



| |
|
\ .
| |
|
|
\ .

5
Ecuaia de regresie cutat y
i
= a + bx
i
este identic, n final, cu:
2
2 2
( )
i i i i i
i
i i
y x x x y
Y
n x x
| |
= +
|
|

\ .


2 2
( )
i i i i
i
i i
n x y x y
X
n x x
| |
|
|

\ .



Parametrul a este lipsit de semnificaie, n schimb b sau coeficientul de regresie
arat sensul (+ sau -) i mrimea influenei lui x
i
asupra lui y
i
, respectiv sensul
i mrimea reaciei finale a lui y
i
la modificarea cu o unitate a lui x
i
: a) cnd b > 0
exist o legtur direct; b) cnd b = 0 nu exist nici o legtur; c) cnd b < 0 exist
o legtur indirect. De multe ori, apar diferene ntre valorile reale y
i
i valorile
teoretice
i
x i
Y a bx = + , pentru acelai nivel al variabilei cauzale x
i
, diferene care
exprim efectul celorlali factori (secundari), ce perturb relaia dintre x
i
i y
i
. Ca
urmare funcia de regresie liniar
i
x i
Y a bx = + sau f(x
i
)=
i
a bx + exprim tendina
medie de modificare liniar a lui y
i
n funcie de x
i
. fiind dreapta care se apropie cel
mai mult de norul de puncte pe care l traverseaz n corelograma sa specific.
Pentru a evalua capacitatea unei funcii liniare de a caracteriza variaia lui y
i
n
raport cu x
i
se utilizeaz unul din cei doi indicatori de apreciere a calitii funciei
de regresie: coeficientul de determinaie D i coeficientul de eroare e.
( )
( )
2
2
1 100
i
i x
i
y Y
D
y y
(

(
=
(


,unde D e (0,100%).Cu ct D este mai apropiat ca valoare de 100%, cu att
funcia de regresie liniar
i
x i
Y a bx = + descrie mai fidel variaia lui y
i
. Valoarea lui
D(%) exprim procentual acea parte din variaia lui y
i
care este surprins sau
cuprins n funcia de regresie liniar
i
x i
Y a bx = + , adic este explicat prin
influena lui x
i
. Coeficientul de eroare se determin similar coeficientului de
omogenitate,
( )
2
/ 100 Co x o = , cu referire la dispersia dintre punctele reale i
cele teoretice situate pe dreapta
i
x i
Y a bx = + :
( )
2
100
y Y
x
i
i
n
i
y
e

=
,unde e e (0,100%).
Cu ct e se apropie de valoarea zero, cu att este mai corect descrierea
mulimii de valori reale ale lui y
i
prin intermediul funciei de regresie liniare
i
x i
Y a bx = + . Tipul de legtur statistic descris anterior este o regresie liniar
simpl. Complexitatea fenomenelor i proceselor analizate conduce la identificarea
de legturi liniare multiple, funcia de regresie liniar multipl avnd la baz o
relaie cauzal multifactorial (sub aciunea celor m factori determinani):
6
0 1 1 2 2
...
, ,...
1 2
m m
Y a a x a x a x
x x x
m
= + + + + , unde:
a
0
exprim influena altor factori (secundari) cu aciune constant n afara celor
m factori analizai i cuprini n relaia de calcul i a
1
,a
2
,,a
m
reprezint
coeficienii de regresie liniar multipl i exprim cu ct a reacionat n final
variabila y
i
la modificarea cu o unitate a valorii variabilelor x
i
corespondente
(x
1
,x
2
,x
m
).
Legtura liniar multipl se transpune grafic sub forma unei suprafee
multidimensionale, determinarea parametrilor a
1
,a
2
,,a
m
, valorificnd aceeai
metod a celor mai mici ptrate, prin condiia de minim a funciei:
( )
2
( )
, ,...,
1 2 1
n
f x y Y
x x x i
m
j
=
=
= minim i nlocuind pe
0 1 1 2 2
...
, ,...
1 2
m m
Y a a x a x a x
x x x
m
= + + + + se obine
( )
2
0 1 1 2 2
1
( ) ...
n
i j j m mj
j
f x y a a x a x a x
=
=

= minim
Calculnd apoi derivatele de ordinul nti (pariale), derivate ce sunt egalate n
final cu zero, se obine sistemul de ecuaii:
0 1 1
1 1 1
2
0 1 1 1 1 1
1 1 1 1
2
0 1 1
1 1 1 1
n n n
na a x a x y
m mj j j
j j j
n n n n
a x a x a x x y x
m mj j j j j j
j j j j
n n n n
a x a x x a x y x
m mj mj mj j mj j
j j j j
+ + + =
= = =
+ + + =
= = = =
+ + +
= = = =
=
K
K
M
K

Sistemul conine m+1 ecuaii normale i se soluioneaz prin diverse metode
clasice (metoda Cramer, metoda simplex etc.). Dup identificarea, parametrizarea
i aprecierea calitii unei funcii liniare de regresie se impune evaluarea final a
intensitii legturii statistice.Pentru gndirea econometric a stabili ct de
puternic sau ct de intens este o legtur statistic este mai ales o problem de
veridicitate (verosimilitate) a modelului ce descrie dependena sau interdependena
unor fenomene reale. O intensitate puternic este echivalent cu un nivel de
ncredere ridicat n deciziile ulterioare ce vor fi bazate pe funcia teoretic
identificat i parametrizat. Pentru a msura intensitatea legturii se determin
covariana i coeficientul de corelaie, iar pentru verificarea liniaritii se apeleaz
i la raportul de corelaie. Covariana, notat cov(x,y), se determin ca medie
aritmetic a produselor abaterilor individuale ale variabilelor fa de media lor:
( )( )
1 1
cov( , )
x y i i
n n
i i
d d x x y y
x y
n n
= =

= =


Prelucrnd relaia anterioar n care:
( )( )
1 1
1 1
i i
i i i i
n n
n n
i i
i i
x y
x x y y x y
n
= =
= =
=


se
7
ajunge la: cov( , )
x y x y
i i i i
x y xy x y
n n n

= =
Covariana este aadar egal i cu diferena dintre media produsului celor dou
variabile ( xy ) i produsul celor dou medii ( x y ) i beneficiaz de proprieti
importante. Astfel, semnul covarianei arat sensul legturii, iar valoarea zero
indic inexistena acesteia (independena variabilelor). Limitele valorice ale
covarianei sunt: -
x

y
cov(x,y)
x

y
, deoarece covariana are ca maxim
produsul
x

y
(atunci cnd ntre variabile exist o legtur liniar funcional).
Aprecierea intensitii rezultatului obinut drept covarian rmne ns dificil,
deoarece valoarea acesteia difer de la o aplicaie la alta.Dac relaia anterioar se
mparte la produsul
x

y
se va obine:
cov( , )
x y x y
x y x y x y
x y
o o o o
o o o o o o
s s sau
cov( , )
1 1
x y
x y
o o
s s
Aceast nou relaie stabilizeaz sau limiteaz noul indicator obinut n intervalul
[-1,1]. Parametrul rezultat este denumit coeficient de corelaie (r
y/x
):
cov( , )
/
x y
r
y x
x y
o o
= =

( )( )
( ) ( )
1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n
d d x x y y n x y x y
x y i i i i i i
i i i i i
n n
n n n n x y x y
n x x n y y
i i i i
i i i i
o o o o

= = = = =
= =

= = = =
( (
( (


Dualitatea n regresie permite calculul coeficientului de regresie pe baza mediei
geometrice a coeficienilor de regresie sau a pantelor celor dou drepte de regresie:
/
i
x y x i
Y a b x = + i
/
i
y x y i
X a b y = + , respectiv:
/ / /
r b b
y x y x x y
= .
O soluie practic este i relaia de calcul:
( )
/
/ /
r b
x y
y x y x
o o = , dac se
dispune cu promptitudine de
x
o i
y
o . Coeficientul de corelaie (r
y/x
), ca parametru
al distribuiilor normale bidimensionale ce caracterizeaz legtura ntre variabila
explicativ x
i
i variabila rezultativ y
i
aparine intervalului [-1,0) (0,1]. Pentru
r
y/x
=0 nu exist legtur statistic, variabilele x
i
i y
i
fiind independente.
Interpretarea unui coeficient de corelaie se realizeaz succint n modul matematic
(
/
r
y x
) i conform acestei interpretri se consider corecte urmtoarele afirmaii:
1. cnd
/
r
y x
e(0;0,2] practic nu exist legtur statistic sau este foarte slab;
2. cnd
/
r
y x
e(0,2;0,5] legtura este slab i trebuie testat statistic;
3. cnd
/
r
y x
e(0,5;0,75] legtura este de intensitate medie;
4. cnd
/
r
y x
e(0,75;0,95] legtura este puternic;
5. cnd
/
r
y x
e(0,95;1] legtura este foarte puternic,determinist (funcional).
8
O problem important a regresiei liniare este testarea liniaritii legturii
ca soluie exclusiv, n raport cu orice alt funcie neliniar (curbilinie).
Testul de verificare a liniaritii const din confruntarea valorii
coeficientului (r
y/x
) i a raportului de corelaie (R
y/x
). Dac cele dou valori
coincid (r
y/x
= R
y/x
), atunci corelaia este exclusiv de liniar. Raportul de
corelaie msoar intensitatea legturii indiferent de forma acesteia (liniar
sau neliniar).Raportul de corelaie (R
y/x
) este rezultatul extragerii unui
radical elementar (de ordin II ) din coeficientul de determinaie (R squared
sau R
2
y/x
):
( )
( )
2
2 1
/ / 2
1
1
n
i
y x y x n
i
y Y
x i
i
R R
y y
i
=
=

= =

sau
/ y x
R D = , iar R
y/x
e (0,1].
Dac
( )
2
1
n
i x
i
i
y Y
=
tinde ctre zero, raportul de corelaie tinde spre valoarea
maxim (R
y/x
=1). Dac r
y/x
R
y/x
, atunci legtura nu este exclusiv liniar.

6.3 Corelaia statistic i valorificarea ei n contabilitatea practic

Corelaia statistic sau conceptul generic al legturii statistice este reflectarea
ntr-o form numeric adecvat a interdependenelor obiective dintre procese sau
fenomene. Corelaia include att asocierea ct i regresia, att legtura liniar ct i
neliniar (curbilinie), att legtura simpl, ct i cea multipl, att parial ct i
total. Conceptul are o istorie iniial legat de tiinele naturii. Termenul corelaie,
exprim relaia, legtura reciproc ntre dou sau mai multe lucruri sau fenomene.
Etimologic provine din cuvntul de origine latin correlatio = relaie cu, fiind
preluat din tiinele naturii, de la principiul corelaiei aa acum a fost el formulat de
ctre naturalistul francez Georges Cuvier (1769-1832): orice fiin nzestrat cu
organe formeaz un ansamblu, un sistem unic i nchis, ale crui pri se leag
mutual i concur la aceeai aciune definitiv printr-o reacie reciproc. Nici una
din aceste pri nu poate s se schimbe fr ca celelalte s nu se schimbe, i, prin
urmare, fiecare din ele, luat separat, influeneaz i se leag de toate celelalte.
(P.Fouqui, R Saint-Jean-Dictionaire de la langue filosofique). Cea de-a dou surs
aparine lui Charles Darwin, care a folosit expresia variabilitate corelativ neleas
ca raporturi reciproce ntre pri diverse ale organismului. Tot Francis Galton este
cel care a transpus corelaia cu semnificaia de raporturi reciproce ntre variabile n
statistica matematic: corelaiile se observ peste tot unde variaiile a dou
fenomene sunt datorate n parte uneia i aceleiai cauze comune.(Correlations and
their measurements).n practic, apar variate legturi neliniare sau curbilinii
specifice dependenelor dintre variabila explicativ x
i
i rezultativ y
i
. Dac prin
corelogram s-a identificat o hiperbol:
1
i
x
i
Y a b
x
= +
, prin metoda celor mai mici
ptrate rezult:
( )
2
1
n
i x
i
i
y Y
=

=minim
2
1
1
i
i
n
i
y a b
x
=
( | |
+
( |
\ .

=minim, iar sistemul de


9
ecuaii util determinrii lui a i b este:

1
1 1
n n
na b y
i
i i x
i
+ =
= =


1 1 1
2
1 1 1
n n n
a b y
i
i i i x x
x
i i
i
+ =
= = =

Soluiile sistemului sunt cele prezentate n continuare:
1
det
1 1 1 1 1
2 2
1 1 1 2
( )
2
det
1 1
2
y
i
x
i
y y y
i i i
x x x x x
i i i i i
n n
x x x
i i i
x
x
i
i
a


= =


| |
|
|
|
|
|
\ .
| |
|
|
|
|
|
\ .

det 1 1 1 1
1 1 1 2
( )
2
det
1 1
2
n y
i
y n y y
i i i
x x x x
i i i i
n n
x x x
i i
i
x
x
i
i
b


=


| |
|
|
|
\ .
=
| |
|
|
|
|
|
\ .

Raportul de corelaie specific bazat pe o funcie hiperbolic este egal cu:
( )
2
1
1
1
/ 2
1
n
y a b
i
x i
i
R
y x n
y y
i
i

=
=

=
| |
|
|
\ .

n situaia cnd corelograma identific o funcie exponenial: Y
xi
= ab
xi
funcia
este de forma: lgY
xi
= lga + x
i
lgb, care, prin metoda celor mai mici ptrate:
( )
2
1
i
n
i x
i
y Y
=

= minim
2
1
i
n
x
i
i
y ab
=
(

= minim, conduce la urmtorul sistem


de ecuaii normale necesar calcului parametrilor a i b, prin valorile lga i lgb:

1 1
lg lg lg
n n
i i
i i
n a x b y
= =
+ =


2
1 1 1
lg lg lg
n n n
i i i i
i i i
x a x b x y
= = =
+ =


Soluiile sistemului sunt cele descrise n continuare:
10
lg
det
2 2
lg lg lg
anti lg anti lg
2 2
( )
det
2
y x
i i
x y x y x x x y
i i i i i i i i
a
n x
n x x i
i i
x x
i i


= =



| |
|
|
\ .
| |
|
|
\ .

lg
det
lg lg lg
anti lg anti lg
2 2
( )
det
2
n y
i
x x y n x y x y
i i i i i i i
b
n x
n x x i
i i
x x
i i


= =



| |
|
\ .
| |
|
|
\ .

Raportul de corelaie specific bazat pe o funcie exponenial este egal cu:
( )
( )
2
1
1
/ 2
1
n x
i
y ab
i
i
R
y x n
y y
i
i

=
=

=

Dac funcia identificat n corelogram este o funcie parabolic (de gradul al-
II-lea),
2
i
x i i
Y a bx cx = + + , dup aplicarea metodei celor mai mici ptrate:
( )
2
1
i
n
i x
i
y Y
=

= minim
( )
2
2
i i i
y a bx cx
(
+ +

= minim,
se va obine un sistem de trei ecuaii, util determinrii parametrilor a, b i c:

2
1 1 1
n n n
i i i
i i i
a b x c x y
= = =
+ + =


2 3
1 1 1 1
n n n n
i i i i i
i i i i
a x b x c x x y
= = = =
+ + =


2 3 4 2
1 1 1 1
n n n n
i i i i i
i i i i
a x b x c x x y
= = = =
+ + =


Soluiile sistemului sunt urmtoarele:
2
2 3
2 3 4
2
2 3
2 3 4
det
det
i i i
i i i i
i i i i
i i
i i i
i i i
y x x
x y x x
x y x x
a
n x x
x x x
x x x
| |
|
|
|
\ .
=
| |
|
|
|
\ .






,
2
3
2 2 4
2
2 3
2 3 4
det
det
i i
i i i i
i i i i
i i
i i i
i i i
n y x
x x y x
x x y x
b
n x x
x x x
x x x
| |
|
|
|
\ .
=
| |
|
|
|
\ .






i
11
2
2 3 2
2
2 3
2 3 4
det
det
i i
i i i i
i i i i
i i
i i i
i i i
n x y
x x x y
x x x y
c
n x x
x x x
x x x
| |
|
|
|
\ .
=
| |
|
|
|
\ .






iar
( )
( )
2
2
1
1
/ 2
1
n
y a bx cx
i i i
i
R
y x n
y y
i
i

=
=

=

Fiecare parametru a, b i c se determin efectiv, utiliznd regula lui Cramer
pentru sisteme de tip 33 (trei rnduri trei coloane).Funciile neliniare sau
curbilinii nu se reduc la cele prezentate anterior. Se mai pot identifica prin
corelograme i funcii putere (
x
i
Y a b
x
i
= ), logaritmice ( lg ) Y a b x
x i
i
= + etc.
Semnificaia raportului de corelaie se verific prin testul F al a analizei
dispersionale, comparnd valoarea lui
( ) ( )
2 2
n n
x x i
i i
i=1 i=1
calculat
Y - y y - Y
F =
k -1 n - k
:

cu valoarea
lui F
tabelat
sau (F
teoretic
), unde k = numrul grupelor i n = numrul unitilor
statistice.Raportul de corelaie este semnificativ cnd F
calculat
> F
tabelat
pentru k-1 i
respectiv n-k grade de libertate i pentru un nivel de probabilitate riguros precizat
de 0,95; 0,97 sau 0,99 i mai rar valori superioare. n corelaia multipl, specific
distribuiilor multidimensionale se utilizeaz un raport de corelaie generalizat
(dreapta) care se particularizeaz n cazul a dou variabile explicative x
1
i x
2

(stnga):
( )
( )
2
n
x ,x ,...x
n
1 2
i=1
y/ x ,x ,...x 2 n n
1 2
i=1
y - Y
i
R = 1-
y - y
i

i
2 2
r
y/ x y/ x y/ x y/ x x / x
1 2 1 2 1 2
y/ x ,x 2
1 2
x / x
1 2
r + r - 2 r r
R =
1- r

Corelaia parial este o form de izolare a unei legturi statistice ntr-un context
relaional mai larg. Acest tip de corelaie caracterizeaz intensitatea legturii ntr-o
ipotez de meninere a influenei unei singure variabile explicative x
1
n raport cu o
variabil rezultativ Y
x
. n cazul a dou variabile independente x
1
i x
2
explicative i
a unei singure variabile independente Y, coeficientul de corelaie parial (de
ordinul nti) se calculeaz astfel: neglijnd influena lui x
2
sau x
1
:

/ / /
1 2 2 1
( / ),
2 2 1 2
/
/ 2
2 1
(1 )(1 )
Y x Y x x x
Y x x
Y x
x x
r r r
r
r r

=

sau
/
1 / 2
2 1
( / ),
2 2 2 1
/
/ 1
2 1
(1 )(1 )
Yx Y x
x x
Y x x
Y x
x x
r r r
r
r r

=



Abordarea n timp a corelaiei extinde noiunea n sine i structureaz trei tipuri
de corelaii temporale:
a) autocorelaia sau corelaia intern ca legtur ntre valorile aceleiai variabile,
12
separate printr-un interval de timp;
b) corelaia sincron sau legtura ntre valoarea variabilei explicative x
i
, luat
ntr-un anumit moment i valoarea variabilei rezultative y
i
, luat n acelai moment;
c) corelaia asincron sau cu decalaj, ca legtur ntre valoarea variabilei x
i

(prompt sau nedecalat), atins ntr-un anumit moment i valoarea unei alte
variabile y
i
(tardiv sau decalat), atins dup un interval de timp determinat.
Ultima categorie permite calculul unui coeficientul de corelaie simpl cu decalaj
(autori Morice E. i Charter F.), dup relaia:
( )
( )
( )
( )
n
t-h
i=1
x - x - y - y
i
r =
h
n - h
x y

, unde: t =
numrul de termeni al seriei iniiale i h = numrul de termeni cu care se decaleaz
cea de-a doua serie. Pentru a fixa corect valoarea lui h se reprezint grafic cele
dou serii i se gliseaz un grafic peste cellalt (reprezentri la aceeai scar).
Coeficientul r
h
arat practic legtura ntre primii termeni ai seriei factoriale x
i
i
ultimii termeni ai celei tardive rezultative y
i
, x
i
: x
1
,x
2
,x
3
,...,x
t
i y
i
:y
1+h
,y
2+h
, y
3+h
,...,
y
t+h
.
Identificarea rapid i selectarea unor factori eseniali apeleaz i la metode
neparametrice, ce presupun nlocuirea variantelor reale cu numere de ordine
(ierarhizare, ranguri etc.) sau cu diferene ntre termeni consecutivi i prezint
avantaje semnificative prin utilizare, cnd distribuia variabilelor corelate nu este
normal sau nu este cunoscut i n condiii de asimetrie a distribuiilor variabilelor
corelate, deoarece: a)permit obinerea rapid a confirmrii sau infirmrii existenei
legturii statistice (inclusiv a intensitii, dac se identific o corelaie); b) sunt
unica soluie n situaia concret a lipsei de date absolute compensat de existena
unor clasamente, ierarhii, diferene ntre variante succesive etc.; c) constituie soluii
practice cnd una sau ambele variabile corelate sunt calitative.
I. Coeficientul de asociere definit de Yule G.U. i Kendall M.G. drept o situaie n
care una dintre variabilele calitative nu poate avea loc fr cealalt variabil
calitativ, dei cealalt poate avea loc fr ca prima s se fi produs este cea mai
simpl soluie practic.
Debutul determinrii este dat de prezentarea variabilelor x
i
i y
i
cu variantele x
1
i
non x
1
, respectiv y
1
, i non y
1
ntr-un tabel sintetic:
Tabel nr. 6.1.
yi
x
i

y
1
nony
1
sau y
2

Total
x
1
a b a+b
nonx
1
sau x
2
c d c+d
Total a+c b+d a+b+c+d
n condiiile notaiilor anterioare, relaia de calcul a acestui coeficient devine:
Y =
ad
bc
ad
bc
+

1
1
sau Y =
bc ad
bc ad
+

.Cei doi coeficieni Yule G.U. i Kendall


M.G. respectiv Q i Y beneficiaz de proprieti i deficiene asemntoare,
dezavantajul lor major fiind acela de a nu face distincie ntre asociere complet, n
13
formele ei pozitiv i negativ, detaliat pentru cele trei situaii specifice (fie n
forma pozitiv b=c, c=0 sau b=c=0, fie n forma negativ a=0, d=0 sau a=d=0).
II. Coeficienii Charles Eduard Spearman (r
s
sau ) i Maurice Kendall (r
k
sau )
presupun n prealabil acordarea de ranguri (umere de ordine), n funcie de poziia
deinut de unitatea statistic, dup ce s-a procedat la ordonarea lor cresctoare.
a)Ipoteza logic ce st la baza coeficientului Spearman este aceea c n cazul
unei legturi directe foarte puternice exist o concordan aproape deplin ntre
rangurile celor dou variabile corelate, iar n cazul unei legturi indirecte foarte
puternice apare o discordan total ntre aceleai ranguri. Relaia de calcul a
coeficientului Spearman este r
s
sau
( )
( )
2
3
1
1 6 :
n
i
i
n n d
=
=
, unde: d
i
= rangul
dup x
i
- rangul dup y
i
(d
i
= rg
xi
rg
yi
), n=numrul unitilor la care s-au studiat
cele dou caracteristici sau numrul perechilor de valori corelate. La stabilirea
rangurilor variabilelor corelate apar situaii variantele pot deine aceeai valoare i
crora li se va acorda acelai rang. n aceast situaie se va urmri ca rangul valorii
distincte imediat urmtoare s corespund cu numrul de uniti analizate.

b).Relaia de calcul a coeficientului Kendall este r
k
sau
2
0, 5 ( 1) ( 1)
S S
n n n n
= =

,
unde:
1 1
i i
n n
i i
S P Q
= =
=

sau suma algebric dintre numrul de ranguri superioare
fiecrui rang (
1
n
P
i
i

=
) i numrul de ranguri inferioare (
1
n
Q
i
i

=
) calculate pentru
caracteristica rezultativ condiionat de caracteristica factorial (ordonat). De
regul, coeficientul Kendall este mai mic dect coeficientul Spearman, respectiv
r
k
<r
s
, dar ei se interpreteaz, n final, ca orice alt coeficient de corelaie.
III. Coeficientul simplu de covariaie diferenial sau coeficientul lui Fechner G.
T. este un indicator a calculat pe baza concordanelor sau discordanelor de semne
ale diferenelor
1 i i i
x x x

A = i
1 i i i
y y y

A = sau
*
x x x
i i
A = i
*
y y y
i i
A = ,
prin formula:
1
c d
k
c d

=
+
, unde c = concordan de semn ntre
i
x A i
i
y A sau
*
x
i
A
i
*
y
i
A , iar d = discordane de semn ntre
i
x A i
i
y A sau
*
x
i
A i
*
y
i
A , i c + d
reprezint numrul total de uniti statistice (dac una sau mai multe abateri
i
x A
sau
i
y A sau
*
x
i
A i
*
y
i
A sunt nule, perechile (x
i,
,y
i
) ce le-au generat vor fi excluse
din calcul). Atunci cnd exist numai concordane de semn k
1
= (c/c) = 1, iar cnd
se constat numai discordane, rezult un k
1
= (d/d) = 1. Aceste valori reprezint
limita maxim i minim a coeficientului Fechner. Coeficientul simplu de
covariaie diferenial devine egal cu zero cnd c = d.
IV. Coeficientul ponderat de concordan Fechner se valorific dac se dorete a
pondera n calcul mrimea abaterilor
i
x A i
i
y A sau
*
x
i
A i
*
y
i
A , prin formula:
14
( ) ( )
2
: k C D C D = + ,unde:C = suma produselor pozitive
i
x A
i
y A i
*
x
i
A
*
y
i
A , D =
valoarea absolut a sumei produselor negative
i
x A
i
y A i
*
x
i
A
*
y
i
A , iar ke[-1,1]
i devine egal cu zero, atunci cnd C = D.
V. Un alt coeficient de concordan mai echilibrat metodologic i care nu atinge
cu aceeai uurin 1, ca n cazul celorlali doi coeficieni descrii anterior (uneori
i cnd legtura descris nu este funcional), este coeficientul Bravais-Pearson:
( ) ( )
1
3
2 2
1 1
n
x y
i i
i
k
n n
x y
i i
i i
A A
=
=
A A
= =
sau
( ) ( )
* *
* *
1
3
2 2
1 1
n
i
n n
i i
x y
i i
k
x y
i i
=
= =
A A
=
A A


6.4 Test de autoevaluare i aplicaii statistice n contabilitate

A) Test de autoevaluare
A1) ntrebri clasice recapitulative
(Completai spaiile goale)

1.De ce coexist ambele noiuni,
respectiv i regresie i corelaie?
2. Care este esena metodei celor mai
mici ptrate?
3.Cum se determin un coeficient de
regresie i ce semnificaie are?
4.Cum se determin i interpreteaz
raportul de corelaie?
5.Care sunt principalele instrumente
neparametrice n aflarea intensitii
corelaiei?
6.Care sunt coeficienii de evaluare a
asocierii dintre variabile ?
7. Care este una dintre cele mai
rspndite soluii practice de evaluare
a unei corelaii cu decalaj ?
A
2
) ntrebri tip gril
(ncercuii litera rspunsului corect)
8. Alegei testul de verificare a liniaritii
legturii statistice dintre relaiile urmtoare:
a) r= K; b) r = R; c) e = D; d) R
2
= K
2
.
9. Identificai relaia corect de calcul pentru
coeficientul de corelaie: a) r = b(
x
):(
y
);
b) r = (ad-cd):(ad+cd); c) r = 2s:[(n(n-1)].
9. Dou variabile de stoc X
i
i Y
i,
ntre care s-a
identificat o legtur dein urmtoarele date:
Tabel nr. 6.2
Xi 4 6 8 10 12 15 20 21 26 28
Yi 85 70 120 165 185 220 215 225 209 206
I. Coeficientul de regresie: a)5,687; b)0,37449;
c) 0,99704; d) 0,78182. II. Raportul de corelaie:
a) 5,687; b) 0,37449; c) 0,99704; d) 0,78182.
III.Coeficientul Sperman: a)5,687; b) 0,37449; c)
0,99704; d) 0,78182.
B) Aplicaii rezolvate
1.Care este valoarea coeficientului de asociere dintre nota obinut de ctre 25 de
studeni la proiectul statistic i situaia lor final la examen?
Tabel nr.6.3
y
i


x
i

y
1
non
y
1

Total Rezolvare
Conform valorii
Q =
bc ad
bc ad
+

=0,77

Legtura direct
i intens
Q
c
=T=
) )( )( )( ( c d b d c a d a
bc ad
+ + + +

=0,38
(slab)
x
1
11 2 13
Y =
bc ad
bc ad
+

= 0,47 (legtur slab)


non x
1
5 7 12
Total 16 9 25
15
Not: x
1
=studeni cu un proiect bun (nota la proiect media grupei) i non x
1
=studeni cu
un proiect slab (nota<media) i y
1
= studeni promovai i non y
1
=studeni nepromovai.
2.O firm turistic deine 10 agenii ale sale, plasate n 10 localiti, iar numrul
de salariai sau ageni turistici (x
i
) i cifra de afaceri (y
i
), exprimat n milioane
lei, sunt prezentate n urmtoarea distribuie de frecvene:
xi 6 7 8 9 10 10 11 12 13 14
yi 1,0 1,1 1,2 1,4 1,3 1,6 1,4 1,6 1,7 1,7
S se identifice grafic existena unei legturi statistice, s se parametrizeze i
evalueze ca intensitate funcia matematic de regresie caracteristic.
Rezolvare: Prin corelogram se identific o legtur statistic de tip liniar (y
i
= a
+ bx
i
), cu b>0 intens relativ (jumtate din puncte fiind pe dreapta din grafic).

Grafic nr. 6.1

Calculul parametrilor a i b ai legturii liniare directe, semnalate n grafic:

Tabel nr.6.4
Numr de
salariai (x
i
)
Cifra de afaceri
(y
i
mil. lei)
2
i
x
x
i
y
i

Y a bx
x i
i
= +
Sistemul de ecuaii teoretic:
na b x y
i i
+ =

2
i
a x b x x y
i i i
+ =

devine practic:
10 100 14 a b + =
100 1060 145, 4 a b + =
i are ca soluii:
a = 0,5 i b = 0,09
iar regresia liniar
Y a bx
x
i
i
= +
parametrizat
este 0, 5 0, 09
x i
i
Y x = +
6 1.0 36 6,0 1,04
7 1.1 49 7,7 1,13
8 1.2 64 9,6 1,22
9 1.4 81 12,6 1,31
10 1.3 100 13,0 1,40
10 1.6 100 16,0 1,40
11 1.4 121 15,4 1,49
12 1.6 144 19,2 1,58
13 1.7 169 22,1 1,67
14 1.7 196 23,8 1,76
100
i
x
14,0
i
y
106
2
i
x

145,4
i i
x y

14,00
xi
Y

Se poate apela la relaia de control
i
y =
xi
Y , oricnd disponibil tabelar, pentru
4
6
8
10
12
14
16
0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8
CA
S
A
L
A
R
I
A
T
I



0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
4 6 8 10 12 14 16
SALARIATI
C
A

Magazine
P1 (6;1,0)
P2 (7;1,1)
P3 (8;1,2)
P4 (9;1,4)
P5 (10;1,3)
P6 (10;1,6)
P7 (11;1,4)
P8 (12;1,6)
P9 (13;1,7)
P10 (14;1,7)
16
a verifica acurateea calculelor. Suma termenilor reali este egal cu a termenilor
teoretici (ajustai). Coeficientul de regresie b = 0,09 arat c la fiecare cretere a
lui xi cu o unitate (salariat), cifra de afaceri notat yi, se majoreaz cu 0,09
milioane lei n exemplul analizat, coeficientul de determinaie D = 86,8%, ceea ce
traduce o calitate satisfctoare funciei de regresie liniare parametrizate, iar
valoarea coeficientului de eroare (e) = 6,67%. Cum valoarea r
y/x
= R
y/x

=0,9315885 i se poate afirma c ntre variabila numr de salariai i cifra de
afaceri exist o legtur statistic de intensitate puternic, exclusiv liniar de
forma: 0, 5 0, 09
x i
i
Y x = + .

C) Aplicaii propuse spre rezolvare
1 Cinci magazine sunt ordonate cresctor n raport cu preul practicat:
Tabel nr. 6.5
Magazin

Preul practicat
(x
i
- lei / kg)
Cantitatea vndut
(y
i
-mii kg)
1 10,0 9,0
2 12,0 8,8
3 15,0 8,2
4 18,0 8,0
5 20,0 8,0
Aplicai metoda grafic de identificare a legturii statistice ntre x
i
i y
i
, calculai
parametrii a i b ai modelului de regresie i interpretai semnificaia coeficientului
de regresie. Analizai calitativ funcia de regresie cu un coeficient de determinaie
i de eroare i, n final determinai raportul de corelaie i coeficientul de
corelaie. Verificai liniaritatea legturii prin testul R
xy
= r
xy
.

2.Pornind de la suprafaa comercial(x
i
) i vnzrile firmei (y
i
), din ultimele 6 luni,
parametrizai o regresie ntre cele dou variabile de forma y
i
= a + bx
i

,

evalund
intensitatea corelaiei i estimnd vnzrile la o suprafa de 250 i 300 mp:
Tabel nr.6.6
Luna
I II III IV V VI
Suprafaa comercial (mp) 50 70 80 120 140 210
Valoarea vnzrilor (mii lei ) 480 600 820 1100 1400 2200

3. Pornind de la un eantion alctuit din 50 de firme s-au obinut urmtoarele date
despre productivitatea medie i salariul mediu lunar:
Tabel nr. 6.7
Productivitatea medie
135 produse / salariat
Salariul mediu (11600 lei / salariat)
Total Mai mic dect media Mai mare dect media
Mai mic dect media 16 6 22
Mai mare dect media 9 19 28
Total 25 25 50
Coeficientul de asociere de tip Yule este: a) 0,243; b) 0,980; c) 0,901; d) 0,698.

S-ar putea să vă placă și