Sunteți pe pagina 1din 16

UI9.

METODE ANALITICE DE STUDIU A LEGĂTURILOR


STATISTICE
LECT. UNIV. DR. PODAŞCĂ RALUCA

Obiective:

După studiul acestei unităţi de învăţare, cursanţii vor avea cunoştinţe despre:

➢ Principalele noţiuni, delimitări conceptuale privind metoda regresiei

➢ Modelul liniar;
➢ Modelul exponenţial;
➢ Modelul parabolic;
➢ Modelul hiperbolic;
➢ Modelul logaritmic.

Secţiuni

9.1 Metode analitice de măsurare şi analiză a legăturilor statistice


9.2 Metoda regresiei
Teste de autoevaluare
Lucrări de verificare

9.1 Metode analitice de măsurare şi analiză a legăturilor


statistice

Metodele simple de analiză a legăturilor statistice sunt folosite ca momente


iniţiale ale cercetării statistice a corelaţiei dintre fenomene, cu ajutorul lor

1
realizându-se o sistematizare a informaţiilor necesare aplicării metodelor analitice
de calcul şi interpretare statistică.
Alegerea metodei analitice corespunzătoare depinde de natura fenomenului
cercetat şi de informaţiile de care dispunem, respectiv de seriile formate prin
prelucrarea statistică şi de numărul factorilor analizaţi.
În cazul în care se studiază o singură caracteristică factorială (X) şi o singură
caracteristică rezultativă (Y) se vor aplica metodele analitice corespunzătoare
corelaţiei simple.
Dacă se studiază mai multe caracteristici factoriale (X1, X2, X3,...,Xn) şi o
singură caracteristică rezultativă (Y) se vor aplica metodele analitice
corespunzătoare corelaţiei multiple.

Metodele parametrice de studiu a legăturilor statistice sunt:


- Metoda regresiei;
- Metoda raportului de corelaţie;
- Metoda coeficientului de corelaţie;
- Metoda analizei dispersionale.

9.2 Metoda regresiei

Pentru a pune în evidenţă legăturile statistice, pentru a măsura statistic


tendinţa acestora, se folosesc ecuaţiile de estimare corespunzătoare unei funcţii
analitice. Această funcţie se numeşte funcţie de regresie, iar reprezentarea ei grafică
se face prin curba de regresie.

2
Metoda regresiei reprezintă o metodă statistică de analiză a legăturii dintre
variabile cu ajutorul unor funcţii denumite funcţii de regresie. Această metodă poate
fi considerată o generalizare a analizei dispersionale.
Pentru alegerea corectă a funcţiei de regresie, se reprezintă seriile de
distribuţie printr-un grafic de corelaţie şi pe baza acestuia se poate aprecia dacă
legătura este de formă rectilinie sau curbilinie.
Funcţia de regresie exprimă modul în care caracteristica rezultativă (Y) se
modifică dacă variază numai valorile caracteristicii factoriale (X) iar ceilalţi factori
au acţiune constantă.
Notând cu Y variabila dependentă şi cu X1, X2, ..., Xn variabilele independente,
se obţine ecuaţia de regresie:

y = f ( x1 , x2 ,..., xn )

Datorită caracterului aleator (întâmplător) al fenomenelor şi proceselor


economico-sociale, modelul teoretic se înlocuieşte cu modelul de dependenţă
statistică:

y = f ( x1 , x2 ,..., xn ) + e

Unde e reprezintă o eroare aleatoare (o variabilă reziduu), cu dispersia


constantă şi media nulă.

Având în vedere că funcţia de regresie dintre două sau mai multe caracteristici
se poate exprima prin mai multe ecuaţii, pentru obţinerea unor rezultate mai exacte
(reale) se recomandă să se aleagă modelul de regresie adecvat.

3
În funcţie de numărul factorilor (x1, x2, ..., xn) care influenţează caracteristica
rezultativă (y) deosebim:

- Regresie unifactorială sau simplă, dacă funcţia include o singură variabilă


factorială;
- Regresie multifactorială sau multiplă, dacă funcţia include mai multe
variabile factoriale.

Modele de regresie unifactoriale

Modelele unifactoriale descriu legătura dintre două variabile (X şi Y),


considerând că restul de factori prezintă o acţiune constantă şi neglijabilă asupra
caracteristicii dependente Y.
Ecuaţia de regresie este:

y = f ( x) + e

e- eroare aleatoare.

Cele mai cunoscute şi utilizate modele de regresie unifactorială sunt:


- Modelul liniar;
- Modelul exponenţial;
- Modelul parabolic;
- Modelul hiperbolic;
- Modelul logaritmic.

4
9.2.1 Modelul liniar

Ecuaţia de regresie liniară are următoarea formă:

yˆ i = a + b  xi

Parametrul „a” reprezintă ordonata la origine şi indică nivelul la care ar fi


ajuns caracteristica y dacă toţi factorii, cu excepţia celui înregistrat, ar fi avut o
acţiune constantă asupra acestuia.
Parametrul „b” se numeşte coeficient de regresie şi din punct de vedere
geometric reprezintă panta dreptei de regresie. Acest parametru este pozitiv pentru
o legătură directă şi negativ în cazul legăturii inverse şi arată cu cât se modifică în
medie variabila y în cazul în care variabila x se modifică cu o unitate.
Dacă b=0 cele două variabile sunt independente între ele, deci valoarea medie
a ecuaţiei de regresie este egală cu valoarea medie a caracteristicii rezultative.
Determinarea parametrilor a şi b se face utilizând metoda celor mai mici
pătrate, determinându-se minimul funcţiei:

n
f (a, b) =  ( y i − yˆ i ) 2
i =1

Parametrii „a” şi „b” se determină rezolvând sistemul ecuaţiilor normale:

 n n

n  a + b   x i =  y i
 i =1 i =1
 n n n
a  x + b  x 2 =
   
i i
xi  y i
i =1 i =1 i =1

5
Acest sistem se rezolvă folosind metoda lui Cramer.

Astfel se calculează determinanţii:

n
n x i
= n
i =1
n

x x
i =1
i
i =1
2
i

n n

y i x i
a = n
i =1 i =1
n

x  y x
i =1
i i
i =1
2
i

n
n y i
b = n n
i =1

 xi
i =1
x y
i =1
i i

Parametrii a şi b se calculează astfel:

a
a=

b
b=

Dacă în natură nonliniaritatea este predominantă, în viaţa economică şi socială


întâlnim aceiaşi situaţie. Pe termen mediu şi mai ales pe termen lung,
comportamentul variabilei efect este mai degrabă nonliniar decât liniar în relaţie cu

6
variabila cauzală. Astfel, specialiştii de marketing se referă în mod frecvent la
evoluţia vânzărilor care descrie într-un mod neliniar viaţa produsului pe piaţă.
Fenomenul de creştere economică ilustrată de evoluţia indicatorilor sintetici
(Produsul Intern Brut, Produsul Intern Net) se caracterizează mai degrabă prin
creşteri urmate de scăderi decât de o creştere liniară rigidă. Prin urmare, pentru a
descrie un număr mare de procese economice, sunt necesare modele neliniare.
Conform lui Pecican (2009), aceste tipuri de modele sunt clasificate astfel:
- Modele neliniare în raport cu variabilele, dar liniare în funcţie de
parametrii care trebuie estimaţi. Aceste modele pot fi transformate prin
transformări corespunzătoare în modele liniare. Problema estimării
parametrilor se simplifică în raport de abilitatea statisticianului de a realiza
liniarizarea modelului;

- Modele neliniare atât în ceea ce priveşte variabilele cât şi parametrii. Un


astfel de model poate reprezenta legătura dintre cerere, preţ şi venit. În
această categorie, variabila reziduală poate crea probleme care împiedică
liniarizarea modelului. Prin urmare, putem considera un model alternativ
care permite liniarizare (în cazul în care nu afectează realitatea descrisă de
date) sau putem folosi metode alternative de estimare.

9.2.2 Modelul exponenţial

Ecuaţia care caracterizează modelul este:

yˆ i = a  b xi

7
Prin logaritmare, modelul exponenţial se poate transforma într-un model
liniar de forma:
lg yi = lg a + xi  lg b

Se fac următoarele înlocuiri:

y ' = lg y
a ' = lg a
b ' = lg b

Rezultă ecuaţia unei drepte, astfel:


y i' = a ' + b '  xi

Procedând ca la regresia unifactorială liniară, rezultă sistemul de ecuaţii normale:

 n n



n  a '
+ b '
 
i =1
x i = 
i =1
yi
 n n n
a '  x + b '  x 2 =
   
i i xi  y i
i =1 i =1 i =1

Parametrii „a” şi „b” cu ajutorul căreia se ajustează seria empirică, se obţin


prin antilogaritmare.
Acest model se utilizează în cazul în care variabila dependentă creşte în
progresie aritmetică, iar variabila independentă creşte în progresie geometrică.
Sunt curbe care nu se pot transforma într-o dreptă, asa cum s-a procedat la
modelul exponenţial. Acestea sunt parabola şi hiperbola.

8
9.2.3 Modelul parabolic

Ecuaţia care caracterizează modelul parabolic este:

yˆ i = a + b  xi + c  xi2

Determinarea celor trei parametri ai ecuaţiei de regresie de tip parabolic se


face folosind metoda celor mai mici pătrate, rezolvându-se sistemul ecuaţiilor
normale:

 n n n

 n  a + b   xi + c   xi
2
=  yi
 i =1 i =1 i =1

 n n n n

a   xi + b   xi + c   xi =  xi  yi
2 3

 i =1 i =1 i =1 i =1
 n 2 n n n
a   xi + b   xi + c   xi =  xi  yi
3 4 2

 i =1 i =1 i =1 i =1

Acest sistem de ecuaţii normale se rezolvă prin metoda determinaţilor,


obţinându-se cei trei parametri şi în funcţie de valoarea lui x se ajustează valorile
caracteristicii alternative.
Pentru aceasta trebuie să se întocmească următorul tabel:

9
Tabelul 9.1. Model de tabel de calcul pentru determinarea parametrilor
modelului parabolic
Nr. xi yi xi2 xi3 xi4 xi∙yi xi2  yi ŷ i

1 x1 y1 x12 x13 x14 x1∙y1 x12  y1 ŷ1

. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
n xn yn x n2 x n3 x n4
xn∙yn xn2  yn ŷ n

n n n n n n n n
Total
 xi
i =1
 yi
i =1
 xi2
i =1
 xi3
i =1
 xi4
i =1
 xi  yi
i =1
 xi2  yi
i =1
 yˆ
i =1
i

9.2.4 Modelul hiperbolic

Legăturile dintre fenomenele economice pot fi şi de forma unei hiperbole.


În acest caz, dependenţa inversă dintre cele două variabile (x scade, y creşte sau x
creşte, y scade) se poate exprima prin ecuaţia:
1
yˆ i = a + b 
xi

Determinarea parametrilor modelului hiperbolic se face rezolvând următorul


sistem:

 n
1 n



n  a + b  
i =1 xi
= 
i =1
yi
 n n n
a  1 1 1

 i =1 xi
+ b   2 =   yi
i =1 xi i =1 xi

10
După rezolvarea sistemului se obţine ecuaţia funcţiei de estimare a
caracteristicii rezultative de forma unei hiperbole şi calculând fiecare ecuaţie de
regresie se trece la ajustarea seriei.

Tabelul 9.2. Model de tabel de calcul pentru determinarea parametrilor


modelului hiperbolic
Nr. xi yi 1 1 1 ŷ i
 yi
xi xi2 xi

1 x1 y1 1 1 1 ŷ1
 y1
x1 x12 x1
. . . .
. . . . . .
.
. . . .
.
1 1 1
 yn ŷ n
xn xn2 xn
n xn yn
n n n n n n
Total 1 1 1
 xi  yi   2   yi  yˆ i
i =1 i =1 i =1 xi i =1 xi i =1 xi i =1

9.2.5 Modelul logaritmic

Ecuaţia care caracterizează modelul logaritmic este:

yˆ i = a + b  lg xi

11
Când a>0 şi b>0 curba este crescătoare şi când a>0 şi b<0 curba este
descrescătoare. Folosind metoda celor mai mici pătrate, se ajunge la următorul
sistem de ecuaţii normale :

 n n



n  a + b 
i =1
lg x i = 
i =1
yi
 n n n
a  lg x + b  (lg x ) 2 =

 i =1 i 
i =1
i 
i =1
y i  lg xi

Modele de regresie multifactoriale

Între fenomenele economico-sociale există legături complexe, care se


caracterizează prin influenţa unui număr mare de factori (variabile independente)
asupra caracteristicii rezultative (variabila dependentă).
Aceste legături se pot exprima cu ajutorul ecuaţiei de regresie multiplă:

y = f ( x1 , x 2 ,...., x n )

Unde x1, x2, ..., xn reprezintă caracteristicile independente sau factoriale.

Cel mai utilizat model de regresie multifactorială este modelul liniar, care se
exprimă prin ecuaţia:

yˆi = a0 + a1  x1 + a2  x2 + ... + an  xn

a0- coeficientul care exprimă influenţa factorilor neincluşi în model


consideraţi cu acţiune constantă;

12
ai- coeficienţii de regresie multiplă ce arată ponderea cu care influenţează
fiecare caracteristică x asupra caracteristicii rezultative y.

Specific regresiei multiple liniare este faptul că variabila rezultativă y se


modifică uniform în cazul în care variabilele factoriale xi se modifică cu o unitate.
Parametrii se calculează pe baza metodei celor mai mici pătrate, şi se obţine
sistemul ecuaţiilor normale:

n n n n
n  a0 + a1   x1i + a2   x2i + ... + an   xni =  yi
i =1 i =1 i =1 i =1
n n n n n
a0   x1i + a1   x1i + a2   x1i  x2i + ... + an   x1i  xni =  x1i  yi
2

i =1 i =1 i =1 i =1 i =1

n n n n n
a0   x2i + a1   x1i  x2i + a2   x2i + ... + an   x2i  xni =  x2i  yi
2

i =1 i =1 i =1 i =1 i =1

................................................................................................................
n n n n n
a0   xni + a1   x1i  xni + a 2   x2i  xni + ... + a n   xni2 =  xni  yi
i =1 i =1 i =1 i =1 i =1

Coeficienţii de regresie ai pot avea fie semn pozitiv, fie semn negativ şi arată
tipul de legătură (directă sau inversă) dintre variabila factorială xi şi variabila
rezultativă y.
Legătura multifactorială liniară se poate reprezenta grafic sub forma unui
plan. Acest tip de legătură presupune că variabilele factoriale să fie independente,
adică să nu avem fenomenul de multicolinearitate.
Pot apărea situaţii în care diferitele caracteristici studiate acţionează prin
multiplicarea lor. Influenţele nu mai sunt în acest caz uniforme, ci proporţionale cu
valoarea caracteristicii. Ele se manifestă cu un ritm de creştere, ceea ce face ca gradul
de influenţă al caracteristicilor analizate să fie proporţional cu valoarea acestora.

13
Astfel, se poate stabili un model multifactorial de forma:

yˆ i = a 0  x1a1  x 2a 2  ....  x nan

Prin logaritmare, modelul exponenţial se poate transforma într-un model


liniar.

Teste de autoevaluare

Prezentaţi metoda regresiei.

Răspuns

Metoda regresiei reprezintă o metodă statistică de analiză a legăturii dintre


variabile cu ajutorul unor funcţii denumite funcţii de regresie. Această metodă poate
fi considerată o generalizare a analizei dispersionale.
Pentru alegerea corectă a funcţiei de regresie, se reprezintă seriile de
distribuţie printr-un grafic de corelaţie şi pe baza acestuia se poate aprecia dacă
legătura este de formă rectilinie sau curbilinie.
Funcţia de regresie exprimă modul în care caracteristica rezultativă (Y) se
modifică dacă variază numai valorile caracteristicii factoriale (X) iar ceilalţi factori
au acţiune constantă.
Notând cu Y variabila dependentă şi cu X1, X2, ..., Xn variabilele independente,
se obţine ecuaţia de regresie:
y = f ( x1 , x2 ,..., xn )

Datorită caracterului aleator (întâmplător) al fenomenelor şi proceselor


economico-sociale, modelul teoretic se înlocuieşte cu modelul de dependenţă
statistică:
y = f ( x1 , x2 ,..., xn ) + e

14
Unde e reprezintă o eroare aleatoare (o variabilă reziduu), cu dispersia
constantă şi media nulă.
Având în vedere că funcţia de regresie dintre două sau mai multe caracteristici
se poate exprima prin mai multe ecuaţii, pentru obţinerea unor rezultate mai exacte
(reale) se recomandă să se aleagă modelul de regresie adecvat.

Lucrări de verificare

1. Prezentaţi modelul liniar.


2. Prezentaţi modelul parabolic.

Rezumat

Metodele simple de analiză a legăturilor statistice sunt folosite ca momente


iniţiale ale cercetării statistice a corelaţiei dintre fenomene, cu ajutorul lor
realizându-se o sistematizare a informaţiilor necesare aplicării metodelor analitice
de calcul şi interpretare statistică.
Alegerea metodei analitice corespunzătoare depinde de natura fenomenului
cercetat şi de informaţiile de care dispunem, respectiv de seriile formate prin
prelucrarea statistică şi de numărul factorilor analizaţi.
În cazul în care se studiază o singură caracteristică factorială (X) şi o singură
caracteristică rezultativă (Y) se vor aplica metodele analitice corespunzătoare
corelaţiei simple.
Dacă se studiază mai multe caracteristici factoriale (X1, X2, X3,...,Xn) şi o
singură caracteristică rezultativă (Y) se vor aplica metodele analitice
corespunzătoare corelaţiei multiple.

15
Bibliografie

1) Podaşcă R.(2017), Statistică economică. Teorie şi aplicaţii, Editura Printech,


Bucureşti.
2) Podaşcă R.(2019), Econometrie. Teorie şi aplicaţii, Editura Printech,
Bucureşti.
3) Anghelache C., Anghel M. G. (2016), Bazele statisticii economice. Concepte
teoretice şi studii de caz. Editura Economică, Bucureşti.

16

S-ar putea să vă placă și