Sunteți pe pagina 1din 28

3.

MODELUL LINEAR UNIFACTORIAL

Modelul econometric unifactorial este acel model, în care, pe baza metodei


regresiei simple, se descrie legătura statistică sau stochastică dintre componentele
variabilei de influenţă x şi componentele variabilei rezultative y.

Etapele elaborării modelului linear unifactorial

3.1 Specificarea şi definirea modelului unifactorial


Specificarea unui model econometric se face pe baza teoriei economice a
fenomenului observat şi constă în precizarea variabilei endogene şi a variabilei
exogene.
Forma generală a unui model unifactorial este:
y  f  x   u sau yt  axt  b  u , t  1, n (3.1)
cu:
y   y1 , y2 ,... yn  este variabila endogenă;
x   x1 , x2 ,...xn  este variabila exogenă;
u  u1 , u 2 ,...u n  este variabila reziduală (eroare).
Ipoteza de bază a modelului unifactorial este aceea că fenomenul economic y
este rezultatul acţiunii în mod deosebit a fenomenului economic x, ceilalţi factori
care acţioneză asupra sa fiind consideraţi neesenţiali, cu acţiune întâmplătoare.
Aceştia sunt specificaţi în modelul econometric cu ajutorul variabilei aleatoare u.
Ca orice ipoteză teoretică, ea poate fi adevărată sau falsă şi anume: x este sau nu
este factorul determinant al fenomenului y, iar validarea sau invalidarea unei astfel
de ipoteze se face în urma unui „experiment” statistic.
În general, teoria economică a folosit şi foloseşte în numeroase cazuri
modelul unifactorial pentru a fundamenta şi descrie mecanismul de formare şi de
manifestare a legilor economice.

3.2 Identificarea modelului unifactorial


Prin identificarea modelului unifactorial se înţelege alegerea unei funcţii (sau
a unui grup de funcţii) matematice, cu ajutorul căreia se urmăreşte să se
aproximeze valorile variabilei endogene y numai în funcţie de variaţia variabilei
exogene x.

43
Printre funcţiile matematice utilizate în acest scop (funcţii de o singură
variabilă, lineare sau nelineare), pot fi enumerate (tabelul 3.1):
Tabelul 3.1
Funcţie Forma analitică a funcţiei
lineară y  ax  b  u
semilogaritmică y  alogx  b  u
exponenţială y  ax b  u
a
hiperbolă y bu
x
loginversă a
logy  bu
x
log-loginversă a
logy   b  clogx  u
x
 x
 y  a  u ; a, b  0
xb

 xc
funcţiile lui Tornquist y  a  u; a, c  0; b  c; x  c
 x  b
 xc
 y  ax x  b  u; a, c  0; b  c; x  c

funcţia lui Konius y  xa  b log x   u


 c
y  u
 1  e axb
 c
funcţia logistică y  a log x b
u
 1  e
 c
y  a
b
u
 1 e x

Alegerea unei anumite funcţii matematice ca funcţie de regresie a unui model


econometric se face pe baza valorilor reale sau empirice ale celor două fenomene
economice. Acestea sunt sistematizate, fie în serii spaţiale  yi , xi  i  1, n , unde n
reprezintă numărul unităţilor statistice omogene la care s-au înregistrat, într-o
anumită perioadă de timp, valorile celor două fenomene y şi x, fie în serii de timp

44
y , x 
t t t  1, n , unde n reprezintă numărul perioadelor de timp în care s-au
înregistrat valorile celor două fenomene y şi x la aceeaşi unitate statistică.

3.3 Estimarea parametrilor unui model econometric unifactorial


Coeficienţii funcţiei de regresie acceptată în etapa de identificare a acestuia
sunt parametrii model econometric considerat.
Estimarea parametrilor unui model econometric se poate face cu ajutorul mai
multor metode dintre care:
a) metoda punctelor empirice (M.P.E.). Acestă metodă constă în alegerea
unui număr de puncte empirice, M  xi , yi  , egal cu numărul parametrilor modelului.
De exemplu, dacă se consideră ca funcţie de regresie o funcţie de gradul I,
y  ax  b , atunci vor fi considerate, arbitrar, două puncte. Fie M 2  x2 , y2  şi
M 5  x5 , y5  . Din condiţia ca aceste puncte să aparţină dreptei de regresie se obţine
sistemul:
 y2  aˆx2  bˆ
 (3.2)
 y5  aˆx5  bˆ
care, rezolvat cu regula lui Cramer, conduce la obţinerea soluţiilor:

y2 1 1 y2
y 1 1 y5
aˆ  5 ; bˆ 
x2 1 x2 1
x5 1 x5 1

În general, alegerea punctelor empirice se face, fie pe baza reprezentării


grafice a celor două serii statistice, şi considerarea acelor puncte care ar trebui să
fie foarte aproape de dreapta virtual trasată sau să fie intersectate de aceasta, fie
prin considerarea că aceste puncte sunt reprezentative pentru caracterizarea
variaţiilor celor două fenomene şi nu sunt rezultatul unor condiţii speciale.
b) metoda punctelor medii (M.P.M.). Această metodă constă în împărţirea
celor două serii statistice într-un număr de sub-serii egal cu numărul estimatorilor.
Valorile mediilor aritmetice ale celor două variabile calculate în diecare sub-
serie (  x1 , y1 ,  x2 , y2  ) sunt introduse în funcţia de regresie şi, aplicând procedura
ca în cazul metodei punctelor empirice se determină valorile estimatorilor.
În cazul în care numărul termenilor seriilor statistice nu este divizibil cu
numărul parametrilor, se va renunţa la un număr de termeni (în general, cei mai
45
îndepărtaţi în timp, sau de media celor două variabile). De exemplu, în cazul
modelului linear, numărul parametrilor este egal cu doi. Dacă seriile de timp ale
celor două variabile se referă, de exemplu, la 11 perioade, t = 1,..,11, se va renunţa
la valorile primei perioade, respectiv la x1 şi y1. În acest caz, cele două serii vor fi:
 1
 x2 x3 x4 x5 x6  
x1  x2  x3  x4  x5  x6 
  5
 y2 y3 y4 y5 y6   1
 y 1   y2  y3  y4  y5  y6 
5
 1
 x7 x8 x9 x10 x11  
x 2  x7  x8  x9  x10  x11 
  5
 y7 y8 y9 y10 y11   1
 y 2   y7  y8  y9  y10  y11 
5
Prin introducerea acestor valori în relaţia:
yˆ i  aˆ  xi  bˆ (3.3)
rezultă:
y1 1 1 y1
 y1  aˆx1  bˆ y 1 1 y2
  aˆ  2 ; bˆ  (3.4)
 y2  aˆx2  bˆ x1 1 x1 1
x2 1 x2 1

c) metoda celor mai mici pătrate (MCMMP) este tehnica de lucru cea mai
des folosită la estimarea parametrilor unui model econometric şi a fost prezentată
în detaliu în capitolul 2).
d) metoda celor mai mici pătrate generalizată, prin care se urmăreşte
obţinerea unor estimatori eficienţi pentru parametrii modelului, luând în
considerare informaţiile date de matricea varianţă-covarianţă a erorilor;
e) metoda verosimilităţii maxime (M.V.M) cu informaţie limitată sau
completă. În cazul în care între variabila endogenă y şi variabila independentă x
există o distribuţie comună, se calculează parametrii a şi b folosind metoda
verosimilităţii maxime cu ajutorul seriilor de date. Se consideră că variabila
dependentă este repartizată normal şi densitatea de probabilitate a acesteia este:
 yi  aˆ  xi bˆ 2
1
f  y i / xi   e 2 u2
(3.5)
 u 2

46
Observaţia 1: când aplicarea MCMMP este anevoioasă, necesitând calcule
complicate, sau prin aplicarea modelului unifactorial nu se urmăreşte o anume
rigoare a calculelor, atunci, pentru estimarea parametrilor modelului se utilizează
metodele a) şi b).
Observaţia 2: metodele d) şi e) au mai mult valoare teoretică deoarece, în
economie, ipotezele pe care se fundamentează pot fi acceptate cu multă reţinere;
aceste metode presupus efectuarea unor calculele complicate, cea ce face ca
estimarea parametrilor să devină greoaie, fără a genera însă o creştere a preciziei
estimaţiilor.

3.4 Verificarea modelului econometric


Deoarece modelul econometric, în etapele de specificare, identificare şi
estimare, se fundamentează pe acceptarea unor ipoteze de lucru, cât şi pe date
experimentale de sondaj, este necesar ca, înainte de utilizarea sa ca instrument
pertinent scopului urmărit, acesta să fie verificat.
De asemenea, se pune problema similitudinii dintre modelul economic real,
descris de seriile statistice ale fenomenelor analizate, şi modelul teoretic, de natură
econometrică, construit şi rezolvat.
Economia, spre deosebire de domeniul tehnic, prezintă anumite
particularităţi, în sensul că nu se poate realiza o similitudine perfectă între modelul
teoretic şi cel real (aşa cum există, de exemplu, între macheta unei clădiri şi
clădirea construită). Aici se pune problema existenţei unei similitudine statistici
între cele două modele, în sensul că modelul econometric posedă şi descrie în mare
principalele caracteristici ale modelului economic real.
Pentru ca modelul teoretic să poată fi acceptat ca model similar, ca
aproximaţie statistică echivalentă cu modelul real, sunt necesare:
3.4.1 Verificarea ipotezelor pe care se fundamentează estimarea parametrilor
unui model econometric;
3.4.2 Verificarea semnificaţiei estimatorilor parametrilor modelului
econometric;
3.4.3 Verificarea similitudinii modelului econometric.

3.4.1. Verificarea ipotezelor pe care se fundamentează estimarea parametrilor


unui model econometric
Estimarea parametrilor unui model econometric se realizează pe baza datelor
înregistate printr-o cercetare selectivă. Orice modificare în baza de date utilizată

47
(schimbarea sursei, utilizarea unui eşantion mai larg, etc.) face ca valorile
estimatorilor modelului să varieze.
Cu ajutorul statisticii sunt calculaţi parametrii caracteristicilor unităţilor
statistice ale unei populaţii în urma unei observări totale asupra colectivităţii
statistice, utilizând estimaţii de maximă verosimilitate.
Estimarea parametrilor din ecuaţia de regresie se bazează pe o serie de
ipoteze referitoare la forma dependenţei dintre variabile, la variabila explicativă şi
la variabila de abatere, dintre care, cele mai importante sunt:
I1: variabilele xt , yt sunt observate fără erori de măsură,
I2: variabila xt este aleatoare, dar nu este corelată cu erorile ut ;
I3: ut este o variabilă aleatoare, cu M ut   0 şi de dispersie constant
 u21   u22  ...   u2n   u2 ;
I4: valorile variabilei reziduale sunt independente (nu sunt corelate, adică nu
există fenomenul de autocorelare a acestora);
I5: variabila aleatoare ut urmează o distribuţie normală;

3.4.2.Verificarea semnificaţiei estimatorilor parametrilor modelului


econometric
Estimatorii â şi b̂ din modelul unifactorial linear, pot fi estimaţi prin diverse
tehnici, dintre care, cele mai utilizate, sunt:
- metoda celor mai mici pătrate prin care se minimizează suma pătratelor
erorilor, adică se consideră funcţia:

   
n n n
F aˆ , bˆ  min  ut  min   yt  yˆ t   min  yt  aˆ  xt  bˆ
2 2 2
(3.6)
i 1 i 1 i 1

- metoda verosimilităţii maxime, metodă prin care se maximizează funcţia


de verosimilitate:
 
L yt , aˆ , bˆ  f  y1   f  y2   ...  f  yn , t  1.n , (3.7)
sau, altfel scris:
n
  yt aˆxt bˆ 
1 2
 y aˆxt bˆ 2
 
1 n 
n
1 
2 t  1  2 2
L yt , aˆ , bˆ   e 2
  e t 1
(3.8)
t 1  2   2 

unde: f este densitatea de repartiţie a variavilei y .

48
De asemenea, estimatorii â şi b̂ astfel determinaţi, au o serie de proprietăţi,
dintre care:
P1: metoda verosimilităţii maxime este echivalentă cu metoda celor mai mici
pătrate în cazul în care variabila reziduală ui este repartizată normal, având media
egală cu zero şi abaterea medie pătratică  u ;
Maximizarea funcţiei de verosimilitate înseamnă:
  1 n 
max L y , 
ˆ
a , ˆ
b  max 
ln L y , ˆ
a 
, ˆ
b  max  ln   
1 n
 y  ˆ
a x  b 
ˆ 2
   2  2 t 1
t t 2 t t
aˆ , bˆ aˆ , bˆ aˆ , bˆ

(3.9)
n
 1 
Deoarece ln   constant  ct. , atunci relaţia (3.9) devine:
  2 
  1 n 2
max  ln   
1 n
 y  ˆ
a x ˆ
b   ct  max
 1 n
aˆ , bˆ 
  y  ˆ
a x ˆ
b
2

 
   2  2 t 1  2 t 1
2 t t 2 t t
aˆ , bˆ


 ct   
1 
 min 
n

 2  aˆ , bˆ t 1
2
y t  ˆ
a x t 
b
 2  aˆ , bˆ
2
 
ˆ 2  ct    1  min F aˆ , bˆ

(3.10)
 
 u 2 
P2: estimatorul â este repartizat N  a, n  , în condiţiile în care
  xt  x  
2

 t 1 
variabila reziduală este repartizată normal, având media egală cu zero şi dispersia
 u2  const. ;
   
 1 2 
x
P3: estimatorul atunci b̂ este repartizat N  b,  u2    n   când
  n   xt  x 2  
   
 t 1

variabila reziduală este repartizată normal, având media egală cu zero şi dispersia
 u2  const. ;
P4: estimatorii â şi b̂ sunt nedeplasaţi. Un estimator este nedeplasat
(nedistorsionat) dacă media estimatorului este egală cu valoarea parametrului pe
care îl estimează.

49
Notând:
xt  x
vt  n
, (3.11)
 x  x
2
t
t 1

n n
şi calculând:  t şi
t 1
 t 1
t
2
, se obţine:

n n
xt  x
 t   n
0 (3.12)
 x  x
t 1 t 1 2
t
t 1

iar
2
 
n 
n
xt  x  1
  2
   n   n
(3.13)
   xt  x    x  x
t
t 1 t 1  2 2

 t 1 
t
t 1

Cu aceste relaţii, expresia estimatorului â


n

 x t
 x  yt  y 
aˆ  t 1
n

 x  x
2
t
t 1

devine:
n
aˆ  a   vt ut (3.14)
t 1

n
Diferenţa aˆ  a   vt ut este cunoscută sub denumirea de eroarea de selecţie
t 1

n
 1  
a lui â , iar ecartul bˆ  b     x   u t  este eroarea de selecţie a estimatorului
t 1  n  
b̂ .
P5: estimatorii â şi b̂ sunt consistenţi. Spunem că un estimator este
consistent dacă odată cu creşterea numărului de observaţii, valoarea acestuia se
apropie de valoarea parametrului estimat.
Observaţie: această propritate se aplică doar în cazul selecţiilor de volum
mare.
P6: estimatorii â şi b̂ din modelul linear unifactorial, calculaţi prin metoda
celor mai mici pătrate, sunt eficienţi (cu dispersia cea mai mică).

50
3.4.3. Teste privind semnificaţia estimatorilor
Dispersiile estimatorilor din modelul unifactorial de regresie lineară pot fi
definiţi prin relaţiile:
1
sa2ˆ  su2 n
(3.15)
 x  x
2
t
t 1

 
1 x 2 
sbˆ  su   n
2 2
 (3.16)
 n   xt  x 2 
 t 1 
n

u t
2

su2  t 1
(3.17)
n2
2 2
Valorile sâ , sb̂ sunt estimatori nedeplasaţi ai mărimilor var(b), respectiv
2
var(a), în măsura în care su este un estimator nedeplasat al dispersiei de selecţie a
erorilor  u2 .
Abaterile standard ale variabilelor aleatoare â şi b̂ , u , se calculează prin
extragerea rădăcinii pătrate din valorile corespunzătoare ale dispersiilor:
1
saˆ  su n
abaterea standard a estimatorului â ; (3.18)
 x  x
2
t
t 1

1 x2
sbˆ  su  n
abaterea standard a estimatorului b̂ (3.19)
n
 x  x
2
t
t 1

u t
2

su  t 1
abaterea standard a variabilei reziduale u ; (3.20)
n2

Procesul de verificare a semnificaţiei estimatorilor presupune parcurgerea


mai multor etape:
 acceptarea, sau a respingerea, uneia din cele două ipoteze alternative,
(ipoteze care nu pot fi simultan adevărate): ipoteza nulă (notată cu H0) şi ipoteza
alternativă (notată cu H1).
De exemplu, cele două ipoteze pot fi formulate sub forma:

51
a  0 a  0
Ho :  şi H1 :  (3.21)
b  0 b  0
sau, dacă se doreşte determinarea poziţiei unei valori particulare 0 a unei populaţii
în raport cu media acelei populaţii,  , se pot fi formulate următoarele ipoteze:
   0    0
 
H o :    0 şi H1 :   0 (3.22)
     
 0  0

 construirea unui test statistic şi identificarea distribuţiei statisticii


respective. Testul adecvat verificării semnificaţiei estimatorilor â şi b̂ , fiind
variabile normale, este testul “t”. Prin centrarea şi normarea estimaţiilor â şi b̂ , în
 
cazul ipotezei H0: L aˆ   N 0, s â  , L bˆ  N 0, s b̂  , se obţin valorile calculate:

1 aˆ  0
 t calc 
 saˆ
 (3.23)
ˆ
t 2  b  0
 calc sbˆ
sau
1 aˆ   0
 t calc 
 s aˆ
 dacă sunt utilizate relaţiile (3.22)
ˆ
t 2  b   0
 calc sbˆ
Aceste valori calculate sau empirice se compară cu valoarea teoretică:
♦ t care este o este variabilă normală, în cazul în care dimensiunea
eşantionului de date utilizat este mai mare de 30 de valori ( n  30 ). Valorile acestei
variabile pot fi preluate din tabela distribuţiei normale, în funcţie de o valoare
arbitrar aleasă a probabilităţii „p“ sau a pragului/nivelului de semnificaţie „α”, cu
proprietatea: p+ α = 1. Cele mai utilizate valori gradului de încredere sunt: p = 90%
=> α = 0,1, p = 95% => α = 0,05, sau p = 99% => α = 0,01. Alegerea pragului “α”
depinde de problema analizată şi de gravitatea consecinţelor unei erori. De
exemplu, dacă α = 0,05 aceasta înseamnă că înseamnă că în 5 din 100 de cazuri se
poate risca respingerea ipotezei adevărate. În condiţiile în care consecinţele erorii
respective sunt importante, se alege un prag mai mic, de exemplu, α = 0,01, sau
α = 0,001.

52
♦ în cazul uni eşantion de date cu un volum mai mic de 30 de observaţii se
utilizează variabila Student t ,  . Valorile acesteia pot fi preluate din tabela
distribuţiei Student, în funcţie de valoarea stabilită pentru α şi de numărul gradelor
de libertate,  .
Pe baza celor două valori, tcalc şi t ,  , regula de decizie a testului este:

1 aˆ
tcalc   t , 
 s
 se acceptă ipoteza H 0  estimatorii nu sunt

► dacă 
ˆ
t 2  b  t
 calc s ˆ  ,
 b

semnificativ diferiţi de zero, ceea ce determină renunţarea la valorile lor şi implicit


la modelul astefel determinat. În aceste condiţii se consideră o nouă specificare a
modelului;

1 aˆ
tcalc   t , 
 s
 se acceptă ipoteza H1  modelul a fost corect
ˆ
a
► dacă 
t 2  bˆ
 calc s ˆ  t , 
 b

specificat, identificat şi estimat şi se continuă discuţia econometrică;

1 aˆ
tcalc   t , 
 s
 se reţine modelul: y  f  x   u  ax  u şi se
ˆ
a
► dacă 
t 2  bˆ
 calc s ˆ  t , 
 b

continuă discuţia econometrică.

Ştiind că â şi b̂ , sunt repartizaţi normal, se poate estima intervalele de


încredere pentru fiecare dintre parametrii consideraţi, sub forma:

P aˆ  t ,   saˆ  a  aˆ  t ,   saˆ   p  1  

 
P bˆ  t ,   sbˆ  b  bˆ  t ,   sbˆ  p  1   (3.24)

Parametrii a şi b pot fi consideraţi semnificativ diferiţi de zero dacă:

53
 
P a  aˆ  t ,   saˆ  0  p  1  

 
P b  bˆ  t ,   sbˆ  0  p  1  

3.4.3.1 Testarea semnificaţiei estimatorilor modelului econometric prin


analiza varianţelor
Metoda analizei variaţiei porneşte de la identitatea:
yt  y  yt  yˆ t  yˆ t  y   yt  y    yt  yˆ t  yˆ t  y  care, prin însumare
2 2

devine:

 y     yt  yˆ t    yˆ t  y 
n n

 y
2 2
t (3.25)
t 1 t 1

unde:
yt sunt valorile reale ale fenomenului y;
ŷt sunt valorile teoretice ale fenomenului y ;

yˆ t  aˆ  xt  bˆ

y
1 n

n t 1
1 n 1 n
 
yt   yˆ t   aˆxt  bˆ aˆ  x  bˆ
n t 1 n t 1

Prin ridicarea la pătrat a binomului din membrul drept al relaţiei (3.25)


rezultă:
n n n n

 y  y     yt  yˆ t     yˆ t  y   2  yt  yˆ t    yˆ t  y 
2 2 2
t (3.26)
t 1 t 1 t 1 t 1

Termenii relaţiei (3.26) au următoarea semnificaţie statistică:


n

 y  y   V02 reprezintă variaţia totală a variabilei y determinată de toţi


2
t
t 1

factorii săi de influenţă;


n

  yˆ  y   Vx2 este variaţia fenomenului y provocată numai de variaţia


2
t
t 1

factorului x, considerat factorul dominant al variaţiei variabilei y;


n

 y  yˆ t   Vu2 este variaţia reziduală, sau variaţia fenomenului y generată


2
t
t 1

de către factorii nespecificaţi în model, factori consideraţi în etapa de specificare a

54
modelului ca fiind cu influenţă întâmplătoare, neesenţiali pentru a caracteriza
evoluţia fenomenului y.
Explicitând ultimul termen din membrul drept al relaţiei (3.26):

 t 1
t t t t 1
t
 
2 n  y  yˆ    yˆ  y   2 n aˆx  bˆ  aˆ x  bˆ  uˆ 
t

 (3.27)
n
n
  2 ˆ   xt  x   uˆt  2n aˆcovut , xt   0
a
 t 1 n

se obţine că cov xt , ut   0 , adică xt şi ut sunt variabile independente, această


condiţie realizându-se în cazul în care erorile sunt homoscedastice.
Variaţiei fenomenului y provocată numai de variaţia factorului x şi variaţiei
reziduale corespund, funcţie de numărul gradelor de libertate (k), dispersii corectate
şi anume:
 2 Vx2
s
 y / x 
k
 2
(3.28)
s 2  Vu
 u n  k  1

În aceste condiţii pot fi formulate ipotezele:


H 0 : s y2 / x  su2  cele două dispersii sunt aproximativ egale, adică
influenţa factorului x nu diferă semnificativ de influenţa factorilor întâmplători;
H1 : s y2 / x  su2  influenţa factorului x şi a factorilor întâmplători diferă
semnificativ şi, în aceste condiţii se poate trece la discuţia similitudinii, a
verosimilităţii modelului teoretic în raport cu modelul real.
Testarea semnificaţiei dintre cele două dispersii se face cu ajutorul
distribuţiei teoretice Fisher-Snedecor, respectiv cu testul „F”. Etapele pentru
construirea testului sunt:
- se calculează valoarea variabilei „F” ( Fcalc ), cu ajutorul relaţiei:
s y2 / x Vx2 n  k  1
Fcalc  s y2 / x   (3.29)
su2 k Vu2
- se stabileşte un prag se semnificatie „  ” (α = 0,1; α = 0,05 sau α = 0,01) şi
din tabela repartiţiei Fisher – Snedecor se preia valoarea teoretică a variabilei „F”
( F1 , 2 , ), unde  1  k (numărul gradelor de libertate) şi  2  n  k  1 ;
- luarea deciziei se face după regula:
55
 se acceptă H0 şi se respinge H1 dacă:
Fcalc  F1 , 2, 

 se acceptă H1 şi se respinge H0 dacă:


Fcalc  F1 , 2 ,

Legătura dintre R 2 şi F
Dacă se acceptă H1 şi dacă variabila u este independentă de fenomenul x,
(cov(x,u)=0), atunci ecuaţia analizei variaţiei este:
V02  V x2  Vu2 (3.30)
ecuaţie care, prin împărţire la V02 , devine:

Vx2 Vu2
1 2  2 (3.31)
V0 V0
Vx2
Termenul 2 se numeşte coeficient (raport) de determinare şi se notează
V0
R y2/ x .
Dacă:
Ry2/ x  0 , atunci x nu este factorul determinant al variaţiei fenomenului y ;
Ry2/ x  0; 0,5 , atunci x este unul din factorii de influenţă al variaţiei
fenomenului y , dar nu unul important;
R y2/ x   0,5;1 , atunci x este un factor esenţial în variaţia fenomenului y ;
R y2/ x  1 , atunci x este singurul factor care influenţează variaţia fenomenului
y;
Testarea semnificaţiei unui model econometric se poate face de asemenea cu
testul „F”, dar, pornind de la valoarea de determinare R y2/ x :

s y2 / x Vx2 n  k  1 R2 n  k 1
Fcalc  s 2
    (3.32)
1  R2
y/x
su2 k Vu2 k

şi anume:

56
R2 n  k 1
- dacă Fcalc    F1 , 2 ,  Ry2/ x  0 , deci x nu este factorul
1 R 2
k
esenţial care determină variaţia fenomenului y şi în acest condiţii se
renunţă la modelul obţinut;
R2 n  k  1
- dacă Fcalc    F1 , 2 ,   R y2/ x  0 , atunci se trece la
1 R 2
k
discuţia similitudinii, a verosimilităţii modelului teoretic în raport cu
modelul real.

3.4.4. Compararea coeficienţilor de regresie pentru două modele lineare


În anumite situaţii sunt estimate două modele pentru spaţii diferite (exemplu:
două judeţe, sau două pieţe diferite), sau pentru perioade de timp diferite, ale
aceloraşi două fenomene y şi x , de exemplu:

M 1 : yˆ  aˆ1  x  bˆ1 şi M 2 : yˆ  aˆ 2  x  bˆ2 (3.33)


situaţie în care se poate testa ipoteza omogenităţii sau stabilităţii relative a legităţii
dintre cele două fenomene astfel:
H 0 : aˆ1  aˆ 2  cele două modele sunt relativ omogene, sau legătura este
relativ stabilă în timp;
H 1 : aˆ1  aˆ 2  cele două modele nu sunt omogene (legătura nu este relativ
stabilă).
aˆ1  aˆ 2
Se calculează statistica t calc  ~ N 0,1
s s
2
aˆ1
2
aˆ 2

aˆ1  aˆ 2
► dacă t calc   t ,   se acceptă ipoteza H 0
s a2ˆ1  s a2ˆ2

aˆ1  aˆ 2
► dacă t calc   t ,   se acceptă ipoteza H 1
s a2ˆ1  s a2ˆ2

Observaţie: ipoteza H0 este folosită în special în domeniul prognozei,


deoarece acceptarea ei presupune existenţa unei legături relativ stabile în timp,
premisă ce justifică previziunea fenomenului y pe baza valorilor viitoare ale
fenomenului x .
În afara metodei de estimaţie punctuală, yˆ t  aˆ  xt  bˆ , valorile de variaţie
ale fenomenului y pot fi determinate şi pe baza unui interval de încredere:
57
P  yˆ t  t ,  s yˆt  yt  yˆ t  t ,  s yˆt   p  1   (3.34)
Prognoza fenomenului y în condiţiile în care se cunosc valorile variabilei
factoriale x pentru momentul (n+v) se realizează, de obicei, pe baza unui interval
de încredere:
P  yˆ n  t ,  s yˆ n  yn  yˆ n  t ,  s yˆ n   p  1   (3.35)
unde:
yn  este valoarea reală a variabilei y în momentul de prognoză (n+v);
ŷn  este estimaţia punctuală a valorii de prognoză pentru variabila y , care
se calculează cu ajutorul relaţiei:
yˆ n  aˆ  xn  bˆ (3.36)

s yˆ n este abaterea standard a erorii de previziune, calculată cu ajutorul


relaţiei:
 
 1  x  x 2 
s yˆ n   s y2ˆn   su2  1   n n  (3.37)
 n
 xt  x  
2

 t 1` 

Relaţia (3.37) pune în evidenţă faptul că, erorea de previziune ( s yˆ n ) scade
odată cu creşterea numărului de observaţii şi cu apropierea valorilor variabilelor în
momentul de prognoză (n+v) de media lor.
Prognozei unui fenomen y pe baza unui model econometric, yˆ t  aˆ  xt  bˆ ,
trebuie să satisfacă două condiţii fundamentale: siguranţa şi precizia prognozei,
noţiuni care se află în relaţie invers proporţională.
Siguranţa prognozei este dată de probabilitatea (p) cu care este estimat
intervalul de încredere, iar precizia prognozei de relaţia:

 eroarea absolută: ea  y n  yˆ n  t ,  s yˆ n (3.38)

ea t ,  s yˆ n
 eroarea relativă: er %    100   100 (3.39)
yˆ n yˆ n

Analiza capacităţii de prognoză a unui model poate fi realizată pe baza


indicatorilor statistici propuşi de H. Theil (Pindyck, Rubinfeld, 1981, p. 364-366).
Aceşti indicatori sunt calculaţi pe baza următoarelor relaţii:
58
► coeficientul Theil

1 n
  yˆ t  yt 2
T n t 1 (3.40)
1 n 2 1 n 2
 t
n t 1
ˆ
y   yt
n t 1

ale cărui valori sunt cuprinse în intervalul [0, 1].


Semnificaţia acestui indicator este invers proporţională cu mărimea lui,
respectiv cu cât valoarea acestuia este mai mică, tinzând către zero, cu atât
capacitatea de prognoză a modelului este mai bună.
► ponderea abaterii

T 
A yˆ  y  2


yˆ  y  2

(3.41)
1 n
 yˆ t  yt 2  u2

n t 1
unde:
ŷ este media valorilor teoretice ale variabilei endogene;
y este media valorilor reale ale variabilei endogene;
 u2 este dispersia variabilei reziduale necorectată cu numărul gradelor de
libertate.
Acest indicator evidenţiază existenţa unor erori sistematice, prin urmare, în
cazul ideal, valoarea sa este egală cu zero. Prezenţa unor erori de estimare de-a
lungul întregii serii de timp este pusă în evidenţă de valoarea unu a acestui
indicator.
► ponderea dispersiei
2
 1 n 
   yt 
2   t  ˆ
y  ˆ
y 2

1 n
  yt  y 2 
n t 1 n t 1
T   
yˆ t
D
(3.42)
1 n
 yˆ t  yt 2 u
2


n t 1
care este definită tot în intervalul [0, 1]. O valoare scăzută a acestui indicator pune
în evidenţă o capacitate bună de prognoză, în timp ce o valoare apropiată de unu
exprimă o eroare de specificare a modelului.

59
► ponderea covarianţei

21  r  yˆ t y t
TC  (3.43)
1 n
  yˆ t  yt 2
n t 1
unde:
r este coeficientul de corelaţie lineară dintre valoarea estimată a variabilei
endogene, ŷt , şi cea reală, yt , dat de relaţia:

  yˆ  yˆ  yt  y 
n

t
r t 1
(3.44)
n yˆt  yt

Ecuaţiă propusă de Theil:

1 n
  yˆ t  yt 2  yˆ  y    yˆt   yt 2  21  r  yˆt  yt
2
(3.45)
n t 1
A D C
cuprinde cei patru indicatori, T , T , T , T
Utilizarea modelului econometric în special la prognoza fenomenelor
economice necesită verificarea stabilităţii în timp a legităţii de evoluţie a
fenomenului analizat în funcţie de evoluţia factorilor săi. Printretehnicile utilizate
în acest scop se numără şi testului Chow, care se aplică astfel:
♦ modelul unifactorial iniţial:
 y 0 t  a  x0 t  b  u 0 t t  1, n;

 2 n (3.46)
 u0 
V 
t 1
u 02t

este împărţit în două modele:

 y1t  a  x1t  b  u1t t  1, n;



I.  2 n 2 (3.47)
Vu1  
t 1
u1t

 y 2 t  a  x2 t  b  u 2 t t  1, n;

II.  2 n (3.48)
 u2 
V 
t 1
u 22t

60
cu
n n n

 ut2  u12t   u22t  Vu2  Vu12  Vu22


t 1 t 1 t 1
(3.49)

n  n1  n2 , n reprezentând numărul total de observaţii, iar n1 şi n2 reprezintă


numărul de observaţii corespunzătoare celor două modele.
♦ testarea ipotezei de stabilitate presupune alegerea uneia din următoarele
ipoteze:
H0: dacă Vu  Vu0  legitatea de evoluţie a fenomenului este stabilă în
2 2

timp, iar modelul poate fi utilizat în vederea realizării prognozei;


H1: dacă Vu  Vu0  legitatea de evoluţie a fenomenului nu este stabilă în
2 2

timp, iar modelul nu va putea fi utilizat în vederea realizării prognozei.


♦ se aplică testul Fisher-Snedecor:

Vu20  Vu2 n  2k  1


- dacă Fc    F1 , 2, (3.50)
Vu2 k 1

se alege ipoteza H0, în caz contrar se alege ipoteza H1

3.4.5. Corelaţia neparametrică


Ori de câte ori una sau mai multe variabile luate în calcul nu pot fi exprimate
sub formă nenumerică (calitative, nominative) formulele corelaţiei parametrice
devin inoperante. Între valorile seriei varabilelor nenumerice X   x1 , x2 ,..., xn  se
poate introduce o relaţie de ordine  x(1) , x( 2 ) ,..., x( n ) , cu proprietatea de ordine
x(1)  x( 2 )  ...  x( n ) . Dacă şi variabila Y se exprimă sub aceeaşi formă, atunci se
utilizează transformata:
 
T : X  Y  R x  R y cu T  xi , yi   R ix , Riy , i  1, n (3.51)

cu R ix şi R iy  1,2,3,..., n, iar prin R ix şi R iy se specifică ordinea valorilor


variabilelor X şi Y înregistrate la unitatea i în cadrul fiecărei serii, definite în
variabila considerată.

Exemplul 3.1:
Pentru 10 elevi au fost apreciate aptiudinile lor la muzică şi sculptură, prin
clasamente întocmite de profesorii de specialitate (tabelul 3.2):
61
Tabelul 3.2
Disciplina Elev 1 2 3 4 5 6 7 8 9 10
Muzică (X) 9 5 7 6 4 2 10 3 1 2
Sculptură (Y) 6 7 9 2 3 10 1 4 5 8

În aceste variante, pentru măsurarea intensităţii legăturilor dintre cele două


variabile, în locul metodelor parametrice prezentate, se utilizează metode
nemarametrice, fundamentate pe ranguri (numere de ordine).
Printre cele mai utilizate metodele neparametrice pot fi enumerate:
• coeficientul de asociere propus de Yule;
• coeficientul de corelaţie a rangurilor Spearman;
• coeficientul de corelaţie a rangurilor Kendall.

Coeficientul de asociere Yule se utilizează atunci când unităţile


caracteristicii sunt separate în două grupe sau sunt de forma unei caracteristici
alternative, de exemplu (tabelul 3.3):

Tabelul 3.3
X Y Total
y1 y2
x1 m n m+n
x2 p q p+q
Total m+p n+q m+n+p+q

Pentru exprimarea intensitatii celor două variabile se utilizează un coeficient


de asociere calculate pe baza relaţiei:

mq n p
Q (3.52)
mq  n p

Interpretarea rezultatului este identică cu cea de la coeficientul de corelaţie.

Exemplul 3.2:
Dintr-un total de 3890 persoane care au achizitionat produse în timpul unei
săptămâni dintr-un magazin de produse de vestimentaţie, 1350 sunt clienţi
permananţi şi 2540 ocazionali. Din acelaşi total 2590 sunt femei şi 1300 barbaţi
(tabelul 3.4). Între fidelitatea faţă de magazin şi clienţi se află o anumită legătură?

62
Tabelul 3.4
X Y
Barbaţi Femei Total
Clienţi permananţi (x1) 304 (m) 1046 (n) 1350 (m+n)
Clienţi ocazionali (x2) 996 (p) 1544 (q) 2540 (p+q)
Total 1300 (m+p) 2590 (n+q) 3890 (m+n+p+q)

m  q  n  p 304  1544  1046  996  572440


Q    0.3788003
m  q  n  p 304  1544  1046  996 1511192

rezultând o asociere inversă între sex şi tipul de client în sensul că nu bărbaţii sunt
clienţi permanenti, ci femeile. Sau, nu este adevărat că femeile sunt cliente
ocazionale.

Coeficientul de corelaţie a rangurilor Spearman exprimă intensitatea şi


sensul legăturii dintre rangurilor celor “n” unităţi.
Se consideră că unităţile sunt ordonate după valorile caracteristicii X .
Atunci, pentru fiecare unitate se defineşte cuplul de valori i, Ri  şi pentru seria
i, R , i  1, n se calculează coeficientul linear de corelaţie:
i

n
6   d i2
i 1
rS  1  (3.53)

n  n 1 2

unde: d i  i  Ri .
Proprietăţile lui rS sunt:
i) rS   1,1;
ii) rS  1  i  Ri ;
iii) rS  1  i  Ri  n  1

Exemplul 3.3: cu datele din tabelul 3.2 se obţin rezultatele:


6
[9  6   5  7   7  9   6  2   4  3 
2 2 2 2 2
rS  1  2

10 10  1 
 2  10   10  1  3  4   1  5  2  8 ] 
2 2 2 2 2

6
1 232  1  1,4060606  0,4060606
990
valoare ce pune în evidenţă o asociere inversă între cele două specializări.

63
Exemplul 3.4
Pentru 6 studenţi dintr-o grupă se cunosc: calificativele pentru nivelul de
pregătire al studenţilor la matematică, obţinute în timpul anului şi notele obţinute la
examenul de statistică (tabelul 3.5):
Tabelul 3.5
Student Calificativ la Notă la
matematică econometrie
1 bun 9
2 slab 3
3 excepţional 10
4 satisfăcător 6
5 foarte slab 5
6 foarte bun 8

Se acordă ranguri valorilor celor două variabile (Tabelul 3.6, col. 1, 2)

Tabelul 3.6
Student Rang pentru x Rang pentru y Diferenţa între ranguri d i2
rxi ryi d i  rxi  ryi
0 1 2 3 4
1 4 5 -1 1
2 2 1 +1 1
3 6 6 0 0
4 3 3 0 0
5 1 2 -1 1
6 5 4 +1 1
Total 4

6 4
rs  1   0.89
6  36  1

indică o asociere puternică între cele 2 variabile.

Coeficientul de corelaţie a rangurilor Kendall este destinat tot analizei


intensităţii legăturii dintre rangurile celor “n” unităţi. Corespunzător valorilor
obţinute pentru fiecare unitate se acordă ranguri, obţinând cuplurile de valori
 
i, Ri , i  1, n . Construirea acestui indicator se bazează pe definirea numărului de
puncte discordante şi a celor concordante:

64
Două unităţi sunt concordante dacă xi  x j  yi  y j
Două unităţi sunt disconcordante dacă xi  x j  yi  y j
Prin definiţie:

 1 daca i si j sunt concordante


d ij  
- 1 daca i si j sunt discordante
n n
şi S   d ij
i 1 j 1

Atunci, expresia:

2S
rK  (3.54)
n  n  1

se numeşte coeficientul de corelaţie a rangurilor (Kendall)


Proprietăţile lui rK sunt:
i) rK   1,1 ;
ii) rK  1  i  Ri (clasamente identice);
iii) rK  1  i  Ri  n  1
În general, coeficientul rangurilor Kendall are o valoare mai mică decât
coeficientul rangurilor Spearman şi, pentru un număr mare de unităţi statistice (n)
avem relaţia:
2
  rs (3.55)
3

Exemplul 3.5:
Potrivit publicaţiilor din Anuarul Statistic al României 2008, prin niveluri
ale performanţei interne (exprimate prin indicatorul PIB/locuitor calculat pe baza
cursului de schimb (în euro) şi, respectiv, ale performanţei externe (sintetizate prin
indicatorul export FOB pe locuitor (dolari SUA)) cuprinse în tabelul 3.7).

Se cere:
Să se precizeze rolul fiecărei variabile în analiza legăturii şi să se observe
sensul şi forma legăturii între cele două variabile.

65
Tabelul 3.7
xi yi xi2 yi2 xi y i
Export
PIB/loc FOB/locuitor
(x 103) (x 103)
1 Austria 32,60 18,87 1062,76 356,26 615,32
2 Belgia 31,50 40,71 992,25 1657,62 1282,49
3 Bulgaria 3,80 2,40 14,44 5,78 9,13
4 Danemarca 41,70 18,70 1738,89 349,78 779,89
5 Elvetia 41,50 21,95 1722,25 481,67 910,80
6 Finlanda 34,00 16,94 1156,00 287,07 576,07
7 Franţa 29,80 8,52 888,04 72,63 253,97
8 Germania 29,50 16,15 870,25 260,79 476,39
9 Grecia 20,40 2,10 416,16 4,39 42,75
10 Irlanda 43,70 27,87 1909,69 776,66 1217,86
11 Italia 25,90 8,43 670,81 71,07 218,35
12 Lituania 8,40 32,13 70,56 1032,34 269,89
13 Norvegia 60,40 29,36 3648,16 861,83 1773,16
14 Olanda 34,60 29,07 1197,16 845,26 1005,94
15 Polonia 8,10 3,64 65,61 13,26 29,50
16 Portugalia 15,40 4,70 237,16 22,05 72,31
Regatul Unit al
33,70 7,09 1135,69 50,22 238,81
17 Marii Britanii
18 Republica Cehă 12,30 11,85 151,29 140,51 145,80
19 România 5,74 1,88 32,98 3,53 10,79
20 Slovacia 10,20 10,70 104,04 114,43 109,11
21 Slovenia 17,10 13,24 292,41 175,19 226,34
22 Spania 23,40 5,45 547,56 29,67 127,46
23 Suedia 36,30 18,34 1317,69 336,37 665,75
24 Ungaria 10,10 9,25 102,01 85,48 93,38
Sume calculate
după eliminarea
570,24 286,49 19281,05 5343,91 9598,89
valorilor
aberante
Sursa detelor: Anuarul Statistic al României, 2008, pp. 898, 940

66
Rezolvare
Potrivit teoriei economice a relaţiilor internaţionale, performanţa exterioară a
unei ţări depinde, în bună măsură, de cum şi ce anume produce şi oferă spre export
economia acelei ţări.
Prin urmare, variabila PIB/locuitor se consideră a fi cauza sau variabila
independentă (explicativă sau factorială), variantele ei notându-se cu xi, iar
variabila export/locuitor este considerată efect sau variabilă dependentă (explicată
sau ezultativă), variantele notându-se cu yi.
De asemenea, nivelul exportului/locuior realizat de fiecare ţară depinde, în
afară de propriul PIB/locuitor, de mulţi alţi factori, cum ar fi politica comercială şi,
în particular, acordurile şi înţelegerile economice la care este parte contractantă,
mediul conjunctural specific al diferitelor sectoare etc.

a) Se dispun cele 24 de puncte de coordonate  xi , yi  în sistemul


rectangular al axelor de referinţă. Analiza norului de puncte rezultant (figura 3.1)
pune în evidenţă fatul că sunt câteva cupluri care nu aparţin norului. Aplicarea
testului Shapiro-Wilk13 a permis eliminarea valorilor aberante.

Figura 3.1 Diagrama legăturii dintre PIB/locuitor şi exportul FOB/locuitor

45.00
40.00
35.00
Exp ort FOB/locuitor

30.00

25.00
20.00

15.00

10.00
5.00

0.00
0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00
PIB/locuitor

13
D. V. Iliescu, V. Vodă, „Statistică şi toleranţă”, Ed Tehnică, 1977, pp. 74

67
Datele statistice rămase, sugerează existenţa unei legături directe de forma
unei dreptei (figura 3.2):

yi  axi  b  ui

Figura 3.2 Diagrama legăturii dintre PIB/locuitor şi exportul FOB/locuitor cu


date preluctate statistic şi dreapta de regresie

35.00

30.00

25.00
Export FOB/locuitor

20.00

15.00

10.00
y = 0.4829x + 0.5063
5.00
R2 = 0.6505
0.00
0.00 10.00 20.00 30.00 40.00 50.00
PIB/locuitor

b) Se estimeză parametrii funcţiei lineare de regresie astfel:


22 22 22
Se calculează:  xi  570,24 ,  yi  286,49 ,  xi2  19281,05 ,
i 1 i 1 i 1

22 22
 yi2  5345,91 ,  xi yi  9598,89 ,
i 1 i 1

Pentru estimarea parametrilor dreptei pentru care distanţa este minimă până
la punctele de coordonate  xi , yi  , se rezolvă sistemul de ecuaţii normale:

 ˆ n n

n  b  aˆ  
i 1
xi   y i
i 1
 n n n
bˆ   x  aˆ   x 2   x y
 i 1 i i 1
i
i 1
i i

care, pentru cazul considerat, devine:

68
22bˆ  570,24aˆ  286,49

570,24bˆ  19281,05aˆ  9598,89

aˆ  0,482916
rezolvarea sistemului conduce la obţinerea următoarelor valori: 
ˆ
b  0,504640
Din punct de vedere geometric, b̂ este ordonata punctului în care dreapta de
regresie intersectează axa Oy, iar â reprezintă panta (coeficientul unghiular al
dreptei de regresie).
Prin semn, â exprimă, sensul influenţei PIB/locuitor asupra exportului pe
locuitor (+ înseamnă influenţă directă), iar prin mărime, cunatumul influenţei (la
fiecare creştere cu o unitate a cauzei, variabila efect tinde să se modifice în acelaşi
sens cu 0,50464 unităţi).
Prin urmare, funcţia lineară de regresie este:

yˆ i  0,482916 xi  0,504640 (3.56)

şi sintetizează pentru cele 22 de ţări tendinţa medie de variaţie a performanţei


externe, exprimate prin export/locuitor în anul 2007 sub influenţa exclusivă a
PIB/locuitor.

c) cuantificarea intensităţii legăturii dintre cele două variabile.


Deoarece s-a demonstrat existenţa unei legături lineare între cele două
variabile, se poate folosi pentru calculul coeficientului de corelaţie următoarea
relaţie:
22 22 22
n xi yi   xi  yi
i 1 i 1 i 1
r
 22 2  22  2   22 2  22  2 
 n  xi    xi    n  y i    y i  
 i 1  i 1    i 1  i 1  

Introducând datele de mai sus în această relaţie, rezultă r  0,8065 , ceea ce


înseamnă că între PIB/locuitor şi exportul/locuitor al celor 22 ţări exista în anul
2007 o legătură directă de intensitate destul de puternică.
Dacă se consideră că R 2  r 2 , atunci se obţine că R 2  r 2  0,65 , ceea ce
indică că, funcţia sintetizează 65% din variaţia totală a exportului/locuitor al ţărilor

69
considerate în anul 2007. Cota ridicată a determinaţiei arată implicit faptul că
PIB/locuitor este un factor important de influenţă, iar aprecierea lineară a acestei
influenţe satisfăcătoare.

70

S-ar putea să vă placă și