Documente Academic
Documente Profesional
Documente Cultură
Deseori, apare necesitatea de a explica și controla, pe cât posibil, fenomenele și procesele din
economie, care pot reflecta situații mai mult sau mai puțin favorabile. De aceea, se elaborează
o serie de instrumente eficiente cu ajutorul cărora să explicăm situațiile existente și să
eliminăm (sau eventual să diminuăm) efectele nedorite ce pot apărea într-un anumit context
economic.
Modelul econometric este o verigă intermediară între teorie și practică, o imagine simplificată
a realității economice, ale cărei componente principale sunt exprimate sintetic printr-un set de
variabile, precum și prin relațiile (intercondiționările) dintre aceste variabile.
În plus, modelele econometrice pot servi la analiza și a altor aspecte ale realității economice,
precum:
- identificarea și măsurarea efectului întârziat al unor factori economico-sociali;
- previzionarea evoluției unor fenomene;
- oscilațiile sistematice, sezoniere sau ciclice;
- simularea și prognoza proceselor economico-sociale;
- identificarea și măsurarea acțiunii unor variabile dihotomice, alternative sau binare.
1
Legăturile care există între două variabile statistice pot fi studiate folosind două tehnici:
- corelația – va arăta cât de puternică este legătura, dependența dintre variabile;
- regresia – va ajuta în explicarea și previzionarea unui factor pe baza valorii altuia
(altora). În sens statistic, termenul „regresie” îi aparține statisticianului englez
Francis Galton (1822-1911).
Există 3 scopuri principale, atunci când analizăm legăturile dintre variabile statistice:
- să descriem și să înțelegem relațiile de dependență;
- să previzionăm o nouă valoare a variabilei efect;
- să ajustăm și să controlăm variabila efect, prin intervenția asupra variabilei cauză.
Un studiu econometric începe cu o serie de presupuneri teoretice despre anumite aspecte ale
economiei.
Identificarea modelului constă în alegerea unei funcții (sau a unui grup de funcții)
matematice, cu ajutorul căreia se urmărește descrierea valorilor variabilei endogene, doar în
funcție de variația variabilei exogene X. Identificarea modelului se poate face prin:
- procedeul grafic;
- procedeul conservării ariilor;
- procedeul calculelor algebrice.
2
Una dintre funcțiile matematice utilizate cel mai des este funcția liniară. Relația dintre
variabila efect (Y) și variabila cauză (X) studiată de regresia simplă liniară într-o populație
statistică generală poate fi descrisă prin modelul probabilistic liniar:
𝑦𝑖 = 𝛼 + 𝛽𝑥𝑖 + 𝜀𝑖
în care:
(𝑥𝑖 , 𝑦𝑖 ) reprezintă valorile numerice ale variabilelor cauză (X) și efect (Y), înregistrate
la nivelul unității statistice „i”;
- componenta deterministă, adică partea din valoarea lui 𝑦𝑖 , care poate fi determinată
cunoscând valoarea 𝑥𝑖 (𝛼 + 𝛽𝑥𝑖 = 𝑦̂𝑖 );
- componenta reziduală este partea din valoarea lui 𝑦𝑖 , care nu poate fi determinată
cunoscând valoarea individuală 𝑥𝑖 (𝜀𝑖 ).
sau 𝑦𝑖 = 𝑦̂𝑖 + 𝜀𝑖 .
3
Dacă datele disponibile provin dintr-un eșantion (așa cum se întâmplă în cele mai multe
cazuri), avem la dispoziție n perechi de observații (𝑥1 , 𝑦1 ), (𝑥2 , 𝑦2 ), … , (𝑥𝑛 , 𝑦𝑛 ), iar modelul
de regresie liniară în eșantion este:
𝑦𝑖 = 𝑎 + 𝑏𝑥𝑖 + 𝑒𝑖
cu componenta predictibilă:
𝑦̂𝑖 = 𝑎 + 𝑏𝑥𝑖
unde a și b sunt estimatorii punctului de intercepție (𝛼) și ai pantei liniei de regresie (𝛽),
obținuți pe eșantion, iar 𝑒𝑖 , estimatorul componentei reziduale, 𝜀𝑖 .
Pentru a obține proprietățile dorite ale estimatorilor regresiei, se fac, de obicei, șase
presupuneri (ipoteze) standard pentru modelul din populația generală.
1. Forma funcțională
Ipoteza de liniaritate nu este atât de restrictivă pe cât pare. Aceasta se referă la felul în care
parametrii intră în ecuație, nu neapărat la relația dintre variabilele X și Y.
4
În exemplele următoare:
𝑦 = 𝑎 + 𝑏𝑥
𝑦 = 𝑎 + 𝑏𝑧, 𝑧 = 𝑒 𝑥
1
𝑦 = 𝑎 + 𝑏𝑟, 𝑟 = 𝑥
𝑦 = 𝑎 + 𝑏𝑞, 𝑞 = ln 𝑥
𝑦 = 𝐴𝑥 𝛽 ⟹ ln 𝑦 = 𝛼 + 𝛽 ln 𝑥,
1
𝑦=𝛼+
𝛽+𝑥
De exemplu, modelul:
𝑦 = 𝐴𝑥 𝛽 𝑒 𝜀
ln 𝑦 = ln 𝐴 + 𝛽 ln 𝑥 + 𝜀
5
Dacă ipoteza de liniaritate este verificată, variabila dependentă observată este suma a două
elemente:
- componenta predictibilă: 𝛼 + 𝛽𝑥
- o componentă aleatoare: 𝜀.
Chiar dacă valorile 𝑥𝑖 sunt numere fixate sau sunt variabile aleatoare, ele sunt statistic
independente de variabila aleatoare 𝜀𝑖 .
6
Estimarea parametrilor modelului de regresie simplă liniară
𝑦𝑖 = 𝑎 + 𝑏𝑥𝑖 + 𝑒𝑖
unde a și b sunt coeficienții funcției de regresie, iar 𝑒𝑖 componenta reziduală (pentru unitatea
„i”) în eșantion.
Un criteriu pentru determinarea valorilor a și b este metoda celor mai mici pătrate
(MCMMP) - metoda minimizării sumei pătratelor reziduurilor (abaterilor, deviațiilor) 𝑒𝑖 .
Metoda urmărește:
𝑛 𝑛
𝜕𝑆
=0 ∑𝑛 2(𝑦𝑖 − 𝑎 − 𝑏𝑥𝑖 )(−1) = 0 ∑𝑛 𝑦𝑖 − 𝑛𝑎 − 𝑏 ∑𝑛𝑖=1 𝑥𝑖 = 0
{𝜕𝑎 ⟹ { 𝑛𝑖=1 ⟹ { 𝑛 𝑖=1
𝜕𝑆
=0 ∑𝑖=1 2(𝑦𝑖 − 𝑎 − 𝑏𝑥𝑖 )(−𝑥𝑖 ) = 0 ∑𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑎 ∑𝑛𝑖=1 𝑥𝑖 − 𝑏 ∑𝑛𝑖=1 𝑥𝑖2 = 0
𝜕𝑏
7
Se obține sistemul de ecuații normale:
𝑛 𝑛
𝑛𝑎 + 𝑏 ∑ 𝑥𝑖 = ∑ 𝑦𝑖
𝑖=1 𝑖=1
𝑛 𝑛 𝑛
𝑎 ∑ 𝑥𝑖 + 𝑏 ∑ 𝑥𝑖2 = ∑ 𝑥𝑖 𝑦𝑖
{ 𝑖=1 𝑖=1 𝑖=1
Δ𝑎
𝑎=
Δ
cu soluția { Δ𝑏 ,
𝑏= Δ
𝑛
2 2
𝜕 𝑆 𝜕 𝑆 2𝑛 2 ∑ 𝑥𝑖
2
𝐻(𝑎, 𝑏) = 𝜕𝑎2
𝜕𝑎𝜕𝑏 =
𝑛
𝑖=1
𝑛
𝜕 𝑆 𝜕 2𝑆
(𝜕𝑏𝜕𝑎 𝜕𝑏 2 ) 2 ∑ 𝑥𝑖 2 ∑ 𝑥𝑖2
( 𝑖=1 𝑖=1 )
Δ1 = 2𝑛 > 0 și
rezultă că matricea 𝐻(𝑎, 𝑏) este pozitiv definită, deci soluția anterioară (𝑎, 𝑏) este un punct
de minim pentru funcția 𝑆(𝑎, 𝑏).
8
Coeficientul a (intercepția) poate lua valori negative sau pozitive.
𝑦̂𝑖 = 𝑎 + 𝑏𝑥𝑖 .
Dacă datele au fost sistematizate utilizând metoda grupării, iar valorile 𝑥𝑖 și 𝑦𝑖 se întâlnesc cu
frecvențele 𝑛𝑖 , atunci sistemul de ecuații normale, pentru determinarea coeficienților a și b,
devine:
𝑟 𝑟 𝑟
𝑎 ∑ 𝑛𝑖 + 𝑏 ∑ 𝑛𝑖 𝑥𝑖 = ∑ 𝑛𝑖 𝑦𝑖
𝑖=1 𝑖=1 𝑖=1
𝑟 𝑟 𝑟
𝑎 ∑ 𝑛𝑖 𝑥𝑖 + 𝑏 ∑ 𝑛𝑖 𝑥𝑖2 = ∑ 𝑛𝑖 𝑥𝑖 𝑦𝑖
{ 𝑖=1 𝑖=1 𝑖=1
∑ 𝑛𝑖 𝑦𝑖 = ∑ 𝑛𝑖 𝑦̂𝑖
𝑖=1 𝑖=1
9
În cazul în care datele au fost sistematizate într-un tabel cu dublă intrare, iar valorile 𝑥𝑖 și 𝑦𝑗
se întâlnesc cu frecvențele 𝑛𝑖𝑗 , sistemul devine
𝑟 𝑚 𝑟 𝑚
unde: 𝑛𝑖∗ = ∑𝑚 𝑟
𝑗=1 𝑛𝑖𝑗 , 𝑛∗𝑗 = ∑𝑖=1 𝑛𝑖𝑗 .
𝑚 𝑚
10
Coeficientul de corelație liniară
În cazul legăturii simple liniare, o măsură relativă a dependenței dintre două variabile o
constituie coeficientul de corelație. Acest indicator standardizează media produselor
abaterilor și caracterizează direcția (semnul lui) și intensitatea (valoarea lui) legăturii liniare.
Se observă că:
𝑆𝑋 ∑𝑛 (𝑥𝑖 − 𝑥̅ )2
𝑟=𝑏∙ = 𝑏 ∙ √ 𝑛𝑖=1
𝑆𝑌 ∑𝑖=1(𝑦𝑖 − 𝑦̅)2
11
Validarea modelului unifactorial de regresie liniară
Deoarece valorile previzionate pentru modelul de regresie depind de variația lui X, trebuie
verificat dacă variația lui X este un bun predictor pentru variația lui Y, adică presupune
validarea modelului de regresie obținut. Pentru atingerea acestui obiectiv se parcurg
următoarele etape:
Pe baza acestor două medii diferite, variația (abaterea) totală poate fi împărțită în:
variația neexplicată de model (𝑦𝑖 − 𝑦̂𝑖 ) și
variația explicată (𝑦̂𝑖 − 𝑦̅).
Abaterea (𝑦𝑖 − 𝑦̂𝑖 ) nu poate fi explicată de linia de regresie, deoarece atunci când 𝑥𝑖 se
modifică, ambele valori 𝑦𝑖 și 𝑦̂𝑖 se modifică; în schimb, abaterea (𝑦̂𝑖 − 𝑦̅) poate fi explicată,
deoarece când 𝑥𝑖 se schimbă, 𝑦̅ rămâne constant.
12
Prin ridicarea la pătrat a fiecărei abateri și însumarea pentru toate observațiile, obținem:
𝑛 𝑛 𝑛
Vom nota:
∑𝑛𝑖=1(𝑦̂𝑖 − 𝑦̅)2 = Δ2𝑦/𝑥 = varianța explicată (suma pătratelor abaterilor datorate regresiei).
Deci, varianța totală este egală cu varianța explicată de model plus varianța neexplicată
(reziduală):
13
Pentru calculul statisticii F (testul F), utilizată pentru testarea calității ajustării, folosim
tabelul ANOVA:
2
𝑆𝑦/𝑥
𝐹𝑐𝑎𝑙𝑐 =
𝑆𝑒2
Dacă 𝑭𝒄𝒂𝒍𝒄 > 𝑭𝜶;𝒌;𝒏−𝒌−𝟏 se respinge 𝑯𝟎 , adică se concluzionează că modelul este valid.
Δ2𝑦
Estimatorul dispersiei variabilei Y este: 𝑆𝑦2 = 𝑛−1.
14
Estimatorul dispersiei reziduurilor se determină ca:
Δ2 ∑𝑛 ̂ 𝑖 )2
𝑖=1(𝑦𝑖 −𝑦
𝑆𝑒2 = 𝑛−𝑘−1
𝑒
= ,
𝑛−𝑘−1
Se poate presupune că cea mai mică valoare a lui 𝑆𝑒 este zero, care apare atunci când
∑𝑛𝑖=1(𝑦𝑖 − 𝑦̂𝑖 )2 = 0, adică punctele observate se situează exact pe linia de regresie.
Dacă 𝑺𝒆 este mică, ajustarea este foarte bună, iar modelul de regresie poate fi utilizat ca
un instrument efectiv de analiză și previzionare.
Este însă dificil de evaluat modelul doar utilizând 𝑆𝑒 , deoarece 𝑆𝑒 nu are o limită superioară
predefinită. Cu toate acestea, 𝑺𝒆 este util în compararea modelelor. Dacă avem la dispoziție
câteva modele dintre care trebuie să alegem, cel mai potrivit a fi utilizat este cel pentru care
𝑆𝑒 este mai scăzut.
15
II. Determinarea și testarea semnificației raportului de corelație
Raportul de corelație este un indicator relativ, utilizat atât pentru măsurarea intensității
legăturii dintre variabile, cât și pentru validarea modelelor de regresie.
sau
Δ2𝑦/𝑥 Δ2𝑒
𝑅=√ = √1 −
Δ2𝑦 Δ2𝑦
Cu cât valoarea indicatorului este mai apropiată de 1, cu atât legătura dintre variabile este
mai puternică. Valori apropiate de 0 ne indică legături de intensitate slabă între variabile.
Raportul de corelație este nul dacă toate mediile condiționate, adică 𝑦̂𝑖 , sunt egale între
ele.
16
Testarea semnificației raportului de corelație se face utilizând statistica F:
𝑛−𝑘−1 𝑅2
𝐹= ∙
𝑘 1 − 𝑅2
Dacă 𝐹𝑐𝑎𝑙𝑐 > 𝐹𝛼;𝑘;𝑛−𝑘−1 se acceptă ipoteza conform căreia variabila X are o influență
semnificativă asupra variabilei rezultative Y.
2
Δ2𝑦/𝑥 Δ2𝑒 ∑𝑛𝑖=1(𝑦̂𝑖 − 𝑦̅)2
𝑅 = = 1− 2 = 𝑛
Δ2𝑦 Δ𝑦 ∑𝑖=1(𝑦𝑖 − 𝑦̅)2
sau
𝑆𝑆𝑅
𝑅2 = ∈ [0,1]
𝑆𝑆𝑇
Δ2𝑦/𝑥
Raportul reprezintă proporția variației totale, care este explicată de linia de regresie.
Δ2𝑦
Observații
În cazul în care toate valorile lui Y se află pe o dreaptă verticală, 𝑅 2 nu are nicio
semnificație și nu poate fi calculat.
17
Coeficientul de determinație nu este ajustat cu gradele de libertate. Dacă utilizăm estimatorii
̅ 𝟐 ):
nedeplasați 𝑆𝑦2 și 𝑆𝑒2 , obținem valoarea ajustată a coeficientului de determinație (𝑹
Δ2𝑒
𝑅̅ 2 = 1 − 𝑛 − 𝑘2 − 1
Δ𝑦
𝑛−1
De asemenea, raportul de corelație este potrivit a fi calculat atât în cazul legăturii de tip liniar,
cât și în cazul legăturilor neliniare, egalitatea
|𝑟| = 𝑅
fiind un test de liniaritate pentru model (unde r reprezintă coeficientul de corelație liniară
simplă la nivelul eșantionului).
18