Sunteți pe pagina 1din 17

1. Obiectul de studiu al econometriei.

Econometria - instrument metodologic de bază, indispensabil teoriei şi practicii economice


pentru investigarea riguroasă a fenomenelor şi proceselor economice.
Obiectul de studiu al econometriei este analiza fenomenelor si proceselor ec care se
realizeaza cu ajutorul modelelor.

2. Efectul multicoliniarităţii. Selecţia variabilelor exogene în model.


Multicoliniaritatea reflectă existenţa mai multor relaţii liniare între variabilele exogene.
Proceduri de selectie a variabilelor exogene sunt:
 toate regresiile posibile;
 eliminarea progresivă;
 selecţia progresivă;
 regresia pas cu pas;
 regresia pe faze.
Toate regresiile posibile - constă în efectuarea tuturor regresiilor posibile (𝟐𝐤 – 1), unde k
este numărul variabilelor explicative, candidate la intrarea în model. Se reţine acel model
care are 𝐑𝟐 cel mai mare şi toate variabilele explicative semnificative.
Dezavantajul este legat de numărul k, de variabile explicative, care cu cât este mai mare, cu
atât duce la realizarea unui număr considerabil de regresii (de exemplu: k=10, număr
regresii posibile = 1023).
Eliminarea progresivă (Backward Elimination) - constă în efectuarea regresiei cu toate
variabilele explicative şi apoi eliminarea pe rând, a acelora a căror nivel al probabilității
statisticii Student este mai mare decât valoarea critică (α=0,05). Procedura se utilizează,
numai dacă se poate estima efectiv, modelul iniţial, ceea ce nu este mereu posibil. Modelul
poate avea un număr mare de variabile explicative, şi atunci, riscul multicoliniarităţii este
mare, iar matricea poate fi singulară.
Selecţia progresivă (Forward Regression) - se parcurge un sens invers celui descris în
eliminarea progresivă:
 în prima etapă, se selectează în model o variabilă xi, care are coeficientul de corelaţie
simplă cu variabila y, cel mai mare;
 în a doua etapă, se calculează coeficienţii de determinaţie parţială 𝐫 𝟐 yxj.xi pentru j ≠i
şi se reţine acea variabilă xj, care are cel mai mare coeficient de corelaţie parţială.
Selecţia variabilelor se opreşte când probabilității statisticii Student este mai mare decât
valoarea critică (α=0,05).
Regresia pas cu pas (Stepwise regression) - este identică cu cea precedentă, a selecției
progresive, doar că înainte de a incorpora o nouă variabilă explicativă se examinează
probabilitățile statisticii Student a fiecăreia din variabilele explicative selecționate în
prealabil și se elimină din model cele care au probabilitățile statisticii Student mai mari decât
valoarea critică!
3. Prezentaţi deosebirea între econometrie şi ştiinţele matematice.
Econometrie sa format si se dezvolta nu in urma unui proces de diversificare a stiintelor
economice, ci prin integrarea intre teorie economica, statistica si matematica.
4. Autocorelare erorilor. Esenţa ipotezei.
In cazul existentei fenomenului de autocorelare a erorilor de gradul 1 se presupune ca intre
erori exista o relatie de tipul:  t  t 1  ut , cu ut ~ N (0,  u2 )
5. Noţiuni şi concepte fundamentale ale econometriei.
Metoda modelelor sau metoda modelarii reprezinta principalul instrument de investigare
econometrica a fenomenelor econometrice.
Modelul reprezinta un instrument de cercetare stiintifica ,o imagine
conventionala,homomorfa,simplificata a obiectului supus cercetarii.
Reprezentarile econometrice au intotdeauna o finalitate practica,operationala, ele devenind
instrumente de conrol si dirijare,de simulare si de previziune a fenomenelor economice.
Variabilele care formeaza structura unui sistem econometric,dupa natura lor pot fi: var.
economice(endogene,exogene), var. eroare(aleatoare)-prezinta abaterea intre realitatea
economica si realitatea simulata prin prisma modelului,,var. timp(variabila explicativa a
fenomenului endogen).
Sursa de date: variabilele economice se introduc într-un model econometric cu valorile lor
reale/empirice (yi = y1, y2,…, yn; xij = x1j, x2j,…, xnm; n = numărul unităţilor observate;
m=numărul variabilelor exogene).

6. Tipologia modelelor econometrice. Caracteristica generală a acestora.-


Tipologia modelelor econometrice:
 după numărul factorilor luaţi în considerare
 modele unifactoriale: se fundamentează pe ipoteza că în rândul factorilor de
influenţă ai variabilei rezultative y există un factor determinant x, ceilalţi factori
cu excepţia acestuia având o influenţă întâmplătoare (exprimată prin
intermediul variabilei reziduale u) sau fiind invariabili în perioada analizată
y = f(x)+u
 modele multifactoriale: elimină deficienţa modelului unifactorial, însă trebuie
ca numărul factorilor luaţi în considerare să nu fie foarte mare pentru a nu fi
mult prea complex, dificil de estimat etc.
y = f(x1,x2,...,xp)+u
 după forma legăturii dintre variabila rezultativă şi variabilele cauză
 modele liniare: dacă legătura este liniară
 modele neliniare: dacă legătura este neliniară
 după includerea factorului timp în model
 modele statice: dependenţa variabilei endogene y faţă de valorile variabilei exogene xj
se realizează în aceeaşi perioadă de timp:
y = f(x1t,...,xjt,...,xkt) + ut
 modele dinamice:
• introducerea variabilei timp ca o variabilă explicativă y = f(xt,t) + ut
• autoregresive: variabila rezultativă cu valori decalate este una din variabilele
explicative y = f(xt,yt-k) + ut
• model cu decalaj: variabila explicativă x îşi exercită influenţa asupra variaţiei
variabilei rezultative pe mai multe perioade de timp: y = f(xt,xt-1,... xt-k) + ut
 după numărul de ecuaţii din model
 modele cu o singură ecuaţie
 modele cu ecuaţii multiple: sunt formate dintr-un sistem de ecuaţii

7. Teoria corelaţiei. Testarea semnificaţiei indicatorilor de corelaţie.


Metoda corelaţiei oferă o măsură sintetică a legăturilor dintre variabilele statistice.
Indicatorii calculaţi sunt:
 covarianţa,
 coeficientul de corelaţie ,
 raportul de corelaţie.
Covarianţa :
 Indicatorul ia valori pozitive dacă legătura dintre variabile este directă şi valori
negative în caz contrar.
 Valori apropiate de zero semnifică lipsa oricărei legături între x şi y; valori ridicate ale
indicatorului arată o legătură puternică.
Coeficientul de corelaţie simplă măsoară intensitatea legăturilor liniare dintre două variabile.
Coeficientul de corelaţie ia valori cuprinse între -1 şi 1.
Semnul algebric al indicatorului prezintă sensul legăturii:
 pozitiv - legătură directă,
 negativ - legătură inversă.
Atunci când coeficientul ia valoarea zero, cele două nu sunt corelate liniar.
Valorile intermediare ale indicatorului (între 0 şi ±1) corespund unor intensităţi diferite ale
corelaţiei, mergând de la o legătură slabă (sub 0,5) până la o legătură puternică (peste 0,75)
Raportul de corelație poate lua valori între zero și +1.
Dacă R y/x = r y/x , se confirmă ipoteza legăturii liniare.

8. Caracterizaţi relaţiile ce apar în cadrul modelelor econometrice.


Relaţiile statistice pe care se bazează modelul econometric:
 relaţii de identitate sau deterministe: sunt formulări logice cu privire la procesul economic
descris (exemplu: VN=VB - I );
 relaţii de comportament: au în vedere modificările tradiţiilor, atitudinilor, înclinaţiilor
(sub raportul satisfacţie/efort) (exemplu: C = a + bV );
 relaţii tehnologice: restricţiile impuse output-urilor în raport cu input-urile (exemplu:
funcţia Cobb Douglas: Q = IL1-, 01);
 relaţii instituţionale: conform unor reglementări impuse de lege (exemplu:amortizarea,
impozitul pe venit etc.).

9. Testarea semnificaţiei parametrilor de regresie a modelului liniar simplu.


Testarea parametrilor unui model de regresie se realizează cu ajutorul testului t Student.
Formularea ipotezelor: Ho: a=0 H0: b=0
H1: a≠0 H1: b ≠ 0
Estimatorii sunt semnificativ diferiţi de zero, cu un prag de semnificaţie α , dacă se verifică
următoarele relaţii:
|𝒂
̂| ̂|
|𝒃
𝒕𝒂̂ = > 𝒕∝,𝜸 𝒕𝒃̂ = > 𝒕∝,𝜸 𝜸 = 𝒏 − 𝟐 (𝒏𝒓. 𝒈𝒓𝒂𝒅𝒆 𝒍𝒊𝒃𝒆𝒓𝒕𝒂𝒕𝒆),
𝑺𝒃̂
𝑺𝒂̂
Când modelarea econometrică este realizată cu suportul softurilor specializate ) decizia
poate fi luată şi în baza valorii Sig., astfel:

• Sig. > α : se acceptă ipoteza H0,


• Sig. < α: se respinge ipoteza H0, cu o probabilitate de 95%.

10.Modelul econometric general de tip clasic. Testarea semnificaţiei parametrilor de


regresie.
Scopul regresiei multiple este de a evidenţia relaţia dintre o variabilă dependentă (explicată,
endogenă, rezultativă) şi o mulţime de variabile independente (explicative, factoriale,
exogene, predictori). Prin utilizarea regresiei multiple se încearcă, adesea, obţinerea
răspunsului la una dintre întrebările:
“care este cea mai bună predicţie pentru …?”,
“cine este cel mai bun predictor pentru …?” .

Y = a0 + a1X1 + a2X2 + ... + ak Xk + e


unde:
 Y este variabila endogenă,
 X1, X2, …, Xk sunt k variabile explicative,
 a0, a1, a2, …, ak sunt k+1 parametri necunoscuți,
 e este variabila de abatere (eroarea) din ecuația de regresie.

Eroarea e reflectă, la fel ca în modelul linear unifactorial, influența elementelor calitative


necuantificabile, a celor care depind de comportamentul uman nepredictibil, sau a altor
factori cu influență minoră, alții decât X1, X2, …, Xk.
Parametrul a0 modelează comportamentul autonom al variabilei endogene, iar parametrii ai
cuantifică intensitatea influenței factorului Xi asupra variabilei Y.

Algoritmul urmat în testarea semnificației estimatorilor pentru modelul multifactorial de


regresie lineara este următorul:
 se formulează ipoteza nula H0: âi = 0 și ipoteza alternativa H1: âi ≠ 0, pentru i = 0, 1,
…, k.
̂
𝒂
 se calculează statistica: 𝒕𝒂𝒊 = 𝒊
𝑺𝒂̂𝒊
sub ipoteza nulă, statistica respectivă urmează o distribuție Student cu n - k - 1 grade de
libertate, unde n este volumul eșantionului si k reprezintă numărul variabilelor exogene din
model.
Regula de decizie - identică modelului liniar simplu.

Utilizând repartiţia statisticilor ti, definite la testarea semnificaţiei parametrilor, se


demonstrează că intervalul de încredere pentru parametrul αi, i = 1, 2, …, k, este dat la
pragul de încredere , de relaţia:
𝒂𝒊 − 𝒕∝⁄ ,𝒏−𝒌 𝑺(𝒂𝒊 ) ≤ 𝒂𝒊 ≤ 𝒂𝒊 + 𝒕∝⁄ ,𝒏−𝒌 𝑺(𝒂𝒊 )
𝟐 𝟐

11.Teoria corelaţiei. Prezentaţi şi caracterizaţi indicatorii corelaţiei.


Metoda corelatiei ofera o masura sintetica a legaturilor dintre variabilele statistice.
Indicatorii calculati sunt:covarianta; coeficientul de corelatie; raporul de corelatie.

1)Covarianta: Indicatorul ia valori pozitive daca legatura


dintre variabile este directa,si negative in caz contrar.Valorile apropiate de zero semnifica
lipsa oricarei legatur intre x si y.
2)Coeficientul de corelatie simpla masoara intesitatea legaturilor liniare dintre 2 variabile.
Coef.ia valori intre -1 si 1.Semnul agebric al indicatorului;pozitiv-leg.directa....negativ-
leg.inversa.Cind coef.ia valoarea zero ,cele doua nu sunt corelate liniar.
Pentru verificarea semnificatiei coef.de corelatie se utilizeaza testul t-Student.Ipotezele
cercetate sunt:
Ho: r y / x =0 H1: r y / x ≠0
Coef.de corelatie este semnificativ daca t calc >=t alfa ,n-2 ,alfa=0.05
3)Raportul de corelatie:Poate lua valori intre zero si +1.
Daca Ry/x= ry/x,se confirma ipoteza legaturii liniare.

12.Verificarea completitudinii datelor in seriile selectate.


se poate verifica regula celor trei sigma care constă în verificarea următoarelor relaţii:
̅+3𝝈 𝒙 )
𝒙𝒊 ∈ (𝒙 𝒚𝒊 ∈ (𝒚 ̅+3𝝈 𝒚 )
13.
14. Utilizarea Testul Jaque-Berra.
 Testul Jarque-Bera (verificarea normalitatii erorilor)
Testul Jarque - Bera se calculează după relaţia:
unde: S = 0 pentru o repartiţie normală,
S > 0 pentru o repartiţie asimetrică la dreapta,
S < 0 pentru o repartiţie asimetrică la stânga;
Ipoteze: H0 : 𝜀 ~𝑁(0, 𝜎𝑒 2 ),(Erorile sunt normal distribuite);
H1: 𝜀 ~𝑁(0, 𝜎𝑒 2 ) ,(Erorile nu sunt normal distribuite);

Concluzie: Probabilitatea (JB) 1,20 > 0,05 astfel se acceptă ipoteza H0, erorile sunt
distribuite normal la un nivel de semnificatie de 5 %.

15.Metode şi procedee de depistarea a autocorelării. Testul Durbin-Watson


Testul Durbin Watson (DW)
H0:  = 0 (nu există autocorelare a erorilor);
H1:   0 (ipoteza este încălcată, există o legătură între erori).
În cazul existenţei fenomenului de autocorelare a erorilor se presupune că între erori există o
relaţie de tipul:  i  i 1  ui , cu ui ~ N (0,  u2 )
Valoarea calculată a testului DW se compară cu dL (limita inferioară) şi dU (limita
superioară), citite din tabelul Durbin –Watson la pragului de semnificaţie α şi volumul
eşantionului n.
Decizia se ia în funcţie de următoarele regiuni:
- regiune de respingere:
ρ>0 erorile înregistrează o autocorelare pozitivă;
ρ <0 erorile înregistrează o autocorelare negativă;
- regiune de acceptare a ipotezei nule:
(du ; 4- du) erorile nu sunt autocorelate;
- regiune de nedeterminare:
(dL ; dU) şi (4-du ; 4-dL), dacă valoarea statisticii Durbin-Watson cade în această regiune, nu
se poate decide asupra existenţei autocorelării erorilor.
Testul Durbin-Watson se recomandă pentru eşantioane de volum mare n˃15 şi este folosit în
mod curent pentru analiza seriilor de timp.
16.Procedee de eliminare a fenomenului de autocorelare a erorilor.
Rezolvarea autocorelarii se face cu metoda Cochrane orcutt
Se verifica sezonalitatea, stationaritatea
17.Modelul econometric general de tip clasic. Estimarea parametrilor de regresie metoda
matricială.
 Estimarea parametrilor de regresie se realizează cu ajutorul M.CM.M.P. .
Cea mai simplă modalitate de prezentare este prin prisma calculului matricial în baza
funcției: 𝒀 = 𝑿𝑨 ̂ +ε
Unde:
– Y este un vector coloana, de dimensiuni n × 1, care are drept componente cele n
înregistrări ale variabilei explicate (endogene),
– X este o matrice de dimensiuni n × (k+1), care conține în prima coloana (atașată
termenului liber) constanta 1, iar în celelalte k coloane înregistrările pentru fiecare dintre cele
k variabile explicative;
– A este un vector coloana, de dimensiuni (k+1) × 1, care include cei k+1 parametri ai
modelului;
– e este un vector coloana, de dimensiuni n × 1, care include cele n valori ale variabilei de
abatere (erorile din ecuația de regresie).

̂ = (𝑿, 𝒀)
(𝑿, 𝑿)𝑨
Dacă vectorii atașați fiecărei variabile explicative Xi sunt linear independenți, atunci
matricea X'X nu este singulară și sistemul poate fi rezolvat în raport cu vectorul
estimatorilor Â:
 = (X'X)-1 X'Y

18.Analiza varianţei. Prezentarea grafică.


Varianta unei distribuţii arată cât de "împrăştiate" sunt scorurile în jurul valorii centrale, care
este gradul de variabilitate în grupul nostru de rezultate. Să vedem etapele calculării
variantei. Vom utiliza ca exemplu nişte date culese de la o companie care are 10
departamente. Scorurile prezentate mai jos arată câte persoane lucrează în fiecare
departament în parte:
2, 8, 12, 10, 20, 3, 7, 14, 6, 18
Să vedem care sunt etapele de calcul ale variantei.
• calcularea mediei
In primul rând avem nevoie de cunoaşterea mediei. Ea se obţine pe calea obişnuită,
împărţind suma scorurilor la numărul lor. în cazul nostru, media este m=10. •
19.Modelul econometric liniar simplu. ANOVA
Elementele de calcul şi valoarea raportului F se pot obţine facil cu ajutorul programelor
statistice, rezultatele fiind prezentate în Tabelul ANOVA, şi anume:
 estimaţiile celor două componente ale variaţiei,
 gradele de libertate corespunzătoare,
 estimaţiile varianţelor, explicată şi reziduală,
 valoarea calculată a raportului Fisher şi
 semnificaţia testului, Sig.
 Valoarea teoretică a testului F se citeşte din tabelul Fisher, şi anume 𝑭∝,𝜸𝟏,𝜸𝟐 ,
unde γ1=k – 1 şi γ2=n – k grade de libertate şi un nivel de semnificaţie α .
 Decizia. Dacă F ˃𝑭∝,𝜸𝟏,𝜸𝟐 , se respinge 𝑯𝟎 şi se trage concluzia că între variabilele
cercetate există o legătură semnificativă, deci modelul este corect specificat (valid),
cu un risc acceptat de 5%.
Sau în baza nivelului Sig. :
dacă valoarea Sig. corespunzătoare statisticii F este mică (mai mică decât 0,01), atunci
variabila independentă explică variaţia variabilei dependente şi invers, deci relaţia liniară
dintre cele două variabile considerate este semnificativă .

20. Verificarea modelului econometric multifactorial prin analiza ANOVA.


Previziunea cu ajutorul modelului liniar simplu ( punctiformă)

 Verificarea semnificaţiei modelului econometric multifactorial se face cu ajutorul


metodei analizei dispersionale sau a variaţiei (ANOVA) şi a testului Fisher-Snedecor (F).
Metoda se aplică în aceeaşi manieră ca şi în cazul modelului unifactorial, unde k
reprezintă numărul variabilelor exogene .
 De asemenea, testarea semnificaţiei raportului de corelaţie se face după aceleaşi
principii ca şi în cazul modelului unifactorial.
În cazul unui model multifactorial, dacă se cunosc valorile variabilelor factoriale Xj pentru
momentul (n+v), prognoza variabilei endogene se realizează pe baza unui interval de
încredere, deoarece Y este o variabilă aleatoare normală de medie şi de abatere medie
pătratică
21. Estimarea parametrilor de regresie a modelului liniar simplu.
 Metoda celor mai mici pătrate (MCMMP):
Dacă forma generală a modelului este definită de relația:
𝒚𝒊 = 𝒂 + 𝒃𝒙𝒊 + 𝒆𝒊
Estimarea parametrilor modelului de regresie se bazează pe criteriul minimizării sumei
pătratelor abaterilor între valorile observate, yi , şi valorile teoretice, 𝒚̂𝒊 :
̂𝒃
F(𝒂, ̂) = 𝒎𝒊𝒏∑(𝒚𝒊 − 𝒚 ̂ 𝒊 )𝟐
Condiția de minim a acestei funcții rezultă din:

În cazul dreptei de regresie, 𝒚 ̂ =𝒂 ̂+𝒃 ̂𝒙 , construită pe baza unui eşantion observat,


estimaţiile 𝒂 ̂ ale parametrilor 𝒂 şi 𝒃 se pot calcula după relaţiile:
̂ şi 𝒃
𝒏 ∑ 𝒙𝒊 𝒚𝒊 − ∑ 𝒙𝒊 ∑ 𝒚𝒊
̂=
𝒃 𝟐 𝟐
𝒏 ∑ 𝒙𝒊 − (∑ 𝒙𝒊 )
̂=𝒚
𝒂 ̅−𝒃 ̂𝒙̅

22.Multicoliniaritatea. Esenţa şi consecinţele multicoliniarităţii.


Multicoliniaritatea reflectă existenţa mai multor relaţii liniare între variabilele exogene.
Una din ipotezele fundamentale a modelului liniar clasic de regresie este ca: nu exista
multicoliniaritate printer variabilele explicative incluse in model, altfel spus seriile x1 si x2
sunt ortogonale si independente.
Determinarea estimatorilor prin metoda celor mai mici pătrate implică aplicarea formulei de
calcul: Â = (X'X)-1 X'Y adică, presupune utilizarea matricei inverse (X'X)-1 .
Dar, daca între doi vectori ai matricei X exista o relație de dependenta lineara, atunci
(X'X) este nesingulară astfel (determinantul matricei este zero) și, în consecință, matricea
(X'X)-1 nu există.
 intervalele de încredere, care sunt determinate în baza unui nivel de semnificație
prestabilit, ale parametrilor modelului de regresie sunt foarte mari, ceea ce duce la
scăderea preciziei estimatorilor;
 statistica t (Student) tinde sa înregistreze valori reduse astfel crește incidența acceptării
ipotezei H0;
 un coeficient mare de determinaţie 𝑹𝟐 , dar statisticile t nesemnificative;
 instabilitatea estimatorilor şi a abaterilor lor standard la mici schimbări ale datelor.
De menționat: în cazul a două variabile explicative, intercorelaţia lor se măsoară cu
ajutorul coeficientui de corelaţie liniar simplu (r); în cazul mai multor variabile
explicative, intercorelaţia se măsoră cu ajutorul coeficienţilor de corelaţie parţială sau
prin coeficientul de corelaţie multiplă R între variabila y şi variabilele xi.

23.Demersul econometric.
Modelarea econometrică se poate rezuma sintetic la parcurgerea următoarelor
etape:
• formularea problemei în termeni economici, pornind de la o teorie sau o
problemă economică;
• identificarea variabilelor care instrumentează problema;
• identificarea tipului si formei legăturii dintre variabile, după o analiză atentă a
fenomenului real si a teoriei economice;
• propunerea unuia sau a mai multor modele care explică realitatea studiată prin
relatii de dependentă între variabile;
• estimarea parametrilor modelului sau modelelor propuse, pe baza metodelor
statistice cunoscute;
• testarea modelului sau modelelor si alegerea celui mai bun model;
• aplicarea în practică sau realizarea de predictii pe seama modelului.

24.Teoria corelaţiei. Testarea semnificaţiei indicatorilor de corelaţie.


Metoda corelaţiei oferă o măsură sintetică a legăturilor dintre variabilele statistice.
Indicatorii calculaţi sunt:
 covarianţa,
 coeficientul de corelaţie ,
 raportul de corelaţie.

 Covarianţa :
 Indicatorul ia valori pozitive dacă legătura dintre variabile este directă şi valori
negative în caz contrar.

 Valori apropiate de zero semnifică lipsa oricărei legături între x şi y; valori ridicate ale
indicatorului arată o legătură puternică.

Coeficientul de corelaţie simplă măsoară intensitatea legăturilor liniare dintre două variabile.
 Coeficientul de corelaţie ia valori cuprinse între -1 şi 1.
 Semnul algebric al indicatorului prezintă sensul legăturii:
 pozitiv - legătură directă,
 negativ - legătură inversă.
 Atunci când coeficientul ia valoarea zero, cele două nu sunt corelate liniar.
 Valorile intermediare ale indicatorului (între 0 şi ±1) corespund unor intensităţi
diferite ale corelaţiei, mergând de la o legătură slabă (sub 0,5) până la o legătură
puternică (peste 0,75).

Raportul de corelație: Unde Yxi reprezintă valorile ajustate indiferent de modelul de


regresie selectat. Raportul de corelație poate lua valori între zero și +1.

25.Verificarea normalităţii distribuţiei utilizând procedeul grafic.


 Diagrama de dispersie a reziduurilor
Diagrama de dispersie a reziduurilor se construieşte considerând pe ordonată valori ale
variabilei reziduale 𝜺𝒊 , iar pe abscisă valori estimate ale variabilei dependente 𝒚̂𝒊 .
Se știe că dacă erorile urmează legea normală de medie zero și de abatere medie pătratică
𝝈𝒆 𝟐 atunci are loc relația: 𝑷(|𝒆̂𝒊 | ≤ 𝒕∝ 𝑺𝒆 ) = 𝟏−∝
ce va fi folosită pentru acceptarea ipotezei cercetate la nivelul de semnificație ∝.

26.Heteroscedasticitatea. Esenţa ipotezei.


Presupunând că erorile sunt normal distribuite, atunci raportul F* urmează o distribuţie F cu
(𝒏−𝒄)
𝜸𝟏 = 𝜸𝟐 = - (𝒌 + 𝟏) grade de libertate.
𝟐
 dacă 𝑭∗ > 𝑭∝;(𝒏−𝒄)(𝒌+𝟏);;(𝒏−𝒄)(𝒌+𝟏) , ipoteza de homoscedasticitate este infirmată, erorile
𝟐 𝟐
sunt heteroscedastice;
 dacă 𝑭∗ <𝑭∝;(𝒏−𝒄)(𝒌+𝟏);;(𝒏−𝒄)(𝒌+𝟏) , ipoteza de homoscedasticitate este acceptată.
𝟐 𝟐

27.Testul Fischer-Snedecor folosit la testarea validităţii modelului de regresie estimat.


Există două variante de aplicare a testului White:
 utilizarea testului Fisher –Snedecor clasic, bazat pe ipoteza nulităţii parametrilor,
respectiv: 𝑯𝟎 : 𝒂𝟎 = 𝒂𝟏 = 𝒂𝟐 =0
Dacă ipoteza nulă, potrivit căreia rezultatele estimării sunt nesemnificative ( 𝑭𝒄 < 𝑭∝;𝜸𝟏;𝜸𝟐 ),
este acceptată, atunci ipoteza de homoscedasticitate se verifică, cazul contrar semnificând
prezenţa heteroscedasticităţii erorilor.

28.Ipoteze fundamentale ale modelului de regresie.


 Estimatorii obținuți prin MCMMP sunt estimatori de maximă verosimilitate dacă pot
fi acceptate următoarele ipoteze:
 Variabilele observate nu sunt afectate de erori de măsurare;
 Liniaritatea modelului. Relaţia între Y şi X este liniară. Această ipoteză este necesară
pentru estimarea parametrilor modelului;
 Normalitatea erorilor. Variabila reziduală este distribuită normal: 𝜺 ≡ 𝑵(𝟎, 𝝈𝒆 𝟐 );
 Homoscedasticitatea. Varianţele V(𝜺) sunt constante, oricare ar fi valorile variabilei X,
adică, 𝑽(𝜺) = 𝝈𝟐 ;
 Necorelarea erorilor. Erorile sunt necorelate între ele: 𝒄𝒐𝒗(𝜺𝒊 , 𝜺𝒋 ) = 𝟎;
 Independenţa erorilor de valorile variabilei X. Valorile variabilei sunt independente
de valorile variabilei explicative X, adică 𝒄𝒐𝒗(𝜺, 𝒙) = 𝟎.
29.Modelul econometric general de tip clasic. Prezentarea generală. Exemple concrete de
modele.
1. Modelul inspirat de teoria lui M. Keynes de determinare a veniturilor la nivel
macroeconomic:
Consum = a0 + a1 Venituri + u
Venituri = Consum + Investiții + Cheltuieli guvernamentale + Sold comerț exterior
Observații:
Acest model conține o ecuație de regresie şi o identitate. Veniturile apar în dublă
ipostază: de factor în prima ecuație şi de efect în cea de a doua. Consumul este pe post de
efect în prima ecuație şi de componentă factorială în cea de a doua. Venitul şi consumul
se influențează reciproc, evoluând
împreună, simultan. O creştere a venitului conduce la modificarea consumului, iar
creşterea consumului face ca veniturile să crească.
Înlocuind în a doua ecuație consumul cu expresia sa din prima ecuație, se obține o formă
redusă a reprezentării:
Venituri = (a0 + a1 Venituri + u) + Investiții + Cheltuieli guvernamentale + Sold comerț
exterior
Dacă se izolează variabila Venit, se obține:
VEN = (1/1-a1)*(a0+ INV+CG+Sold Cex)
Raportul (1/1-a1) se numește în teoria economică multiplicatorul veniturilor, propus de
Keynes.
2. Modelul echilibrării prețului şi ofertei pe piața produselor cu ciclu lung de fabricație
Un astfel de proces poate începe cu situaŃia în care oferta este mică (qt = 2), ceea ce
face ca prețul să fie mare (pt = 10); prețul determină producătorii să realizeze şi să ofere o
cantitate mult mai mare (qt+1 = 12). Cererea fiind depăşită, prețul scade mult (pt+1 = 4).
Scăderea prețului descurajează producătorii, astfel încât qt+2 = 6; ceea ce face ca prețul
să crească, devenind pt+2 = 7, etc.
Un nivel de echilibru se va situa în jurul valorilor p = 5,5; q = 7.
Modelul care descrie un astfel de proces este următorul:
pt = a0 + a1qt + u1
qt = b0 + b1pt-1 + u2
Prețul şi cantitatea sunt interdependente, dar existența întârzierii conferă modelului un
caracterdinamic.
Dacă se înlocuieşte în prima ecuaŃie cantitatea cu expresia sa, rezultă:
pt = a0 + a1( b0 + b1pt-1 + u2 ) + u1 = α0 + α1pt-1 + v1
ceea ce reduce influențele în sensul evidențierii unui singur factor pt-1.
Aceste modele cu ecuații multiple evidențiază unele aspecte caracteristice:
a) Descriu economia ca o structură de componente şi de relații între componente (relații
de dependență, relații de identitate sau de echilibru) prin forma structurală a modelului.
b) Variabila-efect într-o ecuație poate fi variabilă factorială întro altă ecuație şi invers, fapt
pentru care este preferată denumirea de variabile endogene şi variabile exogene (sau
predeterminante dacăîntre factori există şi variabile cu efect întârziat). Variabila endogenă
apare într-o ecuație în stânga egalității, ceea ce face posibilă obținerea de valori generate de
model pentru o astfel de variabilă; cele exogene apar numai în dreapta egalităților, iar datele
pentru ele provin exclusiv din surse externe (statistici, evidențe). Modelul include atâtea
ecuații câte variabile endogene are în vedere.
c) Adesea se caută obținerea unei forme reduse a modelului, ca urmare a înlocuirii acelor
variabile endogene care apar în postura de factori, cu expresiile lor.
d) Variabila endogenă aflată în postura de efect (rezultat) într-o ecuație de regresie care
apare şi în postura de factor în alte ecuații implică dependența unui astfel de factor de
variabila reziduală. În consecință, metoda de estimare trebuie adaptată în aşa fel încât
ipoteza independenței factorului de variabila reziduală să fie confirmată.
e) Existența de interdependențe între variabile, manifestată sub forma unor bucle de
conexiune inversă atrage problema identificării fiecărei ecuații.

30.Metode de atenuare şi eliminare a multicoliniarităţii. Selecţia variabilelor exogene în


model.
Daca estimatorii calculați pentru parametrii modelului sunt semnificativi din punct de vedere
statistic, sensul și intensitatea influentei sunt în concordanta cu teoria economica, atunci
eventuala prezență a fenomenului de multicoliniaritate poate fi neglijată.
Dacă însă, influențele asupra calității estimatorilor sunt negative, atunci există mai multe
soluții pentru eliminarea multicolinearității.

a) Eliminarea unor variabile explicative. Selectarea variabilei care va fi eliminată se face fie
prin analiza teoretica (economica), fie pornind de la testele statistice de semnificație. În
ultima situație, se elimină variabila pentru care valoarea testului t este mică, sau variabila
pentru care corelația cu Y este mai slabă.

b) Realizarea unor observații suplimentare asupra variabilelor din model (se mărește volumul
eșantionului). Daca este posibilă mărirea eșantionului, atunci crește precizia estimatorilor și
se reduce efectul negativ al multicoliniarității.

c) Prelucrarea primara a datelor (calculul ritmurilor de modificare, a sporurilor, indicilor,


logaritmarea valorilor observate).
Este posibil, de exemplu în cazul seriilor de timp, ca anumite variabile economice sa
evolueze pe traiectorii asemănătoare, fără ca între acestea sa existe o legătură directă.
Astfel, în medii economice puternic inflaționiste, variabilele au în timp valori crescătoare
dacă sunt exprimate nominal, chiar dacă, în prețuri constante, tendința reală este de scădere.
În aceste condiții, evitarea multicolinearității indusă artificial se poate realiza prin includerea
în model a ritmurilor (sau a indicilor) de modificare a variabilelor respective.

d)Regresia ridge.
Este o tehnică mecanică, arbitrară, care constă în transformarea matricei (X'X) astfel încât
determinantul matricei obținute să fie diferit de zero. De exemplu, se adaugă un număr
fiecărui element de pe diagonala principală a matricei (X'X), astfel încât în aplicarea
procedurii de estimare a parametrilor modelului se folosește matricea (X'X+cIk+1,k+1),
unde c este o constantă, iar I este matricea unitate.
Chiar daca în acest mod calitatea statistică a estimării poate fi îmbunătățită, principalul
inconvenient constă în dificultatea interpretării economice a rezultatelor obținute.

31.Modalităţi de atenuare a multicoliniaritaţii.


Daca estimatorii calculați pentru parametrii modelului sunt semnificativi din punct de vedere
statistic, sensul și intensitatea influentei sunt în concordanta cu teoria economica, atunci
eventuala prezență a fenomenului de multicoliniaritate poate fi neglijată.
Dacă însă, influențele asupra calității estimatorilor sunt negative, atunci există mai multe
soluții pentru eliminarea multicolinearității.

a) Eliminarea unor variabile explicative. Selectarea variabilei care va fi eliminată se face fie
prin analiza teoretica (economica), fie pornind de la testele statistice de semnificație. În
ultima situație, se elimină variabila pentru care valoarea testului t este mică, sau variabila
pentru care corelația cu Y este mai slabă.

b) Realizarea unor observații suplimentare asupra variabilelor din model (se mărește volumul
eșantionului). Daca este posibilă mărirea eșantionului, atunci crește precizia estimatorilor și
se reduce efectul negativ al multicoliniarității.

c) Prelucrarea primara a datelor (calculul ritmurilor de modificare, a sporurilor, indicilor,


logaritmarea valorilor observate).
Este posibil, de exemplu în cazul seriilor de timp, ca anumite variabile economice sa
evolueze pe traiectorii asemănătoare, fără ca între acestea sa existe o legătură directă.
Astfel, în medii economice puternic inflaționiste, variabilele au în timp valori crescătoare
dacă sunt exprimate nominal, chiar dacă, în prețuri constante, tendința reală este de scădere.
În aceste condiții, evitarea multicolinearității indusă artificial se poate realiza prin includerea
în model a ritmurilor (sau a indicilor) de modificare a variabilelor respective.

d)Regresia ridge.
Este o tehnică mecanică, arbitrară, care constă în transformarea matricei (X'X) astfel încât
determinantul matricei obținute să fie diferit de zero.
De exemplu, se adaugă un număr fiecărui element de pe diagonala principală a matricei
(X'X), astfel încât în aplicarea procedurii de estimare a parametrilor modelului se folosește
matricea (X'X+cIk+1,k+1), unde c este o constantă, iar I este matricea unitate.
Chiar daca în acest mod calitatea statistică a estimării poate fi îmbunătățită, principalul
inconvenient constă în dificultatea
interpretării economice a rezultatelor obținute.

32.Autocorelare erorilor. Esenţa ipotezei.


Verificarea existenței sau inexistenței autocorelării erorilor (abaterilor sau valorilor
reziduale) se poate obține prin testul DW (Durbin-Watson). Este necesară îndeplinirea
următoarelor condiții:
Modelul să aibă termen constant (liber);
Numărul de observații să fie mai mare de 15;
Variabila de explicat să nu figureze printre variabilele explicative;
Pentru seriile de date observate în mod instantaneu, acestea trebuie să fie ordonate după
variabila de explicat.
DW = Ƹ(ut-ut-1)^2/ Ƹut2 , ut sunt reziduurile rezultate în urma estimării modelului. Variază de
la 0 la 4.
Această valoare empirică DW se compară cu două valori teoretice d1 și d2, preluate din
tabelul de distribuție Durbin-Watson. În funcție de un parg de semnificație α și de numărul
de variabile exogene k și de valorile observate n. Când d 1<DW<d2 se manifestă o îndoială
asupra existenței sau lipsei de autocorelație (indecizie).

33.Testarea normalităţii distribuirii erorilor, procedeu grafic.


Procedeul grafic consta in construirea corelogramei privind valorile variabilei factoriale
x si ale variabilei reziduale Ɛ.

34. Variabile calitative (dummy)- concept


Într-un model econometric, de regula, atât variabilele endogene, cat si variabilele exogene
sunt variabile economice cuantificabile, exprimate în unități de măsură specifice naturii lor.
Dar, în anumite situații, ambele grupe de variabile, endogene si exogene, pot fi de natura
calitativa (nenumerice), variantele lor prezentându-se prin cuvinte și nu prin numere.
Variabilele calitative sau variabilele dummy se referă la însușiri, calități, categorii etc. a
căror dimensiune este exprimată prin atribute sau denumiri.
 se realizează prin intermediul unei variabile numerice reprezentative (variabilă-
reprezentant) cu care variabila analizată este într-o corelație puternică.

35. Exprimarea numerică a variabilelor dichotomice


 Variabilele care pot fi prezentate sub două aspecte care se exclud reciproc privind:
existența – non-existența, acceptarea – refuzul, urban - rural, etc.
acest fapt face posibil transformarea în spațiul numeric binar a alternativelor existente.
Model unifactorial unde variabila exogenă este binară:
Spre exemplu, in modelul liniar
y = a0 + a1x +e unde:
y - câștigurile salariale medii orare
x – situația matrimonială: 1- căsătorit, 0- necăsătorit

b) Model multifactorial unde variabilele exogene sunt binare:


Y = a0 + a1X1 + a2X2 + ... + ak Xk + e unde:
X1 - profit net la o acțiune ordinară, unde 1 profit>0
X2 – activitatea desfășurată, unde 1 – activitate din domeniul alimentar
Y – profit net

c) Modelul include un factor calitativ și un factor numeric, spre exemplu:


X1 - profit net la o acțiune ordinară, unde 1 profit>0
X3 – număr angajați
Y – profit net

d) Variabila endogenă e de natură binară:


Spre exemplu, in modelul liniar
y = a0 + a1x +e unde:
y – înzestrarea familiei cu autoturism, 1 – da, 0 -nu
x - venitul

36. Exprimarea numerică a variabilelor polichotomice


În situația în care variabila calitativă prezintă mai mult decât două alternative, acestora li se
atribuie numere de ordin în raport cu apartenența la o stare sau alta.
a) Variabila calitativă prezintă o diversitate de stări, fără a implica o ordonare a acestora
în raport cu intensitatea.
Astfel de variabile sunt: naționalitatea, religia, rasa, etc.
În astfel de cazuri se atribuie variantelor valori echidistante:0,1,2,3,…etc.
Spre exemplu, în modelul liniar de dependență a cheltuieli de consum medii lunare pe o
persoană de anotimp:
y = a0 + a1x +e unde:
y – cheltuieli de consum medii lunare pe o persoană, lei, Q1 2006-Q2 2013
X – anotimpul: 1- primăvara, 2 – vara, 3 – toamna, 4 – iarna.

Un alt model, dependența numărului de zile bolnav în funcție de tipul de tratament aplicat:
Y – număr zile bolnav,
X – tipul de tratament aplicat, 1= chirurgical,
2= Sulfafurazole, 3= placebo.

b) Variabila calitativă prezintă intensități diferite, motiv pentru care li se atribuie numere de
ordine (ranguri) sau se procedează la calculul notelor proporționale cu intensitatea.
Se folosesc în studii de marketing, sociologie, politologie, etc. unde opinia, satisfacția,
încrederea instruirea pot să difere ca intensitate.
Atribuirea de numere de ordine care urmează succesiunea categoriilor.
Neajuns: valorile astfel atribuite sunt echidistante ceea ce nu corespunde întotdeauna
distanțelor dintre categoriile de calitate.
În cazul de față intensitatea dependenței dintre variabile se recomandă a fi determinată cu
coeficientul de corelație a rangurilor.
Metoda Spearman spre exemplu, presupune în prealabil stabilirea rangurilor pentru fiecare
variabilă în raport cu prezența intensității prezenței fenomenului, apoi aplicarea formulei
coeficientului de corelație Spearman:

37.Detectarea multicoliniarităţii
Există câteva reguli pentru stabilirea existenţei multicoliniarității:
coeficienții de corelație lineara, calculați pentru perechile de variabile explicative din model,
sunt mari în valoare absoluta (sunt, în modul, apropiați de +1);
determinantul matricei (X'X) are valori în apropierea lui zero;
 coeficientul de determinare 𝑹𝟐 este mare, iar valorile testelor t (Student), calculate
pentru parametrii modelului sunt mici;
 estimatorii parametrilor sunt sensibili la specificarea modelului;
 identificarea multicoliniarității prin proceduri formale.

Examinarea corelaţiilor parţiale a fost propusă de Farrar şi Glauber, în vederea cercetării


problemei privind coeficienţii de corelaţie simplă dintre regresori.
Ei susţin că, în regresia dintre y şi x1, x2, x3, dacă se găseşte că 𝑹𝟐 yx1x2x3, este mare, şi
comparativ 𝒓𝟐 yx1.x2x3, 𝒓𝟐 yx2.x1x3 , 𝒓𝟐 yx3.x1x2 sunt mici, aceasta poate sugera că
variabilele x1, x2 şi x3 sunt puternic intercorelate şi că cel puţin una din variabilele
explicative este în plus. Deşi studiul coeficienţilor de corelaţie parţială ar putea fi foarte util,
totuşi nu se poate garanta că va furniza un răspuns sigur în ceea ce priveşte
multicoliniaritatea. Se poate întâmpla ca atât 𝑹𝟐 yx1x2x3 cât şi toate corelaţiile parţiale să fie
suficient de mari, încât să pună sub semnul întrebării afirmaţia lui Farrar şi Glauber.

Regresiile auxiliare. Aflarea variabilei explicative care este corelată cu alte variabile x, prin
efectuarea regresiilor pentru fiecare variabilă xi şi restul variabilelor x. Fiecare din aceste
regresii se consideră ca fiind auxiliară faţă de regresia principală, considerată a fi regresia lui
y în funcţie de toate variabilele explicative x.
Un coeficient mare de determinaţie sugerează că xi este puternic corelată cu celelalte
variabile x. Pentru fiecare din aceste regresii auxiliare se calculează statistica Fi* .
Se compară Fi* cu valoarea critică din tabela Fisher, pentru un prag de semnificaţie α şi (k-
1), (n-k-1) grade de libertate.
Dacă Fi* > F α,k-1,n-k-1 acesta înseamnă că acea variabilă xi este coliniară cu celelalte
variabile x.
Dacă Fi* < Fa k-1,n-k-1 se spune că variabila xi nu este coliniară cu celelalte variabile x, caz
în care respectiva variabilă xi se reţine în model.
Această metodă are neajunsurile ei, în sensul că atunci când multicoliniaritatea presupune
implicarea a mai multor variabile, este dificil să se identifice interrelaţiile separate.

38.Proprietăți ale estimatorilor parametrilor de regresie.


Daca ipotezele modelului sunt respectate, atunci estimatorii calculați prin metoda celor mai
mici pătrate pentru modelul multifactorial de regresie lineara au anumite proprietăți:
estimatorii sunt lineari. Daca variabilele explicative X nu sunt aleatoare si au valorile fixate
(atunci când se repetă selecția), estimatorii parametrilor din modelul multifactorial de
regresie lineară sunt funcții lineare de observațiile din eșantionul selectat.
estimatorii sunt nedeplasați. Daca erorile sunt variabile aleatoare cu media zero, estimatorii
lineari ai parametrilor din modelul multifactorial de regresie lineara sunt nedeplasați;
estimatorii sunt consistenți. Daca variabilele explicative au dispersia finita, estimatorii lineari
si nedeplasați ai parametrilor din modelul multifactorial de regresie lineara sunt consistenți;
estimatorii sunt eficienți. Daca variabilele explicative au dispersia finita, estimatorii lineari si
nedeplasați ai parametrilor din modelul multifactorial de regresie lineara sunt eficienți;
estimatorii sunt normal distribuiți. Estimatorii parametrilor din modelul multifactorial de
regresie lineara (Â), calculați prin metoda celor mai mici pătrate, sunt variabile aleatoare cu
distribuire normală;
estimatorii sunt de maxima verosimilitate. Estimatorii parametrilor din modelul
multifactorial de regresie lineara (Â), calculați prin metoda celor mai mici pătrate, sunt
estimatori de maximă verosimilitate.

39.Intervale de încredere pentru parametrii de regresie.


Estimarea parametrilor prin interval de încredere - se bazează pe distribuţiile de selecţie ale
̂ ai parametrilor a şi b.
estimatorilor 𝒂̂ şi 𝒃
Pentru modelul liniar simplu, estimatorii parametrilor urmează o lege de distribuţie normală
şi sunt nedeplasaţi:
∑ 𝐱i2
̂ ~𝑵(𝒂, 𝝈𝒂 𝟐) cu 𝑴(𝒂
𝒂 ̂)=𝝈𝐚 𝟐 ; 𝛔𝐚 𝟐 =
̂) = a; 𝑽(𝒂 2 σe
2
n ∑(xi −x̅)
1
b̂~N(b, σb 2 ) cu M(b̂) = b; V(b̂)=σb 2 ; σb 2 = σ 2
∑(xi −x̅)2 e
Estimații:
 pentru varianţa erorilor σe 2 :
∑ ei 2 ∑(yi − a − bxi )2
2
Se = =
n−2 n−2
 - pentru varianţa estimatorului a şi b varianţa estimatorului :
∑ xi 2 1
 Sa 2 = 2 Se 2 și Sb 2 = 2 Se 2
n ∑(xi −x̅) ∑(xi −x̅)

Intervalul de încredere pentru:


 coeficientul de regresie a este definit de relaţia: a = (â ± t α⁄2 Sâ)
 coeficientul de regresie b este definit de relaţia: b = (b̂ ± t α⁄ Sb̂ ) 2
40.Verificarea acuratetei ajustarii.
Pornind de la relația Regulii Adunării Dispersiilor, se definește coeficientul de determinare
𝑅^2 ce prezintă partea din variația lui Y care poate fi atribuita variației lui X, pentru
eșantionul analizat: 𝑅^2=𝑉𝑇𝐸/𝑉𝑇=1−𝑉𝑇𝑅/𝑉𝑇
Coeficientul de determinare este o mărime pozitivă și subunitară. Cu cât 𝑅^2 este mai
aproape de unu, cu atât modelul se apropie mai mult de procesul economic modelat.
Coeficientul de determinare este doar o măsură a acurateței ajustării, care, ca orice măsura
are anumite limite: acesta nu poate fi interpretat atunci când ecuația de regresie nu conține
termen liber, deoarece, în aceasta situație relația prezentată anterior nu se respecta.
Pentru a se evita tentația de construire a unor modele explicative de dimensiuni mari,
irelevante din punct de vedere al teoriei economice (și care din punct de vedere al
coeficientului de determinare sunt "mai bune") s-a propus construirea altor măsuri ale
calității ajustării.
Cea mai utilizată corecție este cea introdusă de Theilprin coeficientul de determinare ajustat.
n−1
Coeficientul de determinare ajustat: R ̅2 = 1 − (1 − R)2 unde k este numărul
n−k−1
variabilelor exogene din model.
Interpretarea R̅ 2 este similară interpretării descrise pentru coeficientul de determinare: cu cât
acesta este mai aproape de unu, cu atât modelul se apropie mai mult de procesul economic
modelat.
̅ 2 poate lua valori negative,
R
Spre exemplu:
volumul selecției este n = 25, numărul variabilelor explicative
k = 3, iar coeficientul de determinare este R2 = 0.1, atunci, prin aplicarea formulei de calcul
se deduce că R ̅ 2 =-0.0286.
O valoare negativă a coeficientului de determinare ajustat semnifică faptul că modelul nu
descrie într-un mod satisfăcător evoluția variabilei endogene.
41.Criterii de respectat pentru specificarea modelului multifactorial.
 Criterii pentru specificarea modelului multifactorial:
Mărirea numărului de variabile explicative duce la scăderea sumei paratelor abaterilor dintre
valorile înregistrate statistic și valorile calculate prin model (VTR).
În consecință, coeficientul de determinareR2 crește, dar cu pierderea corespunzătoare a unor
grade de libertate ale modelului.
VTR
S2e =
n−k−1
prin adăugarea unei variabile explicative suplimentare scade atât numărătorul, cât și
numitorul fracției .
Un criteriu imediat pentru a decide dacă admitem sau nu în model o variabilă suplimentară
este următorul: dacă prin includerea unei (unor) variabile suplimentare suma pătratelor
reziduurilor scade mai repede decât numărul gradelor de libertate, din punct de vedere
econometric se justifică reținerea în model a variabilei (variabilelor) respective.
În practică modele simplificate sunt preferate unor modele mai complicate.
Consecințe:
1. creșterea numărului de variabile explicative duce la scăderea preciziei estimatorilor;
2. scăderea numărului gradelor de libertate are ca efect reducerea puterii testelor aplicate
asupra coeficienților. Creste astfel riscul de acceptare a unor ipoteze false (riscul erorii de tip
II).
Soluție: au fost construite teste care sa penalizeze construirea unor modele prea complicate,
fără a cădea însă în extrema cealaltă: simplificarea excesivă a modelelor.
Unul dintre cele mai cunoscute teste de specificare a modelelor econometrice este criteriul
informațional Akaike (Akaike information criterion – AIC).
 criteriul informațional Akaike:
VTR 2(k+1)
AIC = ( )e n
n
O condiție pentru includerea unei noi variabile explicative este ca prin această re-specificare
a modelului să se obțină o valoare mai mică pentru AIC.

 Criteriul informațional Schwartz (BIC)


Acest test presupune calculul expresiei:
k+1
VTR
Schwartz = ( )n n
n
Ca și în cazul testului AIC, o variabilă suplimentară este admisă dacă noua valoare obținută
pentru criteriul SCHWARTZ este inferioară celei calculate pentru modelul inițial. Se
demonstrează că dacă volumul eșantionului este mai mare decât 8 și prin eliminarea unei
variabile explicative valoarea AIC descrește, atunci și valoarea SCHWARTZ descrește.

42.Consecințe ale omiterii unor variabile explicative importante.


a) dacă o variabilă importantă omisă este corelată cel puțin cu o variabilă inclusă în model,
atunci estimatorii parametrilor reținuți în model sunt deplasați și nu sunt consistenți;
b) chiar dacă variabilele omise nu sunt corelate cu variabilele reținute în model, estimatorul
termenului liber (â0 ) este, în general, deplasat;
c) dispersiile estimate pentru parametrii variabilelor reținute în model sunt estimatori
deplasați ai dispersiilor reale și, în consecință, testul t privind semnificația estimatorilor nu
este valid.
43.Consecințe ale includerii unor variabile nerelevante in modelare.
a) dacă o variabilă explicativă nerelevantă este inclusă în model, atunci estimatorii
parametrilor pentru toate celelalte variabile din model sunt nedeplasați și consistenți;
b) dispersiile estimate pentru parametrii variabilelor din model sunt mai mari decât în
cazul neincluderii variabilelor nerelevante și deci estimatorii nu sunt eficienți;
c) deoarece dispersiile estimate pentru parametrii modelului sunt nedeplasate, testul t
privind semnificația estimatorilor este valid.

S-ar putea să vă placă și