Documente Academic
Documente Profesional
Documente Cultură
-Pe baza datelor din economie, econometria construieste modele(expresii cantitative) pentru
realitatile economice studiate care au un corespondent in teoriile economice.
- Econometria estimeaza, prin procedeele de indiferenta statistica, parametrii modelelor si
realizeaza predictii asupra realitatii studiate.
- Aria de studiu a econometriei este realitatea economica privita ca un ansamblu de relatii si
interconditionari abordate cu preponderenta sub aspect cantitativ.
1
întotdeauna o finalitate practică, operaţională, ele devenind instrumente de control şi
dirijare, de simulare şi de previziune a fenomenelor economice.
VARIABILELE care formează structura unui sistem econometric, după natura lor, pot fi:
a)variabile economice; (Endogene/Exogene)
b)variabila eroare (aleatoare), u; [prezintă abaterea între realitatea economică existentă
și realitatea simulată prin prisma modelului.]
c)variabila timp, t. [prezintă abaterea între realitatea economică existentă și realitatea
simulată prin prisma modelului.]
Sursa de date: variabilele economice se introduc într-un model econometric cu valorile
lor reale/empirice (yi = y1, y2,…, yn; xij = x1j, x2j,…, xnm; n = num ărul unit ăţilor
observate; m=numărul variabilelor exogene).
valorile variabilelor unui model se pot obţine:
• pe baza sistemului informaţional statistic (banca de date)
• efectuarea de observări statistice special organizate (anchete statistice).
Cerințe de bază asupra datelor statistice ce privesc variabilele economice specificate
în model:
culese fără erori sistematice de observare;
prelucrare calitativă a datelor;
respectarea omogenității datelor.
Omogenitatea datelor presupune:
-colectarea lor de la unităţi statistice omogene;
-reprezentarea aceloraşi definiţii şi metodologii de calcul cu privire la sfera de cuprindere
ale acestora în timp sau în spaţiu;
-descrierea evoluţiei fenomenelor într-un interval de timp în care nu s-au produs
modificări fundamentale privind condiţiile de desfăşurare a procesului analizat;
-exprimarea variabilelor în aceleaşi unităţi de măsură, condiţie care se refer ă, în mod
special, la evaluarea indicatorilor economici în preţuri comparabile sau preţuri reale.
2
modele statice: dependenţa variabilei endogene y faţă de valorile variabilei exogene
xj se realizează în aceeaşi perioadă de timp: y = f(x1t,...,xjt,...,xkt) + ut
modele dinamice:
• introducerea variabilei timp ca o variabilă explicativă y = f(xt,t) + ut
• autoregresive: variabila rezultativă cu valori decalate este una din variabilele
explicative y = f(xt,yt-k) + ut
• model cu decalaj: variabila explicativă x îşi exercită influenţa asupra variaţiei
variabilei rezultative pe mai multe perioade de timp: y = f(x t,xt-1,... xt-k) + ut
Tabelul de corelaţie
Această metodă presupune gruparea ambelor caracteristici, x şi y într-un tabel cu dublă
intrare.
Tabelul de corelaţie este un tabel cu dublă intrare în care pe coloane se trec grupele
formate după variaţia caracteristicii factoriale x, ordonate crescător, iar pe linii se
înscriu grupele referitoare la variaţia caracteristicii dependente y, de preferinţă
ordonate descrescător.
Tabelul de corelaţie prezintă: existenţa si sensul legăturii.
Metoda corelaţiei oferă o măsură sintetică a legăturilor dintre variabilele statistice .
Indicatorii calculaţi sunt: covarianţa, coeficientul de corelaţie, raportul de corelaţie.
Covarianţa :
Indicatorul ia valori pozitive dacă legătura dintre variabile este direct ă şi valori
negative în caz contrar.
Valori apropiate de zero semnifică lipsa oricărei legături între x şi y; valori ridicate
ale indicatorului arată o legătură puternică.
Coeficientul de corelaţie simplă măsoară intensitatea legăturilor liniare dintre două
variabile
Coeficientul de corelaţie ia valori cuprinse între -1 şi 1.
Semnul algebric al indicatorului prezintă sensul legăturii:
pozitiv - legătură directă,
negativ - legătură inversă.
Atunci când coeficientul ia valoarea zero, cele două nu sunt corelate liniar.
Valorile intermediare ale indicatorului (între 0 şi ±1) corespund unor intensit ăţi
diferite ale corelaţiei, mergând de la o legătur ă slabă (sub 0,5) pân ă la o leg ătur ă
puternică (peste 0,75).
Pentru a verifica semnificaţia coeficientului de corelaţie liniar ă simpl ă se utilizeaz ă
testul "t- Student".
Ipotezele cercetate sunt: Ho: r y / x =0 H1: r y / x ≠0
Coeficientul de corelaţie semnificativ daca tcalc ≥ tα, n-2 , α=0.05
3
relaţii de comportament,
relaţii tehnologice şi relaţii instituţionale.
a)relaţii de identitate sau deterministe : sunt formulări logice cu privire la procesul
economic descris (exemplu: VN=VB - I );
b)relaţii de comportament: au în vedere modificările tradiţiilor, atitudinilor, înclina ţiilor
(sub raportul satisfacţie/efort) (exemplu: C = a + bV );
c)relaţii tehnologice: restricţiile impuse output-urilor în raport cu input-urile (exemplu:
funcţia Cobb Douglas: Q = IL1-, 01);
d)relaţii instituţionale: conform unor reglementări impuse de lege (exemplu:amortizarea,
impozitul pe venit etc.).
4
b - panta dreptei - arată variaţia medie a variabilei dependente, Y, la o variaţie absolută cu
o unitate a variabilei X, adică variaţia variabilei Y este proporţională cu variaţia
variabilei X.
Testarea semnificaţiei parametrilor modelului unifactorial liniar
Estimatorii “a” şi “b” ai coeficienţilor din ecuaţia de regresie în colectivitatea general ă
au distribuţii de eşantionare, cu următoarele proprietăţi:
“a” şi “b” sunt estimatori nedeplasaţi ai parametrilor “α” şi “β”, adică:
Distribuţiile de eşantionare ale estimatorilor “a” şi “b” sunt normal distribuite, cu mediile
“α” şi “β” s 2b
s 2a şi dispersiile: şi μ ( a )=α μ ( b )=β
s 2a =s2e⋅
∑ x 2i s 2b =s2e⋅
1
∑ ( y i− y^ i )2
n ∑ ( xi −x )2 ∑ ( xi −x )2 s 2e =
n−2
1 x̄ 2
Testarea semnificaţiei parametrului “β” (panta dreptei)
Ipotezele statistice pestru testul bilateral:
H0: β = 0
H1: β ≠ 0
Dacă eşantionul este de volum mare:
s 2a =s2e
( n
+ n
∑ ( x i − x̄ )2
i=1
)
Testul z: b−μ ( b ) b−0
z calc= =
sb sb
Regiunea critică: dacă z calc <−z α /2 sau z calc >z α /2 se respinge H0.
Dacă eşantionul este de volum mic:
Teste unilaterale:
Test unilateral dreapta:
H0: β = 0 b−μ ( b ) b−0 b
H1: β> 0 t calc= = =
sb sb sb
Test unilateral stânga:
H0: β = 0
H1: β< 0
Regiunea critică:
Pt. test unilat. dreapta: t calc >t α ,n−2
Pt. test unilat. stânga: t calc <−t α ,n−2
Intervalul de încredere pentru “β”:
b−t α /2, n−2⋅s b ≤β≤b +t α /2, n−2⋅sb
Testarea semnificaţiei parametrului “α”
Ipotezele statistice pestru testul bilateral:
H0: α = 0
H1: α ≠ 0
Testul t: a−μ ( a ) a−0 a
t calc= = =
t <−t α /2,n−2 t calc >t α /2,n−2 sa sa sa
Reg. Critică: dacăcalc sau
se respinge H0, deci α este semnificativ statistic.
Indicatorul ia valori pozitive dacă legătura dintre variabile este direct ă şi valori negative
în caz contrar.
Valori apropiate de zero semnifică lipsa oricărei legături între x şi y; valori ridicate ale
indicatorului arată o legătură puternică.
Coeficientul de corelaţie simplă măsoară intensitatea legăturilor liniare dintre două
variabile.
6
Cea mai uşor de utilizat formulă de calcul a coeficientului de corelație este:
Ho: ry / x =0
H1: ry / x ≠0
Valoarea calculată a mărimii t se determină cu relaţia:
Raportul de corelație:
sau
cu u ~ N (0 , σ 2 )
i u
8
Y = a0 + a1X1 + a2X2 + ... + ak Xk + e
unde:
Y este variabila endogenă,
X1, X2, …, Xk sunt k variabile explicative,
a0, a1, a2, …, ak sunt k+1 parametri necunoscuți,
e este variabila de abatere (eroarea) din ecuația de regresie.
Unde:
Y – variabila endogenă;
X – variabila exogenă;
ε - variabila reziduală.
Tabelul ANOVA este utilizat pentru testarea validarii modelului . Elementele de calcul şi
valoarea raportului F se obţin facil cu ajutorul programelor statistice, rezultatele fiind
prezentate în Tabelul ANOVA, şi anume:
estimaţiile celor două componente ale variaţiei,
gradele de libertate corespunzătoare,
9
estimaţiile varianţelor, explicată şi reziduală,
valoarea calculată a raportului Fisher şi
semnificaţia testului, Sig.
10
Surse:
Metode de colectare a adatelor
Specificarea modelului
Model supradeterminat
11
Restricţii asupra modelului/populaţiei observate
Consecinţe ale coliniarităţii perfecte: nu se pot estima parametrii de regresie (matricea X’X nu este
inversabilă)
Consecinţe ale coliniarităţii imperfecte:
Creşte varianţa estimatorilor acelor parametrii ai modelului ce corespund variabilelor aflate în dependenţă
liniară semnificativă
Intervale de încredere mari (riscul acceptării ipotezei nenule)
Valori ridicate ale lui R2
24.Demersul econometric.
demersul econometric consta intr-o insiruire logica de ipoteze privind semnificatia variabilelor exogene,
a calitatii estimatiilor obtinute, a gradului de performanta a modelelor construite. Acceptarea sau
respiungerea ipotezelor formulate in econometrie se poate'face cu ajutorul mai multor teste
Indicatorul ia valori pozitive dacă legătura dintre variabile este directă şi valori negative în
caz contrar.
Valori apropiate de zero semnifică lipsa oricărei legături între x şi y; valori ridicate ale
indicatorului arată o legătură puternică.
Coeficientul de corelaţie simplă măsoară intensitatea legăturilor liniare dintre două
variabile.
Raportul de corelație:
sau
13
Cea mai simplă modalitate de prezentare este prin prisma calculului matricial în
baza funcției:
Y=X ^A+ε
Unde:
– Y este un vector coloana, de dimensiuni n × 1, care are drept componente cele n
înregistrări ale variabilei explicate (endogene),
– X este o matrice de dimensiuni n × (k+1), care conține în prima coloana (atașată
termenului liber) constanta 1, iar în celelalte k coloane înregistrările pentru
fiecare dintre cele k variabile explicative;
– A este un vector coloana, de dimensiuni (k+1) × 1, care include cei k+1
parametri ai modelului;
– e este un vector coloana, de dimensiuni n × 1, care include cele n valori ale
variabilei de abatere (erorile din ecuația de regresie).
¿
Dacă vectorii atașați fiecărei variabile explicative Xi sunt linear independen ți,
atunci matricea X'X nu este singulară și sistemul poate fi rezolvat în raport cu
vectorul estimatorilor Â: Â = (X'X)-1 X'Y
14
Consecinţe ale ignorării fenomenului de heteroscedasticitate a erorilor:
a)Estimatorii parametrilor din model sunt nedeplasaţi şi consistenţi
b)Estimatorii parametrilor din model nu sunt eficienţi (exist ă estimatori care au o
dispersie mai mică).
c)Estimatorii calculaţi pentru dispersia şi covarianţa parametrilor sunt deplasa ţi, nu sunt
consistenţi şi nu sunt eficienţi.
d)Testul t Student aplicat pentru analiza semnificaţiei estimatorilor nu este valid. Dac ă
dispersia erorilor şi variaţia factorului explicativ sunt pozitiv corelate, atunci
dispersia corectă a parametrului a1 este subestimată, astfel încât calculele
sugerează o precizie a estimării mai bună decât este în realitate.
e)Estimatorii parametrilor nu au proprietatea de maximă verosimilitate.
Testarea heteroscedasticităţii: Testul Goldfeld–Quandt.
Se identifică, o variabilă notată Z, de care este (potenţial) legat ă dispersia erorilor. Se
aranjează toate observaţiile din eşantionul reţinut pentru analiză în ordinea
crescătoare a valorilor Zt . Eşantionul de dimensiune n se divide în dou ă p ăr ţi de
dimensiuni n1 şi n2 , după eliminarea a m observaţii (între 1/6 şi 1/5 dintre observa ţii)
situate la mijlocul eşantionului. Se calculează dispersia reziduurilor din modelul
estimat pentru primele n1 observaţii şi dispersia reziduurilor din modelul estimat
pentru ultimele n2 observaţii. Dacă raportul supraunitar al acestor dispersii este mai
mic decât valoarea critică din tabelul distribuţiei teoretice F cu n1 -(k+1) şi n2 -(k+1)
grade de libertate, atunci ipoteza nulă, a lipsei heteroscedasticit ăţii erorilor nu este
respinsă.
17
Dacă ipoteza de normalitate este încălcată, proprietăţile estimatorilor construi ţi pe baza
metodei celor mai mici pătrate au doar proprietăţi asimptotice, adică necesit ă
eşantioane sau seturi mari de date!
Testarea ipotezei M(ε)=0 se poate realiza cu ajutorul t-Student, folosit pentru pentru
compararea mediei cu valoarea 0.
18
Testarea ipotezei de normalitate a erorilor se poate realiza cu ajutorul procedeelor
grafice (histograma, diagrama reziduurilor) sau a procedeelor numerice (testul
Kolmogorov-Smirnov, testul Jarque - Bera ).
Testul Jarque-Bera
n ˆ 2 ( Kˆ 3) 2
JB S ~ 2
6 4
Testul Jarque - Bera se calculează după relaţia: unde:
3
S
23
, reprezintă asimetria (skewness).
S = 0 pentru o repartiţie normală,
S > 0 pentru o repartiţie asimetrică la dreapta,
S < 0 pentru o repartiţie asimetrică la stânga;
4
K
22
reprezintă boltirea, (kurtosis).
K = 3 pentru o repartiţie normală,
K<3 pentru o repartiţie aplatizată
K > 3 pentru o repartiţie afectată de boltire.
ߛൌ
݊െʹ ሺ݊ݎǤ݃݁݀ܽݎ ݁ ሻ,
ݐ ܽݐݎ ݐܾ݈݁݅ݐ
19
35.Metode de atenuare şi eliminare a multicoliniarităţii. Selecţia variabilelor exogene în
model.
Daca estimatorii calculați pentru parametrii modelului sunt semnificativi din punct de
vedere statistic, sensul și intensitatea influentei sunt în concordanta cu teoria
economica, atunci eventuala prezență a fenomenului de multicoliniaritate poate fi
neglijată.
Dacă însă, influențele asupra calității estimatorilor sunt negative, atunci exist ă mai
multe soluții pentru eliminarea multicolinearității.
a) Eliminarea unor variabile explicative . Selectarea variabilei care va fi eliminată se face
fie prin analiza teoretica (economica), fie pornind de la testele statistice de
semnificație. În ultima situație, se elimină variabila pentru care valoarea testului t
este mică, sau variabila pentru care corelația cu Y este mai slab ă.
b) Realizarea unor observații suplimentare asupra variabilelor din model (se m ăre ște
volumul eșantionului). Daca este posibilă mărirea eșantionului, atunci crește precizia
estimatorilor și se reduce efectul negativ al multicoliniarit ății.
c) Prelucrarea primara a datelor (calculul ritmurilor de modificare, a sporurilor, indicilor,
logaritmarea valorilor observate).
Este posibil, de exemplu în cazul seriilor de timp, ca anumite variabile economice sa
evolueze pe traiectorii asemănătoare, fără ca între acestea sa existe o leg ătur ă
directă.
Astfel, în medii economice puternic inflaționiste, variabilele au în timp valori cresc ătoare
dacă sunt exprimate nominal, chiar dacă, în prețuri constante, tendința real ă este de
scădere. În aceste condiții, evitarea multicolinearității indusă artificial se poate
realiza prin includerea în model a ritmurilor (sau a indicilor) de modificare a
variabilelor respective.
d)Regresia ridge.
Este o tehnică mecanică, arbitrară, care constă în transformarea matricei (X'X) astfel
încât determinantul matricei obținute să fie diferit de zero.
De exemplu, se adaugă un număr fiecărui element de pe diagonala principală a matricei
(X'X), astfel încât în aplicarea procedurii de estimare a parametrilor modelului se
folosește matricea (X'X+cIk+1,k+1), unde c este o constantă, iar I este matricea
unitate.Chiar daca în acest mod calitatea statistică a estimării poate fi îmbun ăt ățit ă,
principalul inconvenient constă în dificultatea interpretării economice a rezultatelor
obținute.
Aplicarea în practică a uneia din modalităţile de remediere, depinde de natura datelor şi
de severitatea multicoliniarităţii.
SELECTIA VARIABILELOR EXOGENE:
Procedurile statistice de selecţie a variabilelor explicative permit determinarea acelor
variabile, care se adaugă sau se retrag dintr-un model. Aceste demersuri exclud
raţionamentul economic, permiţând găsirea unor modele, care deseori sunt bune din
punct de vedere statistic, dar a căror interpretare economică poate fi nul ă sau
aberantă. De aceea tehnicile automate de selecţie a variabilelor explicative se
utilizează cu prudenţă, completându-se rezultatele cu raţionamentul economic.
Există cinci proceduri pentru selecţia variabilelor explicative :
- cele mai corelate cu variabile explicată şi
- cel mai puţin corelate între ele.
Aceste proceduri sunt:
toate regresiile posibile;
eliminarea progresivă;
selecţia progresivă;
regresia pas cu pas;
regresia pe faze.
Toate regresiile posibile - constă în efectuarea tuturor regresiilor posibile (2 la
puterea (k– 1)), unde k este numărul variabilelor explicative, candidate la intrarea
20
în model. Se reţine acel model care are R la puterea 2 cel mai mare şi toate
variabilele explicative semnificative.
Eliminarea progresivă - constă în efectuarea regresiei cu toate variabilele
explicative şi apoi eliminarea pe rând, a acelora a căror nivel al probabilit ății
statisticii Student este mai mare decât valoarea critică ( α=0,05). Procedura se
utilizează, numai dacă se poate estima efectiv, modelul iniţial, ceea ce nu este
mereu posibil. Modelul poate avea un număr mare de variabile explicative, şi atunci,
riscul multicoliniarităţii este mare, iar matricea poate fi singular ă.
Selecţia progresivă - se parcurge un sens invers celui descris în eliminarea
progresivă:
1) se selectează în model o variabilă xi, care are coeficientul de corelaţie simplă cu
variabila y, cel mai mare;
2) în a doua etapă, se calculează coeficienţii de determinaţie parţial ă r la puterea 2
yxj.xi pentru j ≠i şi se reţine acea variabilă xj, care are cel mai mare coeficient de
corelaţie parţială.
Selecţia variabilelor se opreşte când probabilității statisticii Student este mai mare
decât valoarea critică (α=0,05).
Regresia pas cu pas - este identică cu cea precedentă, a selecției progresive, doar
că înainte de a incorpora o nouă variabilă explicativă se examinează probabilitățile
statisticii Student a fiecăreia din variabilele explicative selec ționate în prealabil și
se elimină din model cele care au probabilitățile statisticii Student mai mari decât
valoarea critică!
b) Realizarea unor observații suplimentare asupra variabilelor din model (se m ăre ște
volumul eșantionului). Daca este posibilă mărirea eșantionului, atunci crește precizia
estimatorilor și se reduce efectul negativ al multicoliniarit ății.
21
folosește matricea (X'X+cIk+1,k+1), unde c este o constantă, iar I este matricea
unitate.
Chiar daca în acest mod calitatea statistică a estimării poate fi îmbunăt ățit ă, principalul
inconvenient constă în dificultatea
interpretării economice a rezultatelor obținute.
i j cov( , ) 0
---Ipoteza de necorelare a erorilor:
presupune lipsa unei corelaţii între termenii variabilei eroare din modelul de (eroarea
asociată unei valori a variabilei dependente nu este influenţată de eroarea asociată
altei valori a variabilei dependente).
Pentru testarea acestei ipoteze se pot utiliza: testul Durbin Watson.
---Testul Durbin Watson (DW)
H0: r = 0 (nu există autocorelare a erorilor);
H1: r ¹ 0 (ipoteza este încălcată, există o legătură între erori).
(e
i 2
i ei 1 ) 2
DW n
e 2
i
Statistica test: i 1
22
Metoda celor mai mici pătrate (MCMMP):
Dacă forma generală a modelului este definită de relația:
ݕ ൌ ܽ ܾ[ ݑ
Estimarea parametrilor modelului de regresie se bazează pe
criteriul minimizării sumei pătratelor abaterilor între valorile
observate, yi , şi valorile teoretice, ݕ
ෝ:
F(ܽ ෝ ሻൌ
ǡܾ ݉݅݊ ∑ሺݕ െݕො ଶ
ሻ
Condiția de minim a acestei funcții rezultă din:
ܽ
ො ݕ
ൌതെݔҧ
ܾ
) cu ) = a; )= ; =
ଵ
ܾ ܾǡߪ ଶ) cu ܯሺ
̱ ܰሺ ܾ) = b; ܸሺ
ܾ)=ߪ ଶ; ߪ ଶ= మ ߪ ଶ
σ ሺ௫ି௫ҧ
ሻ
23
Estimații:
pentru varianţa erorilor ߪ ଶ:
= și =
Intervalul de încredere
Intervalul de încredere pentru:
coeficientul de regresie a este definit de relaţia:
ܽൌ ሺܽොേݐഀΤమܵො)
ܽ
ො ݕ
ൌതെݔҧ
ܾ
24
b=0 , între x și y nu există legătură;
b>0, între x și y legătură direct proporțională;
b<0, între x și y legătură invers proporțională.
a – termenul liber care exprimă acțiunea constantă a factorilor neînregistrați.
) cu ) = a; )= ; =
ଵ
ܾ ܾǡߪ ଶ) cu ܯሺ
̱ ܰሺ ܾ) = b; ܸሺ
ܾ)=ߪ ଶ; ߪ ଶ= మ ߪ ଶ
σ ሺ௫ି௫ҧ
ሻ
Estimații:
pentru varianţa erorilor ߪ ଶ:
= și =
Intervalul de încredere
Intervalul de încredere pentru:
coeficientul de regresie a este definit de relaţia:
ܽൌ ሺܽොേݐഀΤమܵො)
Dispersia coeficientilor evaluati în jurul valorilor adevărate ale coeficientilor este cea mai compactă distributie,
care este posibilă în conditiile dispersiilor nedeplasate. Nici una din metodele liniare existente de estimare a
coeficientilor nu asigură o dispersie mai mică pentru fiecare din coeficientii estimati decât M.C.M.M.P.
Estimatiile sunt de natură BLUE - Best Linear Unbiased Estimators (Teorema Gauss-Marcov).
41. Teoria corelaţiei. Modalităţi de stabilire a legăturii între două fenomene.
Metoda corelaţiei oferă o măsură sintetică a legăturilor dintre variabilele statistice.
Indicatorii calculaţi sunt:
covarianţa,
coeficientul de corelaţie ,raportul de corelaţie.
Fenomenele si procesele economice se gasesc in relatii de interdependenta, astfel incat unele
se comporta ca fenomene cauza, determinante, independente sau factoriale, iar altele sunt
fenomene efect, determinate, dependente sau rezultative.
Metoda tabelului de corelatie. Tabelul de corelatie este un tabel statistic cu dubla intrare si
cuprinde doua serii statistice de repartitie, o serie reprezinta seria de variante, sau intervalele
de grupare, ale caracteristicii determinante, iar cealalta serie se refera la caracteristica
dependenta (determinata). Tabelul de corelatie este o forma de grupare combinata efectuata
dupa doua caracteristici considerate in sistem interdependent.
In functie de modul in care se distribuie frecventele aferente celor doua caracteristici se poate
contura o apreciere cu privire la existenta sau inexistenta unei legaturi statistice, forma si directia
25
legaturii. Concentrarea frecventelor in jurul uneia dintre diagonalele tabelului indica existenta
unei anumite legaturi statistice, iar daca se remarca o imprastiere a frecventelor in tot spatiul
tabelului se apreciaza ca cele doua caracteristici nu manifesta o stare de interdependenta.
Prin metoda tabelului de corelatie se identifica daca exista o legatura statistica intre fenomenele
studiate, in profil static, la un anumit moment la care se refera datele, legatura care poate sa nu se
mai manifeste la alte momente de existenta a unitatilor statistice.
Metoda grafica este una din cele mai utilizate metode pentru evidentierea legaturilor care se
formeaza intre caracteristicile statistice. Aceasta metoda poate avea atat o utilizare independenta
cat si in contextul aplicarii altor metode cu o structura de lucru mai complexa cum ar fi metodele
statistico-matematice de analiza a corelatiilor.
Metoda graficului de corelatie (corelograma) consta in analiza unui grafic construit pe baza
axelor rectangulare, valorile caracteristicii independente se inscriu pe abscisa, iar cele ale
caracteristicii rezultative se inscriu pe axa ordonatelor. Reprezentarea punctelor de intersectie a
valorilor celor doua caracteristici (“norul de puncte”) ofera o dispunere care permite, prin
observatie, sa se concluzioneze asupra existentei corelatiei, precum si asupra directiei si formei
analitice de manifestare a corelatiei.
26
•model cu decalaj: variabila explicativă x îşi exercită influenţa asupra variaţiei
variabilei rezultative pe mai multe perioade de timp: y = f(xt,xt-1,... xt-k) + ut
după includerea factorului timp în model
modele statice: dependenţa variabilei endogene y faţă de valorile variabilei exogene
xj se realizează în aceeaşi perioadă de timp: y = f(x1t,...,xjt,...,xkt) + ut
modele dinamice:
• introducerea variabilei timp ca o variabilă explicativă y = f(xt,t) + ut
• autoregresive: variabila rezultativă cu valori decalate este una din variabilele
explicative y = f(xt,yt-k) + ut
• model cu decalaj: variabila explicativă x îşi exercită influenţa asupra variaţiei
variabilei rezultative pe mai multe perioade de timp: y = f(x t,xt-1,... xt-k) + ut
Modelul clasic de regresie liniară reprezintă una dintre tehnicile statistice cele mai
des utilizate în analiza economică, şi nu numai. Definiţie: o relaţie matematică
construită pe baza teoriei economice, care presupune că fenomenul economic Y
(fenomenul efect) este rezultatul acţiunii a două categorii de factori:
prima, constituită dintr-un singur factor principal, esenţial, determinant – X,
a doua - formată din toţi ceilalţi factori – consideraţi neesenţiali, cu ac ţiune
întâmplătoare (specificaţi prin variabila reziduală “ε”) sau constantă,
invariabilă, asupra lui Y (şi deci nu au sens a fi specificaţi în model).
Specificarea modelului unifactorial constă în precizarea variabilei endogene Y şi a celei
exogene X, pe baza teoriei economice; ca orice ipoteză teoretică, ea poate fi
adevărată sau falsă.
y = f(x) + ε
Identificareamodeluluiconstăînalegereauneifuncţii (sau a unuigrup de funcţii)
matematice, cu ajutorulcăreia se urmăreştesă se descrievalorilevariabileiendogene,
doarînfuncţie de variaţiavariabileiexogene X. Identificareamodelului se poate face
prin: • procedeulgrafic; • procedeulconservăriiariilor; • procedeulcalculeloralgebrice.
Forma modelului de regresieliniarăsimplă este:
Y = 𝑎+𝑏𝑋+ε
Unde:Y – variabilaendogenă;X – variabilaexogenă; ε - variabilareziduală.
Parametriimodelului de regresie simplă liniară, numiţi şi coeficienţi de regresie, sunt:
a - ordonata la origine - arată valoarea medie a variabilei Y când mărimea variabilei X
este 0;
b - panta dreptei - arată variaţia medie a variabilei dependente, Y, la o variaţie absolută cu
o unitate a variabilei X, adică variaţia variabilei Y este proporţională cu variaţia
variabilei X.
Testarea semnificaţiei parametrilor modelului unifactorial liniar
Estimatorii “a” şi “b” ai coeficienţilor din ecuaţia de regresie în colectivitatea general ă
au distribuţii de eşantionare, cu următoarele proprietăţi:
“a” şi “b” sunt estimatori nedeplasaţi ai parametrilor “α” şi “β”, adică:
Distribuţiile de eşantionare ale estimatorilor “a” şi “b” sunt μnormal
( a )=α distribuite,
μ ( b )=β cu mediile
2 2
“α” şi “β”
s a şi dispersiile:
sb şi
s 2a =s2e⋅
∑ x 2i s 2b =s2e⋅
1
∑ ( y i− y^ i )2
n ∑ ( xi −x )2 ∑ ( xi −x )2 s 2e =
n−2
1 x̄ 2
Testarea semnificaţiei parametrului “β” (panta dreptei)
Ipotezele statistice pestru testul bilateral:
H0: β = 0
s 2a =s2e
( n
+ n
∑ ( x i − x̄ )2
i=1
) 27
H1: β ≠ 0
Dacă eşantionul este de volum mare:
Teste unilaterale:
Test unilateral dreapta:
H0: β = 0 b−μ ( b ) b−0 b
H1: β> 0 t calc= = =
sb sb sb
Test unilateral stânga:
H0: β = 0
H1: β< 0
Regiunea critică:
Pt. test unilat. dreapta: t calc >t α ,n−2
Pt. test unilat. stânga: t calc <−t α ,n−2
Intervalul de încredere pentru “β”:
b−t α /2, n−2⋅s b ≤β≤b +t α /2, n−2⋅sb
Testarea semnificaţiei parametrului “α”
Ipotezele statistice pestru testul bilateral:
H0: α = 0
H1: α ≠ 0
Testul t:
a−μ ( a ) a−0 a
t calc= = =
sa sa sa
Reg. Critică: dacă sau
t <−t α /2,n−2 t calc >t α /2,n−2
se respinge H0,calc
deci α este semnificativ statistic.
28
47.Variabile calitative (dummy)- concept
Într-un model econometric, de regula, atât variabilele endogene, cat si variabilele exogene sunt variabile
economice cuantificabile, exprimate în unități de măsură specifice naturii lor.
Dar, în anumite situații, ambele grupe de variabile, endogene si exogene, pot fi de natura calitativa
(nenumerice), variantele lor prezentându-se prin cuvinte și nu prin numere.
Variabilele calitative sau variabilele dummy se referă la însușiri, calități, categorii etc. a căror dimensiune
este exprimată prin atribute sau denumiri.
48.Exprimarea numerică a variabilelor dichotomice
Variabilele care pot fi prezentate sub două aspecte care se exclud reciproc privind:
existența – non-existența,
acceptarea – refuzul,
urban - rural, etc.
acest fapt face posibil transformarea în spațiul numeric binar a alternativelor existente.
a) Model unifactorial unde variabila exogenă este binară:
Spre exemplu, in modelul liniar
y = a0 + a1x +e
unde:
y - câștigurile salariale medii orare
x – situația matrimonială: 1- căsătorit, 0- necăsătorit
b) Model multifactorial unde variabilele exogene sunt binare:
Y = a0 + a1X1 + a2X2 + ... + ak Xk + e
unde:
X1 - profit net la o acțiune ordinară, unde 1 profit>0
X2 – activitatea desfășurată, unde 1 – activitate din domeniul alimentar
Y – profit net
c)Modelul include un factor calitativ și un factor numeric, spre exemplu:
Folosind o notaţie matricială, o ecuaţie de regresie liniară poate fi scrisă sub forma:
Y=Xβ +ε
unde y este un vector N-dimensional care conţine observaţiile privind variabila dependentă, X este o matrice de
dimensiune N x K cu variabile independente sau explicative, β este un vector K dimensional al coeficienţilor de
regresie şi Ɛ este un vector N dimensional reprezentând inovaţiile asociate ecuaţiei, adică aceea componentă din
dinamica variabilei dependente care nu este captată de către cele K variabile independente. N reprezintă numărul
de observaţii, iar K este numărul de regresori (variabile explicative) din partea dreaptă a ecuaţiei
30
Variabilele observate nu sunt afectate de erori de măsură dacă: se poate verifica regula celor trei sigma
care constă în verificarea următoarelor relaţii: x i ∈ ¿+3σ x ); y i ∈¿+3σ y)
Testarea liniarităţii modelului:Verificarea liniarităţii se poate efectua grafic, folosind: diagrama reziduurilor
din regresie.
Diagrama reziduurilor din regresie se construieşte luând pe ordonată variabila reziduu şi pe abscisă variabila
dependentă.
Dacă reziduurile apar dispersate aleator, de o parte şi de alta a valorii zero, atunci relaţia poate fi modelată cu
ajutorul regresiei liniare.
Testarea ipotezei de normalitate a erorilor:
Ipoteza de normalitate a erorilor presupune că variabila εurmează o lege normală de medie 0 şi varianţă σ2: ε
N ¿);
Verificarea acestei ipoteze implică şi testarea ipotezei că, în medie, modelul este bine specificat: M (ε )=0.
Testarea ipotezei M (ε )=0 se poate realiza cu ajutorul t-Student, folosit pentru pentru compararea mediei cu
valoarea 0. Testarea ipotezei de normalitate a erorilor se poate realiza cu ajutorul procedeelor grafice
(histograma, diagrama reziduurilor) sau a procedeelor numerice (testul Kolmogorov-Smirnov, testul Jarque -
Bera ).
Diagrama de dispersie a reziduurilor se construieşte considerând pe ordonată valori ale variabilei reziduale ε i, iar
pe abscisă valori estimate ale variabilei dependente ^ y i.
Procedee analitice:
Testul Goldfeld-Quandt
Se aplică când se dispune de serii lungi de date.
(n−c )
Presupunând că erorile sunt normal distribuite, atunci raportul F* urmează o distribuţie F cu γ 1= γ 2= -
2
( k +1 ) grade de libertate.
¿
dacă F > F (n−c )
∝;
( n−c )
( k+1 ) ;; ( k +1)
,ipoteza de homoscedasticitate este infirmată, erorile sunt heteroscedastice;
2 2
F ,
dacă F ¿< ∝;
( n −c )
( k+1 ) ;;
( n−c )
( k +1) ipoteza de homoscedasticitate este acceptată.
2 2
31
Testul White
Există două variante de aplicare a testului White:
- utilizarea testului Fisher –Snedecor clasic, bazat pe ipoteza nulităţii parametrilor, respectiv: H 0 :a0=a1=a 2
=0
Dacă ipoteza nulă, potrivit căreia rezultatele estimării sunt nesemnificative ( F c < F ∝; γ ;γ ), este acceptată, atunci
1 2
33