Documente Academic
Documente Profesional
Documente Cultură
modern, se manifest pe cel puin trei planuri: n plan logic, ilustrarea unei
ipoteze teoretice prin intermediul unui model cantitativ poate verifica riguros
consistena ipotezei respective; n plan empiric, se creeaz legtura
matematic i statistic ntre teoria i realitatea economic; n plan euristic,
utilizarea econometriei permite dezvoltarea de concepte economice noi,
imposibil de relevat prin analiza teoretic.
2. Avantajele utilizarii metodelor econometrice
xi x
xr
1
r
i 1
r
i
(2.1)
xr
1
r
x n
r
i
i 1
k
i 1
(2.2)
i 1
(2.3)
x
i 1
ni
i 1
(2.4)
n cazul datelor grupate pe intervale de frecven, pentru o variabil continu, media aritmetic se
determin cu relaia:
k
x
i 1
ni
n
i 1
(2.5)
unde xi* reprezint mijlocul intervalului (xi-1, xi), calculat astfel: xi* = (xi-1 + xi)/2.
Media ptratic
xp
i 1
xp
x
i 1
2
i
(2.6)
ni
n
i 1
(2.7)
Media armonic (r = 1)
xh
n
n
x
i 1
se determin astfel:
(2.8)
k
xh
n
k
x
i 1
ni
xg
i 1
(2.9)
x
i 1
(2.10)
k
xg
ni
i 1
ni
i 1
ntlnit n repartiia de date analizate. n cazul variabilelor discrete, modul se determin, conform
definiiei sale, ca fiind valoarea cu cea mai mare frecven sau probabilitate de apariie iii.
n cazul unei repartiii continue, grupat pe intervale de frecven, modul este valoarea corespunztoare
vrfului curbei de frecven. n acest caz, determinarea lui presupune parcurgerea urmtoarelor
etape:
1. Se determin intervalul cu frecvena maxim de apariie, care devine, astfel, interval modal
(intervalul care conine modul);
Mo lo h0
1
1 2
relative (coeficieni) i sunt abaterea medie liniar; variana (dispersia); abaterea standard
(abaterea medie ptratic) i coeficientul de variaie.
d
- Abaterea medie liniar ( ) pe date negrupate se determin ca o medie aritmetic simpl a abaterilor
n
x
i 1
d
-
i 1
x ni
n
(2.20)
Caracteristica abaterii medii liniare const n aceea c nu se ine cont de semnul abaterilor
individuale luate n considerare, ceea ce n unele cazuri poate constitui un dezavantaj. Dac, ns,
abaterile individuale nu ar fi luate n valoare absolut, atunci s-ar ajunge la acea proprietate a
mediei aritmetice, conform creia suma abaterilor individuale fa de medie este nul. Abaterea
medie liniar este un parametru concludent al variaiei numai pentru populaiile statistice omogene.
Neajunsurile abaterii medii liniare sunt nlturate prin calcularea varianei
i 1
(2.21)
Pentru date grupate pe k intervale de frecven, variana se determin dup relaia:
k
2
-
x
i 1
x ni
2
(2.22)
Caracteristica variantei:
Variana pe date grupate, precum i valorile medii calculate pe date grupate, sunt cu att mai
aproximative cu ct intervalele de grupare sunt mai mari, ceea ce conduce la ideea c este de
preferat s se determine aceti parametri pe baza valorilor individuale negrupate.
Variana, fiind de ordinul ptratului valorilor studiate, este un parametru abstract, fr unitate de
msur i cuantific variaia total a caracteristicii datorit cauzelor eseniale i ntmpltoare. Ea
este util n verificarea unor ipoteze statistice i st la baza determinrii altor parametrii ai
variaiei, cu aplicabilitate practic mai larg, cum sunt abaterea standard i coeficientul de
variaie.
n
x
i 1
x
i 1
x ni
2
(2.24)
-Avantajele abaterii standart: constau n aceea c acord fiecrei abateri de la medie importana
cuvenit i c poate fi utilizat n interpretrile econometrice datorit faptului c, spre deosebire de
varian, este de acelai ordin de mrime cu valorile studiate.
Abaterea standard este utilizat ndeosebi la estimarea erorilor de sondaj, n calculele referitoare la
regresie i corelaie, precum i n verificarea semnificaiei anumitor indicatori statistici.
-Coeficientul de variatie: V) este raportul procentual dintre abaterea standard i media aritmetic,
100
x
conform relaiei:
(2.25)
-Interpretarile coeficientului de variatie: Coeficientul de variaie poate lua valori ntre 0 i 100% i
are urmtoarele interpretri:
dac este egal cu zero, nseamn c toate valorile caracteristicii sunt egale ntre ele, respectiv, egale
cu media aritmetic, variaia lor fiind nul;
dac tinde ctre zero, nseamn c variaia caracteristicii este mic, adic populaia statistic
studiat este omogen, iar media este reprezentativ pentru aceasta. Se consider c o populaie
statistic are un grad ridicat de omogenitate atunci cnd coeficientul de variaie este mai mic de
35%;
dac valoarea coeficientului de variaie depete 70%, atunci variaia caracteristicii este foarte
mare, media nu este reprezentativ i structura populaiei studiate este eterogen. n aceste condiii,
se impune regruparea datelor, cu respectarea riguroas a principiilor teoretice de omogenizare a
grupelor. De cele mai multe ori, n asemenea cazuri este necesar separarea populaiei statistice n
mai multe grupe omogene, care vor fi studiate separat.
x
m
2j
i 1
x j nij
m
n
i 1
x
m
i 1
x j nij
2
nj
ij
(2.26)
2
j
j 1
k
n
j 1
nj
j
(2.27)
-Variana mediilor de grup fa de media general (variana intergrupe), notat cu 2 se determin
xj
) fa de media
x
k
j 1
x nj
2
j
k
n
j 1
(2.28)
-Variana total (general) 02 se calculeaz ca o medie aritmetic ponderat a ptratelor abaterilor
valorilor fa de media populaiei statistice, dup relaia:
m
02
x
i 1
x ni
2
i
m
n
i 1
(2.29)
-covariana, ca o medie ponderat a produselor abaterilor variabilelor X i Y, astfel:
1 m k
cov x , y xi x yi y nij
n i 1 j 1
(2.30)
-Coeficientul de determinaie (R2), care arat ponderea influenei factorilor eseniali n variaia total
i se determin cu relaia:
R2
2
100
02
(2.31)
-Coeficientul de nedeterminaie (1 R2), care arat ponderea influenei factorilor aleatori, reziduali
2
1 R 2 100
0
2
p
n
n
ni
i
aritmetice, astfel:
(2.33)
Se observ, deci, c media caracteristicii alternative este chiar ponderea unitilor care posed
nsuirea analizat n totalul unitilor populaiei statistice, notat cu p. Din acest motiv, media
caracteristicii alternative poate fi considerat mrime relativ de structur, pondere sau greutate
As x Mo
(2.35)
Atunci cnd volumul eantionului studiat este foarte mare, pe baza relaiei dintre valorile
centrale, asimetria se poate exprima i n funcie de median, dup relaia:
As 3( x Me )
(2.36)
Dac media este mai mic dect modul i mediana, atunci As 0 i curba este nclinat
spre dreapta, iar dac media este mai mare dect celelalte valori centrale, atunci As 0 i curba
este nclinat spre stnga.
b.Coeficientul de asimetrie Pearson. se determin ca raport ntre asimetria absolut i
Cas
x Mo
42
2
2 2
(2.38)
4
xi x ni
i 1
(2.39)
a. Statistica clasica, statistica inferentiala. Obinerea datelor cu ajutorul observaiei totale face
obiectul statisticii clasice, n timp ce obinerea informaiilor pe baza observaiei pariale, adic
prin utilizarea unui eantion din populaia statistic, este studiat de ctre statistica inferenial.
b. Aria de aplicabilitate n economie a cercetrii infereniale este extrem de larg i cuprinde
practic toate ramurile acesteia. Astfel, n industrie, sondajul este utilizat ndeosebi n controlul
calitii procesului de producie i a produselor obinute, n cercetrile de marketing, n
determinarea productivitii muncii i salarizarea personalului, n previzionarea evoluiei
preurilor etc. n agricultur, sondajul este utilizat pentru estimarea recoltelor n funcie de
condiiile existente, n determinarea pierderilor probabile, n verificarea rezultatelor
recensmintelor animalelor etc. n comer, cercetarea prin sondaj servete la estimarea cererii de
mrfuri n funcie de variaia factorilor de influen, la cunoaterea opiunilor cumprtorilor cu
privire la produsele comercializate, la verificarea ncadrrii loturilor de produse n standardele
cerute etc.
ntr-o cercetare inferenial, deoarece exist dou categorii studiate, pe de o parte, populaia
statistic care se dorete a fi cunoscut, iar pe de alt parte, eantionul observat n vederea
obinerii unor estimaii ale parametrilor populaiei, se ntlnesc o serie de noiuni perechi, care au
acelai coninut metodologic, dar difer din punct de vedere al informaiei pe care o cuprind.
c.Estimarea, estimatorul si estimatia.
Estimarea reprezint procesul prin care se determin cu o anumit probabilitate fie sub
form de estimare punctual (o valoare unic), fie sub form de interval de ncredere valorile
necunoscute ale parametrilor unei populaii statistice, pe baza datelor nregistrate la nivelul unui
eantion extras din aceasta.
Estimatorul reprezint o funcie statistic utilizat pentru a estima un parametru necunoscut al
populaiei statistice. Acesta este rezultatul procesului de inferen sau inducie statistic i are
asociat o probabilitate ce caracterizeaz gradul su de acuratee.
utilizate n practic sunt testele (criteriile): Laplace (z), Student (t), Helmert (2) i Fisher (F).
Valorile calculate aferente acestor teste se determin conform metodologiei specifice fiecrui test
n parte.
IV. Alegerea valorii critice (tabelare) aferente testului utilizat. Fiecrui test statistic i corespunde o
repartiie de valori, prezentate, de regul, sub form tabelar. Din tabelele aferente repartiiei
respective se alege, n funcie de anumite criterii, valoarea critic sau tabelar a testului.
V. Compararea valorii calculate a testului cu cea critic i luarea deciziei. Aceasta reprezint ultima
etap a verificrii unei ipoteze statistice i const n compararea valorii calculate cu cea critic, iar
n urma acestei comparaii, conform regulilor stabilite, se decide dac ipoteza nul H0 se accept
sau se respinge. Indiferent de decizia luat, aceasta va avea o probabilitate de eroare egal cu
nivelul de semnificaie al testului, .
III.Fundamentele analizei de regresie.
1.aTipologia legaturilor dintre variabilele economice. Cu ct fenomenele studiate sunt mai
ntinse n timp i spaiu, cu att numrul factorilor de influen este mai mare i relaiile de
interdependen mai greu de identificat i cuantificat. Mai mult, factorii de influen nu sunt
numai de natur obiectiv, ci o parte a lor este de natur subiectiv, fapt care poate influena
rezultatele analizei.
b.Criteriilede clasificare ale legaturilor. ,
Dup intensitatea conexiunii cauzale distingem independen total sau lipsa de legturi,
legturi funcionale sau totale (deterministe) i legturi relative sau statistice (stochastice).
n raport cu numrul variabilelor corelate, legturile dintre variabilele economice pot fi simple,
sau multiple,
Dup sensul lor, legturile dintre variabilele economice pot fi directe, sau inverse,
In funcie de forma legturii dintre variabile, distingem legturi liniare i legturi neliniare.
Dup momentul transmiterii influenei, se deosebesc legturi concomitente sau sincrone, n cazul
crora influena variabilei factoriale asupra celei rezultative se transmite instantaneu i legturi
decalate n timp (cu time-lag), n cazul crora influenele se transmit dup trecerea unei
anumite perioade de timp de la modificarea variabilelor factoriale.
2.Analiza de regresie
a.Etapele. Analiza unui model de regresie care are la baz o legtur de tip stochastic ntre
variabila rezultativ i variabilele factoriale presupune, de regul, parcurgerea urmtoarelor
etape:
stabilirea ipotezelor de pornire i a variabilelor factoriale, endogene i exogene;
construirea corelogramei, adic a reprezentrii grafice a perechilor de valori ale variabilelor
studiate ntr-un sistem de axe de coordonate;
aproximarea, pe baza reprezentrii grafice, a formei legturii printr-un model teoretic i
scrierea ecuaiei corespunztoare modelului de regresie;
estimarea prin diverse metode a parametrilor ecuaiei de regresie.
Variabila aleatoare (i) urmeaz o distribuie independent de valorile variabilei factoriale (xi);
Valorile variabilei aleatoare nu sunt autocorelate. Acest lucru nseamn c valorile respective
sunt independente ntre ele, ceea ce implic faptul c i nregistrrile de date n eantioane au
fost independente.
3.Analiza corelatiei.
a. Analiza corelaiei variabilelor cantitative
Cel mai general indicator al corelaiei variabilelor cantitative l reprezint covariana. iv Ea se
utilizeaz ca indicator intermediar n msurarea intensitii legturii liniare ntre dou
variabile x i y i cuantific variaia simultan a acestora, conform relaiei:
cov x , y
1 n
xi x yi y
n i 1
(3.3)
Determinarea covarianei are la baz cele patru cadrane ale graficului de corelaie, separate de
valorile medii ale celor dou variabile, prezentate n figura 3.2:
Y
II
invers
direct
III
0
IV
x
n cadranul II, abaterile variabilei factoriale sunt negative, iar abaterile variabilei
rezultative sunt pozitive ( +), ceea ce sugereaz o corelaie invers;
n cadranul III, ambele abateri sunt negative ( ), ceea ce arat o corelaie direct ntre x
i y;
n cadranul IV, abaterile variabilei factoriale sunt pozitive, iar abaterile variabilei
rezultative sunt negative (+ ), ceea ce arat o corelaie invers ntre x i y.
Cu ct predomin dispunerea punctelor n jurul uneia dintre cele dou bisectoare, cu att
intensitatea legturii este mai mare. Legtura este direct dac punctele graficului de corelaie
sunt dispuse n jurul primei bisectoare i invers dac punctele sunt dispuse n jurul celei de-a
doua bisectoare.
b. Coeficientul de corelaie liniar simpl (), propus de K. Pearson, are urmtoarea relaie de calcul:
xi x yi y
cov x , y
x y
i 1
n
2
2
xi x yi y
i 1
(3.4)
Valoarea coeficientului de corelaie se situeaz ntotdeauna n intervalul [1, 1] i are urmtoarele
semnificaii:
dac valoarea coeficientului de corelaie tinde ctre 1, legtura dintre cele dou variabile este
puternic i direct;
dac valoarea coeficientului de corelaie tinde ctre 1, legtura dintre cele dou variabile este
puternic i invers;
dac valoarea coeficientului de corelaie tinde ctre zero, ntre cele dou variabile nu exist legtur
liniar simpl.
c.Raportul de corelatie(R) poate fi aplicat att pentru regresii liniare, ct i pentru
funcii neliniare, simple sau multiple.
y2 / x
2
R
1 2
y2
y
(3.5)
Raportul de corelaie ia valori n intervalul [0,1] i se interpreteaz astfel:
dac raportul de corelaie tinde ctre 1, legtura dintre cele dou variabile este puternic, adic
variaia variabilei rezultative depinde n mare msur de variaia variabilei factoriale;
dac raportul de corelaie tinde ctre 0, ntre cele dou variabile nu exist legtur.
n cazul corelaiei liniare simple, raportul de corelaie este egal cu coeficientul de corelaie n
valoare absolut (R =
), fapt ce poate fi utilizat ca test de verificare a liniaritii legturii.
e.Coeficientul de determinatie multipla(R2), determinat dup relaia:
n
R2
i 1
n
i 1
(3.10)
Coeficientul de determinaie multipl este ntotdeauna pozitiv i ia valori n intervalul [0,1], cu
urmtoarele interpretri:
dac R2 are valori apropiate de 1, nseamn c ponderea influenei variabilelor factoriale n totalul
variaiei variabilei rezultative este mare, adic exist o corelaie multipl puternic;
dac R2 are valori apropiate de 0, acest lucru nseamn c ponderea influenei variabilelor
factoriale n totalul variaiei variabilei rezultative este mic i corelaia multipl este slab sau
chiar inexistent.
n practica econometric, se consider c exist o corelaie multipl dac valoarea coeficientului de
determinaie este mai mare de 0,6 (sau 60%, n exprimare procentual), iar corelaia este foarte
puternic dac valoarea coeficientului de determinaie este mai mare de 0,8 (80% n exprimare
procentual).
n 1
2
2
R
n k 1
R2
f.Coeficientul de determinatie ajustat), notat cu
, dup relaia:
R2
2
Conform relaiei dintre coeficientul de determinaie R i coeficientul de determinaie corectat
se poate spune faptul c ntotdeauna ntre cei doi coeficieni va exista raportul de mrime: R2
R2
2
yx
1 x2 ...x k
y2
yi
yx2 x
y
i 1
y
n
variabilei rezultative i se determin dup relaia:
4.Analiza corelatiei variatiilor calitative.
Indicatorii neparametrici ai corelaiei se determin, de obicei, n funcie de rangurile perechilor de
valori ale variabilelor corelate, independent de forma legturii studiate. Cei mai importani
indicatori neparametrici de studiere a legturilor dintre variabilele economice sunt: coeficienii
de corelaie a rangurilor i coeficienii de asociere i contingen.
1. Coeficienii de corelaie a rangurilor se determin pe baza numrului de ordine (cunoscut i sub
numele de rang) a valorilor individuale aparinnd variabilelor studiate. Pentru stabilirea
rangurilor, valorile empirice ale variabilelor corelate sunt ordonate cresctor sau descresctor,
de regul, n funcie de variabila independent. Fiecrei uniti a variabilei independente,
factoriale se ataeaz rangul corespunztor variabilei dependente, rezultative, iar suma
rangurilor este ntotdeauna n(n + 1)/2. Coeficienii de corelaie a rangurilor sunt folosii atunci
cnd se analizeaz legturi dintre variabile calitative, dintre variabile calitative i cantitative
sau dintre variabile cantitative pentru care nu exist informaii suficiente pentru a stabili forma
legturii.
n aceast categorie de indicatori, n econometrie sunt cunoscui doi coeficieni: coeficientul
Spearman de corelaie a rangurilor i coeficientul Kendall de corelaie a rangurilor.
Coeficientul Spearman de corelaie a rangurilor (rs) deriv din coeficientul de corelaie liniar prin
nlocuirea valorilor empirice ale variabilelor corelate cu rangurile lor corespunztoare i se
1 2 ...xk
rS 1
6 di2
i 1
2
n n 1
determin cu relaia:
(3.14)
unde di reprezint diferena dintre rangurile variabilelor corelate (di = Rxi Ryi), iar n este numrul
perechilor (xi, yi) corelate.
Coeficientul Spearman de corelaie a rangurilor ia valori n intervalul [1, 1] i are urmtoarele
semnificaii:
dac ntre cele dou serii de ranguri exist o concordan deplin (corelaie funcional), atunci
toate diferenele di sunt nule, iar coeficientul Spearman de corelaie a rangurilor va fi egal cu
unu;
dac evoluiile rangurilor variabilelor sunt n sens invers, atunci valoarea coeficientului va fi rs
= 1.
Coeficientul Kendall de corelaie a rangurilor (r k) are la baz tot perechile de ranguri ale valorilor
individuale ale variabilelor corelate i se construiete pe definirea numrului de puncte
concordante i a celor discordante. Se consider c dou uniti sunt concordante atunci cnd xi
xj implic yi yj i c dou uniti sunt discordante atunci cnd xi xj implic yi yj. n
funcie de aceste concordane se definesc valorile dij, astfel:
dij = 1 dac i i j sunt concordante;
dij = 1 dac i i j sunt discordante;
n
S d ij
i 1 j 1
Qa
ad bc
ad bc
(3.16)
Valoarea coeficientului de asociere variaz n intervalul [1, 1] i se interpreteaz similar cu ceilali
coeficieni de corelaie.
Coeficientul de contingen (Qc) se determin conform relaiei:
Qc
ad bc
a b c d a c b d
(3.17)
i acest coeficient ia valori tot n intervalul [1, 1] i are interpretarea similar cu cea a
coeficienilor anteriori.
yi
fa de cele
n
1
2
yi yi
n 2 i 1
(4.13)
n principiu, cu ct aceast eroare este mai mic n raport cu valorile variabilei rezultative, cu att
modelul aproximeaz mai corect realitatea economic studiat. Interpretarea calitii modelului
n funcie de valoarea erorii standard a modelului este destul de relativ, fapt pentru care
utilitatea acesteia const mai degrab n a fi folosit n determinarea altor parametri statistici de
verificare a modelului;
a doua categorie reprezint abateri ale valorilor estimate ale parametrilor funciei de regresie de
la valorile lor reale i se numesc erori standard ale parametrilor modelului. Ele se determin
pentru fiecare parametru n parte. n cazul modelului unifactorial liniar, cele dou erori standard
ale parametrilor i , notate cu s , respectiv, s sunt:
n
s s
s s
xi
i 1
n
n x xi
i 1
i 1
n
2
i
(4.14)
n
n
n x xi
i 1
i 1
n
2
i
(4.15)
Cu ct aceste erori ale parametrilor modelului sunt mai mici n raport cu valorile absolute ale
parametrilor pe care i caracterizeaz, cu att valorile estimate ale parametrilor respectivi sunt
mai apropiate de cele reale.
Pentru ca modelul elaborat s fie corect din punct de vedere statistic, el trebuie s ndeplineasc
condiia de normalitate a variabilei aleatoare , prezentat n etapa formulrii ipotezelor
iniiale. Aceasta se poate verifica cu ajutorul mai multor teste statistice, dintre care mai des
utilizat este testul 2, care const n compararea frecvenelor absolute efective, ni, ataate
valorilor variabilei aleatoare, cu valorile teoretice, pi.
1.Etapele testului Durbin-Watson.
Se stabilete ipoteza nul H0 conform creia variabila aleatoare este autocorelat;
Se determin valoarea calculat a testului, d, dup relaia:
n
i i 1
i2
i2
d=
i 1
(4.18)
Se determin din tabelele statistice aferente testului Durbin Watson (anexa 5) dou valori
tabelare, una inferioar i alta superioar, notate dL i dU . Valorile respective se iau din tabele
n funcie de nivelul de semnificaie al testului, , n funcie de numrul de observaii, N,
precum i n raport de numrul de variabile factoriale, k (care n cazul modelului unifactorial
este egal cu unu);
Se compar d cu valorile tabelare i pot rezulta trei situaii:
dac d dL, nseamn c ipoteza autocorelrii variabilei aleatoare se accept, adic valorile
variabilei aleatoare sunt dependente una fa de cealalt, ceea ce implic faptul c i
nregistrrile de date n eantioane sunt dependente unele de altele i modelul trebuie corectat;
dac dL d dU, testul este neconcludent i trebuie refcut pe alte eantioane de date;
dac d > dU, nseamn c ipoteza autocorelrii variabilei aleatoare se respinge, adic valorile
variabilei aleatoare sunt independente ntre ele, ceea ce implic faptul c i nregistrrile de
date n eantioane au fost independente. n aceast situaie, modelul este corect din punct de
vedere statistic. n practica econometric, avnd n vedere faptul c, rareori, valorile tabelare
ale acestui test depesc valoarea 2 se spune c dac valoarea calculat d este mai mare dect
2, atunci modelul este corect. Pentru rigurozitate tiinific, ns, este de preferat s se trag
concluziile dup compararea lui d cu valorile tabelare aferente testului Durbin Watson.
4.Modelul hiperbolic.
Ajustarea cu ajutorul hiperbolei se utilizeaz atunci cnd norul de puncte urmeaz o traiectorie de
tip hiperbol. n acest caz, dependena dintre cele dou variabile poate fi invers sau direct, iar
reprezentarea grafic este de forma:
yi
1
i
xi
yi xi' i
n n x' n y
i i
i 1
i 1
i 1
i 1
x' x'
i
i
xi' yi
i 1
(4.46)
yi
xi
Ajustarea prin hiperbol se recomand atunci cnd variabila rezultativ y scade, respectiv, crete
asimptotic ctre o valoare real dat de parametrul , fapt ilustrat i de figura 4.3:
Analiza de corelaie n cazul modelului hiperbolic se realizeaz cu ajutorul raportului de corelaie R
i a coeficientului de determinaie simpl R2.
Verificarea statistic a modelului i discuiile referitoare la homoscedasticitatea variabilei aleatoare
sunt similare cu cele prezentate la modelul unifactorial liniar.
n funcie de reprezentarea grafic a legturii, pot fi utilizate variante ale funciei hiperbolice, care
y
1
1 y
x
y e
x
x
au la baz diverse ecuaii:
;
;
etc.
2.Homoscedasticitatea si heteroscedasticitate.
Homoscedasticitate- distribuia variabilei aleatoare i are aceeai varian, independent de valorile
variabilei factoriale xi, variana lui i rmne constant (graficul repartiiei normale prezint
aceeai mprtiere a valorilor i) indiferent de valorile pe care le ia xi. Acest lucru sugereaz
absena oricrei legturi ntre variabila aleatoare i variabila factorial, condiie esenial
aplicrii metodei celor mai mici ptrate.
Heteroscedasticitate-Dac cele dou sunt corelate, nseamn c s-au pierdut din vedere factori de
influen importani, care trebuie introdui n model.
n aceast situaie, nseamn c variana variabilei aleatoare se modific n raport cu variaia
variabilei factoriale xi, variana lui i se modific, este cresctoare (graficul repartiiei normale
prezint mprtieri tot mai mari ale valorilor i) pe msur ce xi variaz. Acest lucru nseamn
c variabila aleatoare este normal distribuit, de medie nul, E(i) = 0, i varian Var(i) = i2,
unde i2 nu este constant.
n aceste condiii, estimarea parametrilor modelului cu metoda celor mai mici ptrate va accentua
importana valorilor lui x care determin variaii mai mari ale lui i i va minimiza influena
valorilor lui x care determin variaii mai mici ale lui i.
5. Modelul parabolic
yi
2 0
2 0
xi
Acest model, numit i modelul ptratic, este folosit, de regul, atunci cnd ritmul de evoluie al
caracteristicii urmeaz o curb de tip U, cu vrfurile n jos sau n sus. Pentru exprimarea
modelului parabolic se utilizeaz funcia de gradul doi, dup relaia:
yi = + 1xi +2xi2 + i
(4.47)
Reprezentarea grafic a unei funcii parabolice este urmtoarea:
Figura 4.4. Reprezentarea grafic a funciei parabolice
i n cazul acestei funcii, pentru estimarea parametrilor , 1 i 2 se poate aplica metoda celor mai
mici ptrate, rezultnd urmtorul sistem de trei ecuaii cu trei necunoscute:
n n x n x 2 n y
i
1 i
2 i
i 1
i 1
i 1
i 1
i 1
i 1
i 1
i 1
i 1
i 1
2
3
xi 1 xi 2 xi xi yi
x 2 x 3 x 4 n x 2 y
i
i i
1 i
2 i
i 1
(4.48)
Dac 2 0, vrful parabolei va fi dat de minimul funciei (parabola este cu ramurile n sus), iar
dac 2 0, vrful parabolei este dat de maximul funciei (parabola este cu ramurile n jos).
Analiza de corelaie n cazul modelului parabolic, similar cu modelul hiperbolic, are la baz
determinarea i interpretarea raportului de corelaie R i a coeficientului de determinaie simpl
R2.
Verificarea statistic a modelului i discuiile referitoare la homoscedasticitatea variabilei aleatoare
sunt, de asemenea, similare cu cele prezentate la modelul unifactorial liniar.
Modelul parabolic are, la rndul su, foarte multe variante de exprimare, cum ar fi:
lg y 1 x 2 x 2 y x 2 y e
;
;
1 x 2 x 2
y 1 lg x 2 lg x
etc.
yi x
yi
0
0
(4.49)
1
xi
n cazul acestei funcii, pentru a estima parametrii i este necesar, n primul rnd, s se
liniarizeze funcia prin logaritmare, astfel:
log yi = log + xi log
(4.50)
Apoi, se aplic metoda celor mai mici ptrate i se obine sistemul de ecuaii:
n log log n x n log y
i
i
i 1
i 1
n
n
n
log xi log xi2 xi log yi
i 1
i 1
i 1
(4.51)
Acest model se utilizeaz, de obicei, atunci cnd unei variaii n progresie aritmetic a variabilei
factoriale x i corespunde o variaie n progresie geometric a variabilei rezultative y.
Analiza de corelaie n cazul modelului exponenial, similar cu celelalte modele neliniare, se
realizeaz prin determinarea i interpretarea raportului de corelaie R i a coeficientului de
determinaie simpl R2.
Verificarea statistic a modelului i discuiile referitoare la homoscedasticitatea variabilei aleatoare
sunt, ca i n celelalte cazuri neliniare, similare cu cele prezentate la modelul unifactorial liniar.
Modelul exponenial are, la rndul su, numeroase variante de exprimare, cum ar fi:
y e x y e x
;
etc.
Estimarea parametrilor regresiei liniare multiple se realizeaz tot cu metoda celor mai mici
ptrate, utilizat i la modelele unifactoriale. Aplicarea ei pornete de la aceleai ipoteze
fundamentale:
datele privind variabila rezultativ i variabilele factoriale sunt obinute fr erori de observare
sau msurare;
variabila aleatoare sau rezidual i este de distribuie normal, de medie nul (E(i) = 0) i de
varian constant i diferit de zero (homoscedastic);
variabila aleatoare i urmeaz o distribuie independent de valorile variabilelor factoriale x1i,
x2i, , xki;
variabilele factoriale nu sunt corelate liniar unele fa de celelalte (ipoteza absenei
multicoliniaritii);
valorile variabilei aleatoare nu sunt autocorelate.
Obinerea valorilor estimate ale parametrilor , 1, 2, , k nseamn finalizarea analizei de
regresie a modelului multifactorial liniar.
Analiza corelaiei n cazul modelului multifactorial liniar cu variabile cantitative se realizeaz cu
ajutorul raportului de corelaie multipl, a coeficientului de determinaie multipl, precum i a
coeficienilor de corelaie i determinaie parial .
Dac modelul multifactorial conine variabile calitative, se utilizeaz metodele neparametrice de
msurare a intensitii legturii
1.Modele multifactoriale liniare.
a.Functiile exponentiale si putere.
Funciile exponeniale pot fi, la rndul lor, de diverse forme, cele mai utilizate fiind cele care pot
fi uor liniarizate prin diverse transformri. O funcie exponenial multifactorial cunoscut
este de forma: y = 1 x1 2 x2 k xk
(5.24)
Liniarizarea acestei funcii se realizeaz prin logaritmare:
log y = log + x1 log 1 + + xk log k + log
(5.25)
n acest fel, modelul este unul multifactorial liniar cu parametrii log , log 1, , log k, care pot
fi estimai cu metoda celor mai mici ptrate.
O alt funcie exponenial utilizat destul de des n econometrie este de forma:
y e x1 e x 2 ... e xk
1
(5.26)
Liniarizarea acestei funcii se realizeaz prin logaritmare cu logaritm natural i se obine:
ln y = ln + 1 x1 + 2 x2 + + k xk + ln
(5.27)
Din nou se ajunge la un model multifactorial liniar care poate fi analizat cu metodele cunoscute.
A doua categorie de funcii multifactoriale neliniare sunt funciile de putere. Ecuaia cea mai
cunoscut care st la baza unui model de putere este urmtoarea:
y = x1 1 x2 2 xk k
(5.28)
Liniarizarea unei astfel de funcii se realizeaz tot prin logaritmare, rezultnd o ecuaie de forma:
log y = log + 1 log x1 + + k log xk + log
(5.29)
Similar cu funciile exponeniale, n urma efecturii operaiunii de logaritmare, estimarea
parametrilor funciei rezultate se poate realiza tot cu metoda celor mai mici ptrate.
b.Functii de productie Cobb Douglas. are la baz urmtoarea ecuaie: Y = L K
n care: Y reprezint venitul realizat la nivelul economiei naionale pe timp de un an, cuantificat
iniial de ctre autori cu ajutorul venitului naional, iar, mai recent, prin produsul naional brut
sau produsul intern brut ;
L - este fora de munc utilizat n economie n timpul unui an, cuantificat prin cuantumul
salariilor;
K - reprezint capitalul fix productiv aferent aceleiai perioade;
i sunt coeficienii de elasticitate ai venitului n raport cu L i K.
Prin logaritmare, rezult funcia liniar de forma:
log Y = log L + log K
(5.31)
Estimatorii parametrilor i se obin prin aplicarea metodei celor mai mici ptrate
Valoarea estimat pentru elasticitatea arat, n valoare procentual, cu ct se modific venitul Y,
atunci cnd fora de munc L se modific cu o unitate.
Similar, valoarea estimat a elasticitii arat, n valoare procentual, cu ct se modific venitul
Y, atunci cnd capitalul fix K se modific cu o unitate.
Iniial, autorii au ajuns la concluzia c, pe termen lung, ntr-o economie deschis de pia, suma
elasticitilor i tinde ctre 1, ipotez infirmat, ns, de cercetri ulterioarevi.
VI.Modele econometrice bazate pe factorul timp.
1.Analiza eco-trica a evolutiei in timp a variabilelor economice
Reprezint o latur distinct a cercetrii variabilelor economice cu ajutorul metodelor cantitative.
Prezint cteva caracteristici fundamentale:
1. Variabilitatea termenilor unei serii de timp
2. Omogenitatea termenilor
3. Periodicitatea termenilor
4. Interdependena termenilor seriei de timp, care nseamn existena unor legturi ntre valorile
nregistrate la perioade diferite de timp, adic relevarea unor interdependene ntre nivelul
curent al variabilei i nivelurile nregistrate n perioadele anterioare.
Un element fundamental al analizei econometrice cu ajutorul seriilor de timp l reprezint
alegerea lungimii seriei de date, de regul, fiind necesar un numr suficient de mare de
termeni, astfel nct s poat fi aplicate principiile legii numerelor mari i s poat fi
fundamentate corect previziunile pe diferite perioade de timp.
Un alt element fundamental l reprezint alegerea formei optime de analiz a seriei de date. Din
acest punct de vedere, cea mai utilizat modalitate de analiz a seriilor de timp o reprezint
descompunerea evoluiei seriei dinamice pe componente determinate de aciunea diferiilor
factori de influen.
a.Componentele unei serii dinamice.
1.Trendul sau tendina central Tt, care reflect legitatea specific de evoluie a variabilelor
economice studiate pe o perioad lung de timp, fcnd abstracie de abaterile fa de nivelul
mediu, respectiv, de erorile sau valorile reziduale datorate influenei factorilor aleatori.
Identificarea trendului unei serii de timp se realizeaz cu ajutorul a diverse metode
econometrice, cunoscute generic sub numele de ajustarea seriilor de timp;
2.Variaiile ciclice Ct, care reprezint oscilaiile interanuale n jurul tendinei centrale cu un
caracter nesistematic, n sensul c att intervalele la care oscilaiile se manifest, ct i
intensitatea lor, sunt diferite de-a lungul timpului;
3.Variaiile sezoniere St sunt acea component sistematic ce se manifest prin oscilaii de
perioad mai mic sau cel mult egal cu un an, repetabile n timp. Sezonalitatea se manifest
sub forma unor abateri de la medie care apar regulat n timpul unui an i are un caracter mai
mult sau mai puin pregnant n funcie de specificul domeniului studiat;
4.Variaiile aleatoare sau reziduale (perturbatoare) t apar datorit unor factori necuantificabili
i cu aciuni absolut imprevizibile. n funcie de proprietile atribuite variabilei aleatoare pot
fi aplicate anumite tehnici de estimare i previziune a comportamentului seriei de date.
b.Explicarea relatiei:
yt = Tt + Ct + St + t ,
(6.2)
Schema cea mai simpl i mai des utilizat este schema aditiv, n care cele patru componente
ale seriei se nsumeaz direct,
unde yt reprezint valoarea variabilei studiate la momentul t.
Primele dou componente, trendul i variaiile ciclice, se pot analiza mpreun sub forma
componentei extrasezoniere Dt, dup relaia:
Dt = Tt + Ct
(6.3)
c.Schema multiplicativa.
are dou variante:
1. Atunci cnd componenta sezonier este proporional cu componenta extrasezonier, schema de
compunere se prezint n felul urmtor:
yt = Dt + Dt St + t = Dt (1 + St) + t
(6.4)
2. Atunci cnd componenta aleatoare este proporional cu suma celorlalte componente, schema
este urmtoarea:
yt = Dt (1 + St)(1 + t)
(6.5)
d.Serii de timp de intervale si serii de timp de momente(discrete).
Astfel, n raport de perioada de timp la care se refer datele, seriile de timp pot fi:
serii de timp de intervale (continue), n cazul crora fiecare nivel al caracteristicii se refer la o
perioad de timp. Seriile pe intervale se utilizeaz, de regul, n cazul variabilelor exprimate n
uniti monetare i au drept trstur esenial faptul c termenii lor sunt nsumabili (de
exemplu, profitul din anul 2005 poate fi adunat cu profitul aceleiai firme nregistrat n anii
2004, 2003 .a.m.d.) ;
serii de timp de momente (discrete), n cazul crora fiecare nivel al caracteristicii se refer la
un moment dat. n aceast situaie, termenii seriei nu sunt nsumabili, deoarece conin
nregistrri repetate (de exemplu, populaia Romniei din anul 2005 nu poate fi nsumat cu
populaia Romniei din anul 2004, datorit faptului c cele dou valori se includ una pe
cealalt).
e.
serii de timp bazate pe indicatori absolui, care reprezint forma
fundamental de exprimare a unei serii de timp i pe baza creia se pot
obine indicatori generalizatori afereni ntregii perioade studiate;
serii de timp bazate pe indicatori relativi, care arat variaii de la o
perioad la alta, exprimate, de obicei, sub form procentual. n cazul
acestei modaliti de exprimare este foarte important alegerea i
specificarea clar a perioadei luate ca baz de referin;
serii de timp bazate pe indicatori medii, care sunt exprimate sub forma
unor indicatori calculai ca medii, folosite ndeosebi atunci cnd se
analizeaz fenomene care se produc n anumite perioade de timp (media
anual sau lunar a produciei, numrul mediu anual de lucrtori etc.) sau n
anumite uniti de spaiu (recolta medie la hectar, producia medie a unui
utilaj etc.).
2.Functii de timp - Prima categorie de metode care folosesc modele matematice si
Exprima trendul unei serii de timp sub forma unei funcii de forma:
yt = f(t) + t
(6.9)
n care, yt reprezint valorile seriei de date studiate, considerate variabila rezultativ sau
dependent, t este factorul timp, privit ca variabil factorial, independent, f reprezint funcia
matematic (determinist) care modeleaz evoluia n timp a fenomenului studiat, iar t este
variabila aleatoare, care arat influena factorilor aleatori la momentul t.
Utilizarea unei funcii analitice de determinare a trendului stabilete cu o exactitate mai mare sau
mai mic legea de dezvoltare pe termen lung a fenomenului sau procesului economic studiat, n
funcie de mprtierea valorilor n jurul tendinei centrale.
Tendina de variaie se aproximeaz, de cele mai multe ori, cu ajutorul funciilor ale cror curbe i
ecuaii de estimare au fost prezentate n capitolul de modele unifactoriale, variabila x din
modelele respective devenind acum factorul timp t. Parametrii acestor funcii de timp, similar cu
cei ai modelelor de regresie, se estimeaz n cele mai multe cazuri cu metoda celor mai mici
ptrate.
calculai
s fie ct mai mic (
).
b.Functii neliniare de timp.
este acea funcie a crei pant, dat de parametrul , nu este constant pentru orice valoare a lui t.
Estimarea parametrilor unei astfel de funcii se realizeaz fie direct prin metoda celor mai mici
ptrate, fie prin diverse transformri care duc la liniarizarea funciei, fie prin utilizarea unor
metode numerice de estimare.
n econometrie, cele mai cunoscute i mai des ntlnite funcii de timp neliniare sunt: funcia
hiperbolic, funcia parabolic i funcia exponenial.
Existena sau absena unei evoluii liniare a variabilei rezultativ yt se probeaz prin verificarea
egalitii dintre raportul de corelaie R i valoarea absolut a coeficientului de corelaie liniar
simpl, , astfel: dac cei doi parametri ai corelaiei sunt egali (R =
iar dac cei doi parametri sunt diferii (R
n n t' n y
t 1
t 1
t 1
t 1
t' t'
t' yt
t 1
(6.14)
Ajustarea prin hiperbol se recomand atunci cnd variabila rezultativ yt scade, respectiv, crete
asimptotic ctre o valoare real dat de parametrul al funciei.
Analiza de corelaie n cazul modelului hiperbolic se realizeaz cu ajutorul raportului de corelaie
R i a coeficientului de determinaie simpl R2, a cror interpretare este similar cu cele
prezentate la funcia de timp liniar.
d.Functia de timp parabolica.
este folosit, de regul, atunci cnd ritmul de evoluie al variabilei studiate urmeaz o curb de tip
U, cu vrfurile n jos sau n sus. Pentru exprimarea funciei de timp parabolic se utilizeaz funcia
de gradul doi, dup relaia:
yt = + 1 t +2 t2 + t
(6.15)
Reprezentarea grafic a unei funcii de timp parabolice este dat de figura 4.4 din capitolul 4.
i n cazul acestei funcii, pentru estimarea parametrilor , 1 i 2 se poate aplica metoda celor
mai mici ptrate, rezultnd urmtorul sistem de trei ecuaii cu trei necunoscute:
n n t n t 2 n y
t
1
2
t 1
t 1
t 1
t 1
t 1
t 1
t 1
t 1
2
3
t 1 t 2 t t yt
t 1
t 1
t 2 t 3 t 4 n t 2 y
1
2
t
t 1
(6.16)
Dac 2 0, vrful parabolei va fi dat de minimul funciei (parabola este cu ramurile n sus), iar
dac 2 0, vrful parabolei este dat de maximul funciei (parabola este cu ramurile n jos).
e.Functia de timp exponentiala.
este utilizat atunci cnd norul de puncte are un trend curbiliniu cresctor sau descresctor, de tip
exponenial. Ecuaia funciei este de forma:
yt t
(6.17)
Reprezentarea grafic a funciei exponeniale este dat de figura 4.5 din cadrul capitolului 4.
n cazul acestei funcii, pentru a estima parametrii i este necesar, n primul rnd, s se
liniarizeze funcia prin logaritmare, astfel:
log yt = log + t log
(6.18)
Pe ecuaia dat de relaia 6.18 se aplic metoda celor mai mici ptrate i se obine sistemul de
ecuaii:
n log log n t n log y
t 1
t 1
n
n
n
log t log t 2 t log yt
t 1
t 1
t 1
(6.19)
Acest model se utilizeaz, de obicei, atunci cnd variabila rezultativ yt prezint o evoluie n timp
de tip progresie geometric.
Analiza de corelaie n cazul funciei exponenial, similar cu celelalte funcii de timp neliniare, se
realizeaz prin determinarea i interpretarea raportului de corelaie R i a coeficientului de
determinaie simpl R2.
Verificarea statistic a modelului este, ca i n celelalte cazuri neliniare, similar cu cele prezentate
la modelul unifactorial liniar.
3.Modelul autoregresiv de ordin K
este un model econometric care presupune c ntre nivelul curent al variabilei studiate i
comportamentul su anterior exist o legtur liniar sau neliniar. n funcie de numrul de
perioade cu care analiza este decalat n urm exist mai multe tipuri de modele, ncepnd cu
modelul autoregresiv de ordinul nti n cazul cruia efectul n timp este analizat pe o perioad
n urm i continund cu modelele de ordine superioare doi, trei, etc. n cazul crora
efectul n timp este studiat pe k perioade n urm.
Modelul general care studiaz caracterul autoregresiv al unei variabile economice se numete
model autoregresiv de ordinul k AR(k) i are la baz urmtoarea ecuaie:
yt = + 1 yt1 + 2 yt2 + + k ytk + t
(6.3.5)
n care: yt reprezint nivelul curent al variabilei rezultative;
yt1, yt2, , ytk sunt nivelurile decalate cu una, dou, respectiv, k perioade n urm ale variabilei
studiate;
, 1, , k sunt parametrii modelului autoregresiv de ordinul k;
t este variabila aleatoare.
Cu ct influena nivelurilor anterioare asupra nivelului curent al variabilei studiate este mai mare,
cu att sunt mai importante anticipaiile operatorilor n determinarea comportamentului
variabilei respective. Dac modelul autoregresiv arat o legtur puternic ntre nivelurile
anterioare i nivelul curent, nseamn c o proporie semnificativ a evoluiei variabilei studiate
se bazeaz pe anticipaii i mai puin pe influenele obiective pe care aceasta le sufer din partea
celorlalte variabile factoriale.
Parametrii unui model autoregresiv de ordin k se estimeaz direct cu metoda celor mai mici
ptrate, dac valoarea lui k este suficient de mic nct s existe informaii despre perioadele
anterioare analizate.
i
iiD.M. Levine, D. Stephan, T.C. Krehbiel, M.L. Berenson, Statistics for Managers
using Microsoft Excel, Third Edition, Prentice Hall, 2002, pag. 112 114
iiiBerenson M.L., Levine D.M., Krehbiel T.C., Basic Busines Statistics. Concepts
2003, pag. 93 96
viE. Pecican, op. cit., pag. 135 137