Documente Academic
Documente Profesional
Documente Cultură
CAPITOLUL 23
ECONOMETRIE
raportul de determinaţie multiplă R2 are valoarea strict mai mică decât unitatea, ca
semn al faptului că variabilitatea variabilei efect Y nu se formează doar sub
influenţa factorilor semnificativi, ci și sub influenţa factorilor accidentali.
Prin felul particular în care se manifestă, relaţiile de cauzalitate dintre feno-
menele şi procesele din economie au natura unor relaţii stohastice. Din aceste
motiv, modelele econometrice, indiferent de natura şi forma lor, vizează în exclu-
sivitate descrierea relaţiilor cauzale de tip stohastic.
,
unde descrie factori semnificativi și observabili, descrie factori obser-
vabili cu natură sezonieră, iar descrie factori neobservabili, numiţi şocuri sau
inovaţii.
În situaţiile în care mulţimea factorilor cauzali angrenaţi în relaţiile de cauza-
litate temporale include doar timpul, factori cauzali observabili şi factori sezonieri,
modelele utilizate pentru descrierea acestor relaţii capătă forma generală:
,
astfel încât aceste modele pot fi perfect asimilate modelelor de regresie clasice.
f1
f4
f3
f2 fi
(R1)
c5 cN c3 c1 c4 c2 ci cN-1c6
f5 f6
cmin cmax
fN-1
fN
şi varianţa de selecţie:
,
care sunt estimatori pentru media şi varianţa unei populaţii statistice.
Ca funcţii de elementele eşantionului aleator, estimatorii pot fi evaluaţi în
raport cu orice eşantion dat de observaţii. Valoarea obţinută din evaluarea unui
estimator pe un eşantion particular de observaţii, se numeşte estimaţie.
Estimaţia este o valoare numerică, rezultată din evaluarea unui estimator pe
mulţimea de observaţii reprezentate de un eşantion, respectiv o valoare reală defi-
nită sub forma:
,
unde reprezintă valorile numerice din eşantionul de observaţii.
Calitatea estimaţiilor obţinute pentru anumiţi parametri, adică măsura în care
acestea reuşesc să aproximeze parametrii populaţiei, depinde de trei factori impor-
tanţi: calitatea datelor disponibile la nivel de eşantion, proprietăţile statistice ale
estimatorilor şi calitatea metodei de estimare utilizată.
Printre cele mai importante proprietăţi calitative ale estimatorilor, de care
depinde măsura în care aceştia pot aproxima valorile adevărate ale parametrilor,
menţionăm: nedeplasarea, consistenţa, liniaritatea şi eficienţa.
Caracteristici şi variabile
Econometria are ca scop modelarea legăturilor cauzale manifestate la nivelul
unor fenomene sau caracteristici pe care le posedă unitățile sau elementele unei
colectivităţi, numite generic unităţi observaţionale.
Din perspectiva informaţiei statistice, o colectivitate prezintă interes direct nu
din punct de vedere al elementelor sale ca atare, ci din punct de vedere al trăsă-
turilor, al proprietăţilor pe care le au aceste elemente. Proprietăţile specifice pe
care le pot avea elementele aparţinând unei colectivităţi oarecare, sunt numite
caracteristici sau atribute, fiecare caracteristică de interes a elementelor unei
colectivităţi, definind o dimensiune a colectivităţii respective.
Este important să precizăm că orice caracteristică luată în considerare în ana-
liza econometrică trebuie să fie comună tuturor unităţilor colectivităţii analizate,
existând doar diferenţe de valoare ale acestei caracteristici de la o unitate a colec-
tivităţii la alta. Aceste diferenţe definesc aşa-numita variabilitate a caracteristicii
respective, peste mulţimea de unităţi observaţionale.
Caracteristicile sau atributele unităţilor elementare ce alcătuiesc o anumită
colectivitate, sunt elemente ale unei realităţi date, de natură empirică. De regulă, în
activitatea ştiinţifică nu se operează cu elementele acestei realităţii ca atare, ci cu
simboluri, care sunt reprezentări abstracte ale realităţii. În econometrie reprezen-
tarea simbolică a caracteristicilor empirice ale elementelor unei colectivităţi, este
asigurată prin intermediul conceptului de variabilă (aleatoare).
În cadrul demersurilor ştiinţifice care au ca scop investigarea fenomenelor şi
proceselor din lumea reală, caracteristicile unităţilor unei colectivităţi sunt reflec-
tate prin intermediul conceptului de variabilă, tocmai pentru a sugera natura
schim-bătoare a acestora, variabilitatea lor în timp şi spaţiu.
Variabila reprezintă o abstractizare a mulţimii de valori posibile pe care le
poate înregistra o caracteristică, de-a lungul tuturor unităţilor unei colectivităţi.
Natura variabilelor implicate într-o analiză econometrică este determinată în
mod direct de natura caracteristicilor pe care le au obiectele supuse analizei. Din
acest punct de vedere, variabilele care intervin într-o analiză econometrică pot fi
structurate sub forma unor tipuri diferite, în funcţie de anumite criterii de diferen-
ţiere. Tipul variabilelor este foarte important, deoarece atât procedurile de analiză
econometrică, cât şi posibilităţile de interpretare a rezultatelor obţinute, sunt
substanţial diferite în raport cu natura variabilelor implicate în analiză.
Printre cele mai importante categorii de variabile întâlnite în econometrie se
numără variabilele de tip cantitativ şi calitativ, variabilele de tip discret şi conti-
nuu, variabilele endogene şi exogene etc. Clasificarea variabilelor în aceste catego-
rii, corespunde unor criterii specifice de clasificare, cum ar fi: natura valorilor
variabilelor, natura mulţimilor de valori ale variabilelor, rolul pe care îl au varia-
bilele în cadrul modelelor etc.
Ca şi caracteristicile unităților la care se referă, variabilele pot fi de împărţite,
în funcţie de natura valorilor pe care acestea le iau, în două mari categorii: varia-
bile calitative şi variabile cantitative.
Variabilele calitative sunt variabile care diferă prin tip, care se referă la
proprietăţi nenumerice ale unităţilor elementare aparţinând unei colectivităţi şi care
nu pot fi exprimate sub o formă numerică semnificativă. Valorile variabilelor de tip
calitativ se numesc alternative, variante, modalităţi sau categorii, motiv pentru
care variabilele calitative se mai numesc şi variabile categoriale. În funcţie de
numărul de valori posibile pe care le pot lua, variabilele categoriale sunt de două
tipuri: variabile bicategoriale şi variabile multicategoriale. Ca exemple de varia-
bile calitative putem menţiona: sexul, opţiunea cumpărătorului, opţiunea alegăto-
rului, profesia, starea civilă etc. Variabilele cantitative sunt variabile care diferă
prin mărime, care se referă la proprietăţi numerice ale unităţilor elementare dintr-o
colectivitate şi care sunt exprimate în unităţi numerice de lungime, de frecvenţă, de
volum, de greutate, de valoare etc. Ca exemple de variabile cantitative putem
menţiona: preţul unui produs, cheltuielile lunare ale unei familii, salariul mediu
lunar, venitul naţional, volumul fizic al producţiei etc.
Un alt criteriu de clasificare a variabilelor este cel al naturii mulţimii în care
acestea pot lua valori. Din acest punct de vedere, variabilele se împart în două
categorii: variabile de tip discret şi variabile de tip continuu.
Variabilele de tip discret sunt variabile care pot lua valori într-o mulţime
finită, indiferent de natura calitativă sau cantitativă a acestora. Variabilele de tip
discret pot să fie atât variabile calitative, cât şi variabile cantitative, cu condiţia ca
în cazul ultimelor, numărul de valori posibile să fie finit. Ca exemple de variabile
de tip discret putem menţiona: categoria de venit, nivelul de instruire, vârsta,
numărul de salariaţi, numărul de cumpărători, numărul de piese defecte, numărul
de firme falimentare, numărul de tranzacţii la bursă etc. Variabilele de tip
continuu sunt variabile numerice pentru care mulţimea de valori posibile este o
mulțime de numere reale, care are puterea continuului.Ca exemple de variabile de
tip continuu putem menționa: masa monetară dintr-o economie, prețul unui bun
economic, rata inflației, rata șomajului, cursul de schimb al monedei naționale etc.
Un alt criteriu de clasificare a variabilelor este cel reprezentat de rolul
acestora în contextul relaţiilor de cauzalitate şi, implicit, în cadrul modelelor care
descriu relaţii de acest fel. Din acest punct de vedere, variabilele se împart în trei
categorii: variabile endogene, variabile exogene şi variabile fictive.
Variabilele endogene sunt variabile care exprimă fenomene de tip efect sau
rezultat, considerate a se forma sub influenţa unor alte fenomene şi apar în cadrul
modelelor econometrice ca variabile dependente. Variabilele exogene sunt varia-
bile care simbolizează fenomene de tip cauze, care, prin modul lor de manifestare,
determină comportamentul unui fenomen de tip efect. Atât variabilele endogene,
cât şi variabilele exogene, pot să fie variabile de tip calitativ sau variabile de tip
cantitativ. Variabilele fictive sunt variabile artificiale, care sunt utilizate în con-
strucția modelelor econometrice cu scopul de a asigura flexibilizarea modelelor sau
cu scopul de a cuantifica influențe de tip sezonier. De regulă, variabilele fictive
sunt variabile de tip binar, adică variabile care pot lua două valori posibile. În cazul
în care varibilele fictive sunt incluse într-un model cu scopul de a descrie sezo-
nalitatea, numărul acestora şi valorile lor posibile sunt determinate de numărul de
perioade din intervalul de ciclitate.
Variabilele pot fi clasificate şi în funcţie de tipul scalelor pe care sunt măsurate
valorile acestor variabile. Din acest punct de vedere, există patru tipuri de variabile,
respectiv variabile nominale sau categoriale, variabile ordinale, variabile de tip
interval şi variabile de tip raport, tipuri ce corespund scalelor nominală, ordinală,
interval sau raport.
1
§ 23.3 Baza informaţională utilizată în econometrie
Elementele care constituie intrările pentru orice metodă, tehnică sau procedură
econometrică, respectiv “materia primă” a econometriei, sunt reprezentate de
datele (primare) referitoare la starea şi evoluţia fenomenelor din economia reală.
Datele reprezintă expresii cantitative sau calitative ale manifestării unor feno-
mene din realitatea înconjurătoare, rezultate în urma unor procese de observare,
măsurare şi înregistrare specifice. Eterogenitatea fenomenelor economice şi a ma-
nifestării lor face ca datele referitoare la aceste fenomene să fie extrem de variate.
Conceptul de dată este totdeauna asociat cu fenomenele care au natură obser-
vabilă, adică cu fenomenele ale căror manifestări au un anumit grad de “vizibi-
litate” şi care pot fi supuse unor procese de măsurare adecvate. Fenomenul obser-
vabil este acel fenomen ale cărui manifestări directe sunt vizibile şi pot fi supuse
unui proces direct de măsurare. Concret, conceptul de fenomen observabil este
asociat cu ideea de caracteristică măsurabilă.
Datele pot fi privite ca reprezentând semnale sau mesaje provenite din rea-
litatea înconjurătoare, exprimate sub o formă numerică sau nenumerică, pe baza
cărora receptorul acestora îşi poate forma o anumită imagine despre respectiva
realitate şi poate ajunge la un anumit grad de cunoaştere a acelei realităţi. Imaginea
formată este cu atât mai fidelă în raport cu realitatea, cu cât cantitatea semnalelor
sau mesajelor este mai mare şi cu cât calitatea acestora este mai ridicată, respectiv
cu cât acestea sunt mai puţin afectate de erori, perturbaţii şi distorsiuni.
Datele se referă la diferite aspecte informaţionale legate de existenţa şi mani-
festarea fenomenelor şi proceselor reale, cunosc o mare varietate de tipuri şi pot fi
obţinute din surse diferite. Datele exprimă, într-o formă brută, o mulţime de stări şi
evoluţii concrete din realitatea economică investigată şi sunt rezultatul unui labo-
rios proces de observare, măsurare şi evaluare, proces în care intervin o serie de
norme, principii, metodologii şi instrumente.
Datele pot să difere în funcţie de mai mulţi factori, cum ar fi: sursa care le-a
generat, contextul în care sunt obținute, tipul şi natura lor. În primul rând, indi-
ferent de varietatea lor, datele pot fi grupate în trei categorii fundamentale: date
cantitative, date calitative şi date mixte. Deşi datele calitative sunt de tip nenume-
ric, aceastea pot fi însă transformate şi exprimate sub formă numerică, cantitativă,
prin codificări adecvate.
Din punct de vedere al naturii contextului în care datele sunt obţinute, al
modului în care investigatorul controlează sau nu procesul de obţinere a datelor,
datele pot fi grupate în două categorii: date experimentale şi date observaţionale
sau date non-experimentale.
Datele experimentale sunt datele obţinute prin organizarea unor experimente
de tip controlat, desfăşurate în condiţii bine determinate şi prestabilite. Contextul
obţinerii datelor de tip experimental este restricţionat prin impunerea unor reguli
specifice. În general, organizarea unui experiment controlat presupune, în primul
rând, izolarea fenomenelor şi proceselor studiate, precum şi eliminarea, în cât mai
mare măsură, a influenţelor externe, cu natură accidentală, care nu prezintă interes
pentru analiză. Datele experimentale sunt caracteristice doar anumitor domenii de
cercetare, şi anume acelor domenii în care pot fi organizate experimente cu caracter
controlat. Spre deosebire de aceste domenii, în domeniul economic experimentarea
poate fi efectuată foarte rar şi numai în situaţii excepţionale.
Datele observaţionale, care se mai numesc şi date non-experimentale, sunt
datele obţinute prin “observarea” fenomenelor şi proceselor în mişcarea lor natu-
rală, liberă, fără impunerea unor restricţii și fără a se exercita un control de un
anumit fel asupra fenomenelor şi proceselor investigate. Obţinerea datelor de tip
non-experimental, reprezintă rezultatul observării pasive, constatării. Intervenţia
observatorului, a celui care face observarea şi măsurătorile, este de tip ex-post și
are loc după ce desfăşurarea fenomenelor şi proceselor reale a avut loc. Datele de
tip observaţional sau non-experimental sunt datele specifice domeniului economic,
domeniu în care organizarea de experimente este fie dificilă, fie imposibilă.
În funcţie de natura pe care o au, datele pot fi grupate în trei categorii: date de
tip profil, date de tip serii de timp şi date de tip panel. Datele de tip profil, numite
şi date spaţiale sau date de tip secvenţă, sunt date cu natură statică şi reprezintă
rezultate ale unor măsurători efectuate la un moment dat asupra caracteristicilor
mai multor unităţi ale colectivităţii studiate. Datele de tip serii de timp, numite şi
serii cronologice sau, pur şi simplu, serii de timp, reprezintă rezultate ale unor
măsurători efectuate asupra caracteristicilor unui singur element al colectivităţii
studiate, de-a lungul axei timpului, la mai multe momente sau intervale de timp
succesive. De cele mai multe ori, momentele sau intervalele de timp ale observării
sunt echidistante şi pot fi reprezentate de: zile, săptămâni, luni, trimestre, ani. Date-
le de tip panel, numite şi date longitudinale, reprezintă combinaţii sau mixturi ale
datelor de tip profil şi de tip serii de timp. Datele de tip panel sunt rezultate ale
măsurătorilor efectuate asupra caracteristicilor mai multor elemente ale unei colec-
tivităţi, la mai multe momente sau intervale succesive de timp.
Rezolvarea problemelor specifice demersului econometric, probleme legate de
estimarea parametrilor modelelor, de testarea semnificaţiei unor elemente specifice
ale modelelor sau de validarea calităţii modelelor, presupune existenţa unei baze
informaţionale adecvate, care să conţină toate informaţiile necesare.
Baza informaţională utilizată în analiza econometrică are natura unui eşantion
de observaţii şi este reprezentată de o mulţime de măsurători (observaţii) efectuate
asupra caracteristicilor unor unităţi obsevaţionale extrase din colectivitatea investi-
gată, pe baza unor principii riguroase de eşantionare. Din punct de vedere empiric,
baza informaţională utilizată în econometrie este reprezentată de eşantionul de
observaţii de volum T, eşantion care are următoarea structură generală:
Din punct de vedere teoretic, strict necesar pentru înţelegerea logicii modelării
econometrice şi pentru fundamentarea procedurilor de construire a estimatorilor
pentru parametrii modelelor econometrice, baza informaţională utilizată în econo-
metrie este privită și într-un sens generalizant, ca eşantion aleator de volum T,
eşantion care are următoarea structură generală:
unde cele T observaţii sunt presupuse a fi identic şi independent distribuite (iid), iar
elementele sale sunt variabile aleatoare.
În cazul special al modelelor de regresie multiplă, eşantionul de observaţii şi
eşantionul aleator sunt privite ca fiind structurate sub forma a câte două entităţi
informaţionale distincte, respectiv vectorul de observaţii ale variabilei dependente
Y şi matricea de observaţii ale variabilelor independente , adică:
Eşantion de observaţii: Eşantion aleator:
1 Galton Francis (1822-1911), medic englez, autorul a numeroase studii de statistică, psihologie,
antropologie etc.
2 Pearson Karl (1857-1936), statistician englez, profesor la King’s College din Londra, a avut numeroase şi
importante contribuţii teoretice la dezvoltarea statisticii moderene.
• o structură cauzală semnificativă şi observabilă, reprezentată de un
ansamblu de n variabile, stohastice sau nestohastice, notate cu şi
numite va-riabile independente, cauzale, explicative, exogene, regresori,
predictori, factori, covariaţii sau cauze;
• o structură cauzală nesemnificativă şi neobservabilă, reprezentată de o varia-
bilă aleatoare ɛ, numită perturbaţie sau termen eroare;
• o structură parametrică, reprezentată de coeficienţii sau parametrii mode-
lului, notaţi cu , ale căror valori sunt constante şi necunoscute;
• o formă funcţională, reprezentată de o funcţie reală f(.), de una sau mai multe
variabile, liniară sau neliniară, care descrie legătura funcţională dintre variabila
dependentă şi variabilele explicative şi care se numeşte funcţie de regresie;
• un set de ipoteze statistice, referitoare la perturbaţia ε şi care asigură validi-
tatea şi operaţionalitatea modelului de regresie.
Forma cea mai generală a unui model de regresie multiplă, este următoarea:
(23.1)
Atât variabila dependentă Y, cât şi variabilele independente sunt
considerate a fi variabile aleatoare observabile, adică variabile ale căror realizări
pot fi cunoscute pe calea observării directe, iar perturbaţia ε este o variabilă alea-
toare neobservabilă, cu proprietăți distribuționale speciale.
În funcţie de numărul de variabile independente incluse în mode-
lul de regresie (23.1), acesta se numeşte model de regresie simplă, în cazul în care
include o singură variabilă independentă, respectiv model de regresie multiplă, în
cazul în care include două sau mai multe variabile independente.
De asemenea, în funcţie de forma pe care o are funcţia de regresie f(.), în
raport cu parametrii , respectiv formă liniară sau formă neliniară, mo-
delul de regresie (23.1) se numeşte model de regresie liniar sau model de regresie
neliniar.
(23.2)
formă cunoscută sub numele de model cu regresori nestohastici sau determinişti,
unde şi sunt versiunile con-
diţionate ale variabilei dependente Y şi perturbaţiei ε, pentru care valorile de con-
diţionare sunt reprezentate de combinaţia de valori .
În cadrul figurii (23.2) este ilustrată interpretarea pe care o are media condi-
ţionată în contextul analizei regresiei, pentru cazul particular al unei relaţii de tip
liniar şi al existenţei unei singure variabile independente.
p (y /x )
D ne sitaed pe ro b ab litae
co n d ito n atv loa rilo yr
E (y /x5 )
E (y /x4 )
E (y /x3 )
y i
x x 2 x x 4 x 5
x
1 3
unde este operatorul de medie, şi având în vedere că primul termen din partea
dreaptă a modelului (23.2) este strict determinist, prin aplicarea operatorului de
medie asupra celor doi membri ai modelului (23.2), vom obţine:
(23.3)
unde este o constantă, care reprezintă media varia-
bilei dependente condiţionate , numită şi medie
condiţio-nată a variabilei dependente Y.
Pe baza rezultatului anterior, modelul de regresie cu regresori nestohastici
poate fi rescris sub forma:
(23.4)
care evidenţiază atât faptul că funcţia de regresie descrie media condiţionată a
variabilei dependente Y, cât şi faptul că perturbaţiile condiţionate descriu abaterile
simple ale valorilor variabilei dependente condiţionate ,
faţă de media acesteia, deoarece perturbația condiționată poate fi scrisă sub forma:
(23.7)
care se numeşte model teoretic sau model al populaţiei statistice, este aceea a
estimării parametrilor săi .
Presupunând că forma funcţiei de regresie f(.) este cunoscută şi că baza infor-
maţională disponibilă pentru estimarea parametrilor modelului este reprezentată de
eşantionul aleator (degenerat) având forma următoare:
unde , reprezintă variabilele dependente condiţionate, adică:
iar cele T linii ale matricii X definesc cele T niveluri de condiţionare pentru varia-
bila dependentă Y. Similar, cele T perturbaţii condiţionate, corespunzătoare celor T
niveluri de condiţionare reprezentate de valorile variabilelor , pot fi
notate sub forma:
iar modelul teoretic (23.7) poate fi scris la nivel de eșantion sub forma următoare:
- unităţi colectivitate
- unităţi eşantion
Variabila explicativ ă x
Proprietatea conform căreia, sub ipoteza de medie nulă a perturbaţiei , funcţia
de regresie este o funcţie liniară, este echivalentă cu presupunerea că variabila
dependentă și variabilele independente sunt distribuite (simultan) după legea nor-
mală multidimensională.
Figura 23.3: Ilustrarea grafică a legăturii dintre modelul teoretic
şi modelul estimator
1Dacă vom face notaţiile următoare:
atunci modelul teoretic de regresie liniară multiplă şi modelul estimator al acestuia,
pot fi scrise sub formele matriciale următoare:
Pe baza modelului estimator și utilizând metoda celor mai mici pătrate, esti-
matorii pentru parametrii modelului de regresie liniară multiplă, în măsura în care
aceştia există, sunt definiţi de relaţia:
atunci mulţimea de valori pe care le poate lua variabila aleatoare Y, dându-se valo-
rile de predicţie , poate fi privită ca fiind mulţimea valori-
lor variabilei condiţionate , al cărei comportament este descris de relaţia:
unde atât forma f a legii de probabilitate, cât şi valorile parametrilor acestei legi,
depind de indicele t, care indexează timpul.
Proprietatea de non-identic distribuire a variabilelor aleatoare ,
ridică o serie de dificultăţi, teoretice şi practice, în domeniul modelării seriilor de
timp. În scopul atenuării sau eliminării acestor dificultăţi, apare necesitatea de a
impune o serie de restricţii asupra distribuţiilor de probabilitate ale variabilelor
aleatoare , cele mai multe dintre aceste restricţii fiind asociate cu con-
ceptul de staţionaritate.
Seria de timp reprezentată generic prin intermediul listei de variabile aleatoare
, poate fi privită ca fiind o subsecvenţă compactă şi reindexată,
dintr-o listă infinită de variabile aleatoare, de forma:
listă cunoscută sub numele generic de proces stohastic (discret). În acest fel, seria
de timp apare ca fiind o sub-secvenţă continuă şi observabilă a unui proces sto-
hastic, motiv pentru care baza teoretică a modelării seriilor de timp este reprezen-
tată de teoria proceselor stohastice.
Y
Densitate de
probabilitate
Y(t1)
Y(t0)
t0 t1 t2 t
Mulţimea de parametri T poate să fie o mulţime de valori de tip continuu,
reprezentată de intervale ale dreptei reale ℝ, sau o mulţime numărabilă de valori
de tip discret, cum ar fi mulţimea numerelor întregi
, sau mulţimea numerelor naturale
Figura 23.4: Ilustrarea naturii stohastice a evoluţiei unui fenomen
economic
. În cazul în care mulţimea T este de tip continuu, procesul
stohastic se numeşte proces stohastic continuu şi se notează cu , iar în cazul în
care mulţimea T este de tip discret, procesul sto-hastic se numeşte proces stohastic
discret sau lanţ stohastic şi se notează cu . Prin natura lor, seriile de timp din
domeniul economic sunt asociate cu procesele stohastice de tip discret, astfel că în
cele ce urmează ne vom referi doar la această clasă de procese stohastice.
Ca mulţime de variabile aleatoare, un proces stohastic poate fi caracterizat
printr-o mulţime de indicatori numerici specifici, reprezentaţi de momentele varia-
bilelor aleatoare care îl compun, momente cum ar fi: media, varianţa, covarianţa și
corelaţia. Cea mai importantă caracteristică numerică a unui proces stohastic este
reprezentată de speranţa matematică sau de media procesului stohastic. Fiind dat
procesul stohastic , se numeşte medie sau speranţă matematică funcţia:
unde reprezintă densitatea de probabilitate a variabilei aleatoare .
O altă caracteristică numerică importantă a unui proces stohastic este repre-
zentată de varianţă, definită de funcţia:
Cea de-a treia caracteristică numerică importantă a unui proces stohastic este
reprezentată de covarianţă sau autocovarianţă, definită de funcţia:
După cum se poate observa, procesul de tip ‘zgomot alb” verifică cele trei
condiţii de slabă staţionaritate. Mai mult decât atât, el are covarianţele, şi deci şi
corelaţiile, nule, motiv pentru care se mai numeşte şi proces fără memorie.
O variantă importantă a procesului aleator de tip ‘zgomot alb’ este cea cunos-
cută sub numele proces Gaussian. Procesul stohastic , se numeşte proces
Gaussian, dacă el este un proces de tip ‘zgomot alb’ şi, în plus, variabilele care îl
compun sunt repartizate după legea normală, respectiv:
12
Ca 0
-4
-8
-12
10 20 30 40 50 60 70 80 90 100
urmare
a faptului că nu sunt autocorelate, procesele de tip ‘zgomot alb’ se mai numesc
procese non-informative şi nu fac obiectul modelării econometrice. Acest tip de
procese stohastice, este specific evoluţiilor din pieţele de capitaluri, în condiţiile în
care aceste pieţe au proprietatea cunoscută sub numele de eficienţă informaţională
perfectă.
Pentru a verifica dacă un anumit proces stohastic staţionar, are natură de ‘zgo-
mot alb’, sunt utilizate o serie de teste statistice, care vizează testarea semnifica-
ţiilor coeficienţilor de autocorelaţie de diferite ordine. Cele mai importante dintre
aceste teste sunt cele bazate pe statisticile Q ale lui Ljung-Box și Box-Pierce.
Cel mai important proces stohastic de tip nestaţionar, este reprezentat de pro-
cesul numit ‘mers aleator’ sau ‘mers la întâmplare’ (random walk). Procesul
stohastic , se numeşte ‘mers aleator simplu’, dacă variabilele aleatoare
care îl compun sunt legate între ele prin relaţia de recurenţă:
respectiv ‘mers aleator cu derivă’, dacă variabilele aleatoare care îl compun sunt
legate între ele prin relaţia de recurenţă:
unde defineşte un proces aleator de tip ‘zgomot alb’, iar c este o constantă.
Se poate arăta că media procesului de tip ‘mers aleator simplu’ este constantă,
deci nu depinde de timp, însă varianţa acestuia depinde de timp, respectiv:
70
60
50
40
30
20
10
0
10 20 30 40 50
Figura 23.5: Reprezentarea grafică60a observaţiilor
70 80 90
unui 100
proces
stohastic de tip ‘zgomot alb’
Împărţirea proceselor stohastice pe cele două categorii, staţionare (slab) şi
nestaţionare, este extrem de importantă pentru întregul demers întreprins în
contextul modelării seriilor de timp.
Baza teoretică pentru modelarea seriilor de timp este reprezentată de un
rezultat important din teoria proceselor stohastice, cunoscut sub numele de
teorema de descompunere Wold (1938), care asigură premisele teoretice necesare
pentru construirea unei reprezentări formalizate pentru procesele stohastice,
reprezentare care este chiar modelul econometric. Din nefericire însă, teorema
oferă baza teoretica doar pentru reprezentarea proceselor stohastice slab staţionare.
Conform acestei teoreme, orice proces stohastic slab staţionar, admite o
reprezentare formalizată, de tip medie mobilă (MA-Moving Average). Astfel, dacă
este un proces stohastic slab staţionar, atunci el poate fi reprezentat sub
forma:
,
numită reprezentare de tip medie mobilă infinită (MA(∞)), unde este o mărime
deterministă, sunt variabile aleatoare numite şocuri, inovaţii sau perturbaţii,
având natura proceselor stohastice de tip ‘zgomot alb’, cu mediile, varianţele şi
covarianţele verificând condiţiile:
unde:
unde:
Din nefericire însă, utilizarea acestui rezultat fundamental este foarte limitată,
deoarece în cele mai multe dintre situaţii fenomenele din economia reală au evo-
luţii pentru care nu se verifică decât foarte rar proprietatea de staţionaritate, nici
măcar în varianta slabă a acesteia. Din acest motiv, pentru a putea descrie în mod
adecvat evoluţiile de acest tip, apare necesitatea ca procesele stohastice sau seriile
de timp să fie supuse unor operaţii preliminare de staţionarizare, în urma cărora se
obţin procese stohastice sau serii de timp staționare.
După cum se poate observa, deşi descompunerea Wold asigură existenţa unui
model econometric pentru orice proces stohastic slab staţionar, forma acestui
model apare ca fiind oarecum nenaturală. Această lipsa de naturaleţe este dată de
faptul că, într-un astfel de model, variabila dependentă este explicată prin inter-
mediul unor factori care par relativ “ciudaţi”, reprezentaţi de şocurile sau ino-
vaţiile , care definesc un proces de tip ‘zgomot alb’ şi care au o natură
neobservabilă. Cu toate acestea, în anumite condiţii se poate trece de la repre-
zentarea Wold de tip medie mobilă, la o altă reprezentare a procesului stohastic
staţionar, cu mult mai naturală, care este reprezentarea de tip autoregresiv.
unde:
unde:
şi au forma generală:
Bibliografie