Documente Academic
Documente Profesional
Documente Cultură
A. TEORIE (27p)
Etapele demersului econometric sunt:
➢ Delimitarea ipotezelor din teoria economică ce urmează a fi testate;
➢ Formularea matematică a ipotezelor economice;
➢ Specificarea modelului econometric;
➢ Culegerea datelor;
➢ Estimarea parametrilor;
➢ Predicţia pe baza modelului;
➢ Concluzii şi recomandări.
Modelul econometric
Deşi în domeniul economic există o mare diversitate de modele, modelarea acestora la orice nivel
micro sau macro economic se poate interpreta cu ajutorul modelului de sistem Intrare/Ieşire: unde Y = (yi)
– volumul ieşirilor din sistem, i=1,...,n
X = (xj) – factorii cantitativi şi calitativi care influenţează ieşirile yi, j=1,...,m
S – structura sistemului prin intermediul căreia factorii xj determină ieşirile yi
1
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
─ fie o imagine de tip static a populaţiei statistice (datele fiind legate de starea populaţiei la
un moment dat);
─ fie o imagine de tip dinamic, evolutiv – în care datele oferă informaţii despre evoluţia în
timp a uneia din unităţi sau a întregii populaţii.
Aceste două modalităţi de observare a unităţilor unei populaţii conduc la gruparea datelor în trei
categorii:
a) date de tip profil – reprezintă rezultatul unor măsurători efectuate la un anumit moment
dat asupra uneia sau mai multor variabile, pe mulţimea unităţilor populaţiei.
Aceste date de profil se mai numesc date de tip secvenţă sau date de tip secţiune şi reprezintă
„tăieturi informaţionale” efectuate într-o populaţie la un moment dat, „tăieturi” care sunt de tip
transversal, în raport cu axa timpului.
Se remarcă următoarele:
─ o observaţie în contextul datelor de tip profil este reprezentată de valoarea sau valorile
unei singure entităţi, ale unei singure unităţi din populaţie; numărul observaţiilor coincide, în cazul datelor
de tip profil, cu numărul unităţilor observate şi investigate;
─ acest tip de date nu încorporează, prin semnificaţia pe care o poartă, influenţa timpului
asupra formării caracteristicilor (semnul scurgerii timpului) nici în mod explicit şi nici în mod implicit;
─ ele se referă la starea pe care o au la un moment dat unităţile populaţiei statistice.
a) date de tip serii de timp – numite şi serii cronologice – reprezintă rezultate ale unor
măsurători efectuate asupra caracteristicilor, unităţilor populaţiei studiate, de-a lungul timpului, la
momente succesive sau la anumite intervale de timp.
Acestea sunt date de tip stoc sau de tip flux şi reprezintă „secţiuni informaţionale” de-a lungul
axei timpului, de-a lungul evoluţiei; adică sunt secţiuni longitudinale în raport cu axa timpului.
b) date de tip panel sunt combinaţii, mixturi ale datelor de tip profil şi ale datelor de tipul
seriilor de timp.
Ele sunt rezultate ale măsurătorilor efectuate asupra caracteristicilor unor unităţi individuale, atât
de-a lungul unităţilor individuale, cât şi de-a lungul timplui, sunt „tăieturi informaţionale mixte”
transversale şi longitudinale, în raport cu axa timpului. Caracteristica esenţială a acestor date este, deci,
simultaneitatea.
Deşi tipologia modelelor econometrice este foarte variată, ele se pot încadra în câteva tipuri sau
clase principale:
1. După numărul factorilor luaţi în considerare:
─ modelele unifactoriale: y = f(x)+ ε se fundamentează pe ipoteza că, în rândul factorilor de
influenţă ai variabilei rezultative Y, există un factor determinant X, ceilalţi factori, cu excepţia acestuia
având o influenţă întâmplătoare (exprimată prin intermediul variabilei reziduale ε) sau fiind invariabili în
perioada analizată;
─ modele multifuncţionale: y = f(x1,x2,…,xp)+ε elimină deficienţa modelului
unifactorial, însă trebuie ca numărul factorilor luaţi în considerare să nu fie foarte mare pentru a nu fi mult
prea complex, dificil de estimat etc.
1. După forma legăturii dintre variabila rezultativă şi variabilele cauză:
─ modele liniare: dacă legătura este liniară;
─ modele neliniare: dacă legătura este neliniară.
1. După includerea factorului timp în model:
─ modele statice: dependenţa variabilei endogene Y faţă de valorile variabilei exogene Xj se
realizează în aceeaşi perioadă de timp:
y = f(x1t,…,xjt,…,xkt)+εt
─ modele dinamice:
─ introducerea variabilei timp ca o variabilă explicativă
y = f(xt,t)+εt;
2
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
─ autoregresive: variabila rezultativă cu valori decalate este una din variabilele explicative
y = f(xt,yt-k)+εt
─ model cu decalaj: variabila explicativă X îşi exercită influenţa asupra variaţiei variabilei
rezultative pe mai multe perioade de timp:
y = f(xt,xt-1,…,xt-k)+εt
1. Modele cu o ecuaţie sau cu ecuaţii multiple:
─ modele cu o singură ecuaţie: toate modelele prezentate anterior
─ modele cu ecuaţii multiple: sunt formate dintr-un sistem de ecuaţii
Y1+b12+…+b1nYn+c11X1+c12X2+…+c1mXm=ε1b21Y2+Y2+…
+b2nYn+c21X1+c22X2+…+c2mXm=ε2⋮bn1Y2+bn2Y2+…+Yn+cn1X1+cn2X2+…
+cnmXm=εn
Yi,i=1,n – variabile rezultative sau endogene
Xj,j=1,m – variabile explicative sau exogene
Variabile aleatoare
În activitatea economică se întâlnesc multe mărimi numerice care variază întâmplător (aleator).
Exemple:
1) Numărul calculatoarelor vândute la un magazin într-o zi este o variabilă aleatoare care
poate lua una din valorile 0, 1 ,2 ,..., n, unde n este numărul total de calculatoare din magazin. Aici,
mulţimea valorilor posibile este {0, 1 ,2 ,..., n}.
2) Timpul necesar servirii unui automobilist la o staţie de benzină este o variabilă aleatoare
care poate lua o valoare dintr-un interval dat (a, b). Aici, mulţimea valorilor posibile este (a, b).
Variabila aleatoare reprezintă o mărime care, în urma unei experienţe, poate lua o valoare dintr-o
mulţime bine definită, numită mulţimea valorilor posibile. Nu se cunoaşte dinainte ce valoare ia variabila
aleatoare; această valoare va fi cunoscută numai după efectuarea experimentului.
Dacă mulţimea valorilor posibile este discretă, atunci variabila aleatoare se numeşte discretă, iar dacă
mulţimea valorilor posibile este continuă (un interval finit sau infinit din R), variabila aleatoare se
numeşte continuă.
3
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
Variabilele aleatoare se notează, de regulă, cu litere mari de la sfârşitul alfabetului, X, Y, Z etc., iar valorile
pe care le pot lua variabilele aleatoare cu litere mici , x, y, z etc.
1 2 3 4 5 6
X : 1 1 1 1 1
1
6 6 6 6 6 6
Se numeşte repartiţie a unei variabile aleatoare discrete enumerarea tuturor valorilor posibile ale
variabilei aleatoare precum şi a probabilităţilor corespunzătoare. În general, fie variabila aleatoare X şi xi,
(i=1, 2, ..., n) valorile ei posibile. Fie Ei evenimentul ca variabila aleatoare , i=1, 2, ..., n şi fie
X = xi
, probabilitatea corespunzătoare unde este funcţia de
P ( Ei ) = P ( X = xi ) = f ( xi ) = pi f ( xi )
probabilitate. Atunci putem scrie:
x1 x2 ... xn
X :
f ( x1 ) f ( x2 ) ... f ( xn )
Mulţimea perechilor ordonate ( ) se numeşte repartiţia variabilei aleatoare discrete X.
xi , f ( xi )
Din exemplele prezentate rezultă că funcţia de probabilitate trebuie să îndeplinească următoarele două
condiţii:
1) ; 2) , deoarece Ei=(X=xi) este un sistem complet de
f ( xi ) ≥ 0, i = 1,…, n n
∑f ( x ) =1
i =1
i
evenimente, adică: .
n
UE
i =1
i = Ω, Ei ∩ E j = Φ, i ≠ j , i, j = 1, …, n
Exemple:
1. Repartiţia binomială (Bernoulli): .
x
X : x x n − x , x = 0,1,… , n
f ( x ) = Cn p q
arată probabilitatea ca din n extrageri, x să fie bile albe. Arătăm în continuare că f(x)
f ( x) = C p q
x
n
x n −x
4
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
1) Evident, ;
f ( x) ≥ 0
2) (binomul lui Newton).
n n
∑ f ( x ) = ∑C
x =o x= 0
x
n p x q n − x = ( p + q) n = 1
∑p ⋅ q
x =1
x −1
= p ⋅ ∑q x −1 = p ⋅
x =1
= =1
1− q p
∑q
x =1
x −1
5
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
3.1.2 Variabile aleatoare continue. Fie Y variabila aleatoare , unde x ∈[a,b], iar f(x) este
x
X :
f ( x)
probabilitatea de apariţie a lui x. Funcţia f(x) se numeşte densitatea de probabilitate a variabilei aleatoare
X.
Proprietăţile densităţii de probabilitate:
1) ;
f ( x) ≥ 0
2) .
b
∫ f ( x)dx = 1
a
Procesul de luare a deciziilor presupune analiza, judecarea si interpretarea evidenţelor oferite de datele pe
care le avem la dispoziţie. Managerii trebuie să fie pregătiţi să ia decizii privind acţiunile viitoare pe baza
informaţiilor disponibile. Astfel, ei emit ipoteze pe care le pot testa ştiinţific utilizând metodele si tehnicile
statistice. Testarea ipotezelor statistice reprezintă o altă modalitate, alături de estimaţia pe interval de
încredere, de a realiza inferenţă statistică. Scopul acestui tip de inferenţă statistică este să determinăm
dacă există suficiente dovezi statistice care să ne permită să concluzionăm că o afirmaţie (sau o ipoteză)
dspre un parametru este adevărată.
Exemplu. Sute de produse noi sunt lansate în fiecare an. Dintr-o varietate de motive, multe dintre
acestea nu reuşesc să cucerească piaţa. De aceea, produsele care ajung in stagiul final de lansare pe piaţă
sunt evaluate de specialiştii în marketing, care doresc să facă predicţii asupra succesului (cu alte cuvinte,
cât de bine se vor vinde). Evident, informaţii complete şi sigure nu se pot obţine şi atunci specialiştii vor
6
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
dori să tragă concluzii valide, pe baza datelor disponibile din cercetări parţiale. Să presupunem că un lanţ
de magazine doreşte să vândă un nou produs lansat pe piaţă şi speră să aibă succes. După o analiză
financiară, specialiştii determină că, dacă mai mult de 10% din potenţialii cumpărători vor cumpăra
produsul, lanţul de magazine va obţine profit. Un eşantion aleator de clienţi potenţiali este selectat şi
persoanele sunt întrebate dacă ar cumpăra produsul. Procedeul de eşantionare şi de culegere a datelor este
cunoscut din capitolele precedente, iar parametrul reprezintă proporţia clienţilor care ar cumpăra produsul.
Testarea ipotezei statistice se referă, atunci, la a determina dacă proporţia cumpărătorilor este mai mare de
10%. În urma prelevării unui eşantion dintr-o populaţie statistica, prin prelucrarea datelor provenite din
sondaj se obţine un estimator al parametrului urmărit în populaţia de origine. Se pune atunci problema în
ce măsură parametrul estimat pe baza rezultatelor sondajului asigură „credibilitatea” aprecierilor făcute
asupra întregii colectivităţi. Estimatorul este, aşadar, o „presupunere” asupra parametrului, deci o ipoteză
statistică. Nu este nevoie să testăm ipoteze statistice atunci când ştim totul despre un fenomen, ci doar
când există incertitudine.
Ipoteza statistică este ipoteza care se face cu privire la parametrul unei repartiţii sau la legea de
repartiţie pe care o urmează anumite variabile aleatoare. O ipoeză statistică nu este neapărat adevărată.
Ea poate fi corectă sau greşită. În statistică, ipotezele apar întotdeauna în perechi: ipoteza nulă si ipoteza
alternativă. Ipoteza statistică ce urmează a fi testată se numeşte ipoteză nulă şi este notată, uzual, H0. Ea
constă întotdeauna în admiterea caracterului întâmplător al deosebirilor, adică în presupunerea că nu există
deosebiri esenţiale. Respingerea ipotezei nule care este testată implică acceptarea unei alte ipoteze.
Această altă ipoteză este numită ipoteză alternativă, notată H1. Cele două ipoteze reprezintă teorii,
mutual exclusive si exhaustive, asupra valorii parametrului populaţiei sau legii de repartiţie. Spunem că
ele sunt mutual exclusive deoarece este imposibil ca ambele ipoteze să fie adevărate. Spunem că ele sunt
exhaustive deoarece acoperă toate posibilităţile, adică ori ipoteza nulă, ori ipoteza alternativă trebuie să
fie adevărată. Procedeul de verificare a unei ipoteze statistice se numeşte test sau criteriu de
semnificaţie. O secvenţă generală de paşi se aplică la toate situaţiile de testare a ipotezelor statistice.
Există patru componente principale ale unui test privind o ipoteză:
• ipoteza nulă;
• ipoteza alternativă;
• testul statistic;
• regiunea critică (de respingere).
Ipotezele se vor schimba, tehnicile statistice aplicate se vor schimba, dar procesul rămâne acelaşi,
parcurgându-se următorii paşi:
1) Se identifică ipoteza statistică specială despre parametrul populaţiei sau legea de
repartiţie (H0). Ipoteza statistică – numită şi ipoteză nulă – specifică întotdeauna o singură valoare a
parametrului populaţiei şi reprezintă status-quo-ul, ceea ce este acceptat până se dovedeşte a fi fals.
2) Întotdeauna, ipoteza nulă este însoţită de ipoteza alternativă (de cercetat), H1, ce reprezintă o
teorie care contrazice ipoteza nulă. Ea va fi acceptată doar când există suficiente dovezi, evidenţe,
pentru a se stabili că este adevărată.
Ipoteza alternativă este cea mai importantă, deoarece este ipoteza care ne răspunde la întrebare.
Ipoteza alternativă poate căpăta trei forme, care răspund la trei tipuri de întrebări referitoare la parametrul
studiat: dacă parametrul este diferit (mai mare sau mai mic) decât valoarea specificată în ipoteza nulă;
dacă parametrul este mai mare decât valoarea specificată în ipoteza nulă; dacă parametrul este mai mic
decât valoarea specificată în ipoteza nulă.
3) Se calculează indicatorii statistici în eşantion, utilizaţi pentru a accepta sau a respinge ipoteza
nulă şi se determină testul statistic ce va fi utilizat drept criteriu de acceptare sau de respingere a ipotezei
nule. Pentru cele mai multe testări statistice ale ipotezelor, testul statistic este derivat din estimatorul
7
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
punctual al parametrului ce va fi testat. Spre exemplu, deoarece media eşantionului este un estimator
punctual al mediei din colectivitatea generală, ea va fi utilizată în testarea ipotezelor privind parametrul
media colectivităţii generale.
4) Se stabileşte regiunea critică, Rc. Regiunea critică reprezintă valorile numerice ale testului
statistic pentru care ipoteza nulă va fi respinsă. Regiunea critică este astfel aleasă încât probabilitatea ca ea
să conţină testul statistic, când ipoteza nulă este adevărată, să fie α, cu α mic (α = 0.01 etc). Verificarea
ipotezei nule se face pe baza unui eşantion de volum n, extras din populaţia X, care este o variabilă
aleatoare. Dacă punctul definit de vectorul de sondaj x1, x2, ..., xn cade în regiunea critică Rc, ipoteza H0 se
respinge, iar dacă punctul cade în afara regiunii critice Rc, ipoteza H0 se acceptă. Regiunea critică este
delimitată de valoarea critică, C – punctul de tăietură în stabilirea acesteia. În baza legii numerelor mari,
numai într-un număr foarte mic de cazuri punctul rezultat din sondaj va cădea în Rc, majoritatea vor cădea
în afara regiunii critice. Nu este însă exclus ca punctul din sondaj să cadă în regiunea critică, cu toate că
ipoteza nulă despre parametrul populaţiei este adevarată. Cu alte cuvinte, atunci când respingem ipoteza
nulă, trebuie să ne gândim de două ori, deoarece există două posibilităţi: ea este falsă într-adevăr şi ea este
totuşi adevărată, deşi pe baza datelor din sondaj o respingem. La fel şi pentru situaţia în care acceptăm
ipoteza nulă H0. Când ipoteza nulă nu poate fi respinsă (nu există suficiente dovezi pentru a fi respinsă),
sunt două posibilităţi: ipoteza nulă este adevărată si ipoteza nulă este totuşi falsă, greşită, deşi nu am
respins-o. De aceea, este mai corect să spunem că, pe baza datelor din eşantionul studiat,nu putem
respinge ipoteza nulă, decât să spunem că ipoteza nulă este adevărată.Eroarea pe care o facem eliminând
o ipoteză nulă, deşi este adevărată, se numeşte eroare de genul întâi. Probabilitatea comiterii unei astfel
de erori reprezintă riscul de genul întâi (α) şi se numeşte nivel sau prag de semnificaţie. Nivelul de
încredere al unui test statistic este (1 – α), iar în expresie procentuală, (1 – α)100 reprezintă probabilitatea
de garantare a rezultatelor. Eroarea pe care o facem acceptând o ipoteză nulă, deşi este falsă, se numeşte
eroare de genul al doilea, iar probabilitatea (riscul) comiterii unei astfel de erori se notează cu β. Puterea
testului statistic este (1 – β).
Tabelul 6.1. ilustrează legătura dintre decizia pe care o luăm referitor la ipoteza nulă şi adevărul sau
falsitatea acestei ipoteze.
Tabelul 6.1. Erorile în testarea ipotezelor statistice
Ipoteza adevărată
Decizia de acceptare
H0 H1
Decizie corectă Eroare de gen II
H0
(probabilitate 1 – α) (risc β)
Eroare de gen I Decizie corectă
H1
(risc α) (probabilitate 1 –β)
Cu cât probabilităţile comiterii erorilor de genul întâi şi de genul al doilea sunt mai mici, cu atât
testul este mai bun. Acest lucru se poate realiza prin mărirea volumului eşantionului, n. Nivelurile
riscurilor se stabilesc în funcţie de considerente economice şi de natura testului. Am văzut că:
α = P (respingere H0| H0 este corectă) = P (eroare de gen I);
β = P (acceptare H0| H0 este falsă) = P (eroare de gen II).
Alegerea nivelului (pragului) de semnificaţie depinde şi de costurile asociate cu producerea
unei erori de genul I.
Exemplu
8
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
Pragul de semnificaţie ales de o firmă ce fabrică îngheţată, interesată în reutatea medie a cutiilor
de îngheţată, va putea fi diferit de pragul de semnificaţie ales de o companie farmaceutică, interesată de
cantitatea medie a unui ingredient activ dintr-un tip de medicament. Evident, costul în prima situaţie
prezentată este mult mai mic, comparativ cu costul asociat în cazul producerii unei erori de genul I pentru
compania farmaceutică: o cantitate prea mică de ingredient activ poate face medicamentul ineficient; o
cantitate prea mare de ingredient activ poate cauza efecte secundare, dăunătoare sau poate avea, chiar,
efecte letale. Similar, există costuri asociate cu producerea unei erori de genul al II-lea. Între eroarea de
genul I şi eroarea de genul al II-lea există o legatură, o condiţionare. O modalitate de a vizualiza această
legătură este să presupunem că există doar două distribuţii care ne interesează. O distribuţie corespunde
ipotezei nule H0, iar cealaltă corespunde ipotezei alternative H1. În acest caz, presupunem că şi ipoteza
nulă şi cea alternativă sunt ipoteze simple. Într-o manieră uşor de înţeles, considerăm că ipoteza nulă este
de forma H0: μ = μ0, iar ipoteza alternativă este de forma H1: μ = μ1 (figura 6.1.):
Pe grafic se observă că cele două distribuţii se suprapun şi, din procesul de testare a ipotezei nule, pot
rezulta două tipuri de erori.
Eroarea de genul I apare atunci când respingem ipoteza nulă H0, în situaţia în care, de fapt,
aceasta este adevărată. Adică, deşi distribuţia lui este cea corespunzătoare ipotezei H0, respingem H0,
x
deoarece media de sondaj este mai mare decât valoarea critică, C, şi se situează în regiunea critică.
Probabilitatea comiterii unei astfel de erori (α) este aria de sub curba de distribuţie H0, care se situează la
dreapta valorii critice C. Deseori, când lucrăm cu soft-ware specializat, întâlnim „valoarea-p” („p-value”).
Aceasta reprezintă nivelul observat de semnificaţie, adică cel mai mic nivel la care H0 poate fi respinsă
pentru un set de valori date.
Eroarea de genul al doilea apare atunci când nu respingem (adică acceptăm) H0, deşi H1 în loc de
H0 este corectă. În acest caz, deşi distribuţia lui este cea corespunzătoare ipotezei H1, acceptăm H0
x
deoarece media de sondaj este mai mică decât valoarea critică, C (nu se află în regiunea critică).
Probabilitatea comiterii unei astfel de erori (β) este aria de sub curba de distribuţie H1, care se situează la
stânga valorii critice, C. Dacă alegem un prag de semnificaţie, α, mai mic (adică reducem riscul comiterii
unei erori de genul întâi), va creşte β (riscul comiterii unei erori de genul al doilea). Cu toate acestea, prin
creşterea volumului n al eşantionului, este posibil să reducem riscul β, fără a creşte riscul α.
Cum , o dată cu creşterea volumului n al eşantionului, abaterile medii pătratice ale
sx
sx =
n
distribuţiilor pentru H0 şi H1 devin mai mici şi, evident, atât α, cât şi β descresc (figura 6.2.).
9
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
5) După ce am stabilit pragul de semnificaţie şi regiunea critică, trecem la pasul următor, în care
vom face principalele presupuneri despre populaţia sau populaţiile ce sunt eşantionate (normalitate
etc.).
6) Se calculează apoi testul statistic şi se determină valoarea sa numerică, pe baza datelor din
eşantion.
7) La ultimul pas, se desprind concluziile: ipoteza nulă este fie acceptată, fie respinsă, astfel: a)
dacă valoarea numerică a testului statistic cade în regiunea critică (Rc), respingem ipoteza nulă şi
concluzionăm că ipoteza alternativă este adevărată. Vom şti că această decizie este incorectă doar în 100 α
% din cazuri; b) dacă valoarea numerică a testului nu cade în regiunea critică (Rc), se acceptă ipoteza
nulă H0.
Ipoteza alternativă poate avea, aşa cum am arătat, una din trei forme (pe care le vom
exemplifica pentru testarea egalitaţii parametrului „media colectivităţii generale”, μ cu valoarea μ0):
i) să testăm dacă parametrul din colectivitatea generală (media μ) este egal cu o anumită valoare
(inclusiv zero, μ0), cu alternativa media diferită de valoarea μ0. Atunci:
,
H 0 : µ = µ 0 H1 : µ ≠ µ0 ( µ < µ 0 sauµ > µ 0 )
şi acest test este un test bilateral;
ii) să testăm poteza nulă μ = μ0, cu alternativa media μ este mai mare decât μ0,
H0: μ = μ0, H1: μ > μ0,
care este un test unilateral dreapta;
iii) să testăm ipoteza nulă μ = μ0, cu alternativa media μ este mai mică decât μ0,
H0: μ = μ0, H1: μ < μ0,
care este un test unilateral stânga. Regiunea critică pentru testul bilateral diferă de cea pentru testul
unilateral. Când încercăm să detectăm o diferenţă faţă de ipoteza nulă, în ambele direcţii, trebuie să
stabilim o regiune critică Rc în ambele cozi ale distribuţiei de eşantionare pentru testul statistic. Când
efectuăm un test unilateral, vom stabili o regiune critică într-o singură parte a distribuţiei de eşantionare,
astfel (figura 6.3.):
µ µ µ
a) b) c)
Figura 6.3.Regiunea critică:
a) test bilateral; b) test unilateral dreapta; c) test unilateral stânga.
H1 : µ yi ≠ µ yj (i ≠ j )
10
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
xoyyr1 a)medii
xx2 2 ……
de…….
grupă;
xr xr b) mediile de grupă inegale
Figura 7.1.
y2
y1
Se testează, cu alte cuvinte, dacă diferenţele dintre mediile de grupă din eşantion sunt prea mari pentru a fi
atribuite doar întâmplării. Dacă rezultatul testului indică faptul că mediile sunt semnificativ diferite, se
concluzionează că factorul X are un impact asupra variabilei Y. Testul statistic este dezvoltat în
concordanţă cu următorul raţionament. Dacă ipoteza nulă este adevărată, mediile celor r populaţii ar trebui
să fie, toate, egale. Ne aşteptăm atunci ca mediile celor r eşantioane să fie aproximativ egale. Dacă ipoteza
alternativă este adevărată există diferenţe mari între unele medii ale eşantioanelor. Setul de date pentru
analiza dispersională unifactorială constă în valorile variabilei Y pentru cele r grupe independente.
Volumele grupelor pot fi diferite (tabelul 7.1.):
n1 ≠ n2 ≠ ... ≠ nr
Tabelul 7.1. Sistematizarea datelor pentru ANOVA
Grupe după factorul cauză
Gr. 1 Gr. 2 ..... Gr. r
y11 y21 ..... y11
y12 y22 ..... y11
Vol. grupă
Presupunerile sub care se aplică testul F în analiza dispersională unifactorială oferă un cadru
solid pentru interfaţa statistică pe baza datelor observate, anume: cele r grupe din eşantion sunt extrase
aleator şi independent din cele r grupe ale colectivităţii generale; fiecare grupă din colectivitatea generală
are o distribuţie normală, iar abaterile medii pătratice sunt egale .
σ 1 = σ 2 = ... = σ r
Testul statistic F pentru analiza dispersională unifactorială este raportul indicatorilor de
variabilitate pentru cele două surse de variaţie: variabilitatea dintre grupe împărţită la variabilitatea din
interiorul grupelor. El poate fi interpretat ca măsurând de câte ori este mai mare variabilitatea mediilor de
grupă, comparativ cu ce ne-am aşteptat dacă ele erau doar aleator diferite. Pentru testarea ipotezei nule,
vom estima mediile de grupă şi media totală din colectivitatea generală pe baza datelor din eşantion.
, , .
ni ni r
i = 1, r r r
∑ yij ∑ ∑ yij ∑yn i i
n = ∑ ni
j =1 i =1 j =1 i =1
yi = yi = = i =1
ni n n
11
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
Varianţa dintre grupe, dată de influenţa factorului cauzal, numită şi varianţa factorială, este
suma pătratelor abaterilor mediilor de grupă de la media generală:
.
r
S1 = ∑ ( yi − y ) 2 ni
i =1
Din relaţie rezultă că, dacă , . Varianţa din interiorul grupelor, numită şi
y1 = y2 = ... = yr = y S1 = 0
varianţa reziduală, este suma pătratelor abaterilor valorilor individuale de la mediile de grupă:
.
r ni
S 2 = ∑∑ ( yij − yi )2
i =1 j =1
Împrăştierea totală a valorilor individuale fată de media generală este dată de varianţa totală:
y
.
r ni
S = ∑ ∑ ( yij − y)2
i =1 j =1
∑ ∑( ) ∑( ) ( )
r ni 2 r 2 r ni 2
yij − y = yi − y ni + ∑ ∑ y ij − y ⇒ S = S1 +S2
i =1 j =1 i =1 i =1 j =1
Pentru a face comparabile aceste măsuri ale variabilităţii, le vom raporta pe fiecare la gradele de
libertate, transformând astfel suma de pătrate în media pătratelor abaterilor. Pentru varianţa factorială ,
S1
numărul gradelor de libertate este şi acest lucru înseamnă că măsurăm variabilitatea a r medii, dar se
r −1
pierde un grad de libertate, deoarece media totală a fost estimată. Pentru varianţa reziduală (din interiorul
grupelor ) , numărul gradelor de libertate este ; acest lucru înseamnă că măsurăm variabilitatea
S2 n−r
tuturor celor n valori, dar pierdem r grade de libertate, deoarece au fost estimate mediile celor r grupe.
Obţinem astfel dispersia factorială corectă:
∑( y − y)
r 2
i ni
S
s = 1 =
2
1
i =1
r −1 r −1
şi dispersia corectată reziduală:
12
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
∑∑ ( y )
r ni 2
ij − yi
S2 i =1 j =1
s22 = =
n−r n− r
Statistica F pentru analiza dispersională unifactorială are forma:
= variabilitatea dintre grupevariabilitatea din interiorul grupelor ,
s12
F=
s22
Deseori, apare necesitatea de a explica şi controla, pe cât posibil, fenomenele şi procesele din
economie, care pot reflecta situaţii mai mult sau mai puţin favorabile. De aceea, se elaborează o serie de
instrumente eficiente cu ajutorul cărora să explicăm situaţiile existente şi să eliminăm (sau eventual să
diminuăm) efectele nedorite ce pot apărea într-un anumit context economic. În acest fel, se pot verifica
13
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
ipotezele teoriei economice, se poate renunţa la unele care nu s-au dovedit viabile sau se pot elabora altele
noi, contribuind astfel la îmbigăţirea sistemului informaţional privind un anumit fenomen sau proces
economic. Modelul devine, astfel, o verigă intermediară între teorie şi practică, o oglindă sintetică,
simplificată a realităţii economice, ale cărei componente principale sunt exprimate sintetic printr-un set de
variabile, precum şi prin relaţiile, intercondiţionările dintre aceste variabile. Modelul poate fi constituit
dintr-una sau mai multe ecuaţii care exprimă dependenţa variabilelor complexe de un ansamblu de factori
principali şi secundari, sistematici şi aleatori, care acţionează în acelaşi sens sau în sensuri diferite, sistem
care exprimă într-o formă matematică, abstractă, problema căreia îi trebuie găsită rezolvarea. Pentru
rezolvarea acestui sistem sunt enunţate o serie de ipoteze raţionale, în concordanţă cu teoria economică,
iar soluţiile trebuie obţinute în condiţii de verosimilitate maximă, pe baza unui eşantion de date privind
evoluţia variabilelor factoriale şi a variabilelor rezultative. În plus, modelele econometrice pot servi la
analiza şi a altor aspecte ale realităţii economice, precum: identificarea şi măsurarea efectului întârziat al
unor factori economico-sociali, previzionarea evoluţiei unor fenomene, sintetizate printr-un set de
variabile, oscilaţiile sistematice, sezoniere sau ciclice ce pot însoţi evoluţia acestora, simularea şi prognoza
proceselor economico-sociale, identificarea şi măsurarea acţiunii unor variabile dihotomice, alternative
sau binare.
Legăturile care există între două variabile statistice pot fi studiate folosind două tehnici: regresia şi
corelaţia. Corelaţia va arăta cât de puternică este legătura, dependenţa dintre variabile, în timp ce
regresia va ajuta în explicarea şi previzionarea unui factor pe baza valorii altuia (altora), ceea ce, evident,
va reduce incertitudinea privitoare la fenomene importante, dar aleatoare. În sens statistic, termenul
regresie îi aparţine statisticianului englez F. Galton (1822-1911). Există trei scopuri principale, atunci
când analiză, legăturile dintre variabile statistice: • să descriem şi să înţelegem relaţiile de dependenţă;
• să previzionăm o nouă valoare a variabilei efect; • să ajustăm şi să controlăm variabila efect,
prin intervenţia asupra variabilei cauză. Un studiu econometric începe cu o serie de presupuneri teoretice
despre anumite aspecte ale economiei.
Definim modelul unifactorial de regresie printr-o relaţie matematică construită pe baza teoriei
economice, care presupune că fenomenul economic Y (fenomenul efect) este rezultatul acţiunii a două
categorii de factori:
⇒ prima, constituită dintr-un singur factor principal, esenţial, determinant – X,
⇒ a doua – formată din toţi ceilalţi factori – consideraţi neesenţiali, cu acţiune întâmplătoare
(specificaţi prin variabila reziduală „ε”) sau constantă, invariabilă, asupra lui Y (şi deci nu au sens a fi
specificaţi în model).
Specificarea modelului unifactorial constă în precizarea variabilei endogene Y şi a celei exogene
X, pe baza teoriei economice; ca orice ipoteză teoretică, ea poate fi adevărată sau falsă.
y = f (x) + ε
Identificarea modelului constă în alegerea unei funţii (sau a unui grup de funcţii) matematice, cu
ajutorul căreia se urmăreşte descrierea valorilor variabilei endogene, doar în funcţie de variaţia variabilei
exogene X. Identificarea modelului se poate face prin: procedeul grafic; • procedeul conversării ariilor;
• procedeul calculelor algebrice.
Una dintre funcţiile matematice utilizate cel mai des o constituie funcţia liniară. Relaţia dintre
variabila efect (Y) şi variabila cauză (X) studiată de regresia simplă liniară într-o populaţie statistică
generală poate fi descrisă prin modelul probabilistic liniar: , în care:
yi = α + β xi + ε i
14
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
⇒ reprezintă valorile numerice ale variabilelor cauză (X) şi efect (Y), înregistrate la
( xi , yi )
nivelul unităţii statistice „i”; ⇒ reprezintă parametrii ecuaţiei de regresie (în literatura de
α, β
specialitate se mai notează şi ); α reprezintă punctul de intersecţie al dreptei de regresie cu axa
β0 β1
Oy; β reprezintă panta dreptei, se mai numeşte şi „coeficient de regresie” şi arată cu câte unităţi de
măsură se modifică Y dacă X se modifică cu o unitate de măsură;
⇒ εi reprezintă componenta reziduală (eroare aleatoare) pentru unitatea statistică „i”.
1Figura
1α
0,5
βy 8.1.2Modelul liniar
3 unifactorial
4 x
3
După cum observăm, modelul probabilistic conţine: a) componenta deterministică, adică partea din
valoarea lui , care poate fi determinată cunoscând valoarea ; b) componenta reziduală
yi xi (α + β xi = y$i )
este partea din valoarea lui , care nu poate fi determinată cunoscând valoarea individuală .
yi xi (ε i )
Atunci: = componenta predictuală (deterministică) + eroarea aleatoare sau . Dacă datele
yi yi = $
y i + εi
disponibile provin dintr-un eşantion (aşa cum se întâmplă în cele mai multe aczuri), avem la dispoziţie n
perechi de observaţii , iar modelul de regresie liniară în eşantion este:
( x1 , y1 ), ( x2 , y2 ),..., ( xn , yn )
cu componenta predictibilă: , unde a şi b sunt estimatorii punctului de
yi = a + bxi + ei $
y i = a + bxi
15
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
Ipotezele modelului de regresie liniară. Pentru a obţine proprietăţile dorite ale estimatorilor regresiei, se
fac, de obicei, şase presupuneri (ipoteze) standard pentru modelul din populaţia generală. Ipotezele ce
trebuie verificate sunt formulate astfel:
1. Formula funcţională: ,
2. Media zero a erorilor:
yi = α + β xi + ε i i = 1, n
3. Homoscedasticitatea:
4. Non-autocorelarea erorilor:
5. Necorelarea între regresor şi erori:
6. Normalitatea erorilor. E (ε i ) = 0∀i
constantă
Var (ε i ) = σ 2 ∀i
Cov(ε i , ε j ) = 0∀i ≠ j
i şi j
Cov( xi , ε j ) = 0∀
ε j : N (0, σ 2 )
1. Forma funcţională
Ipoteza de liniaritate nu este atât de restrictivă pe cât pare. Aceasta se referă la felul în care
parametrii intră în ecuaţie, nu neapărat la relaţia dintre variabilele X şi Y. În exemplele prezentate în
continuare s-a procedat la transformarea unor variabile în vederea liniarizării modelelor.
a.
y = a + bx
b.
y = a + bz, z = e x
c.
y = a + br, r = 1 x
d.
y = a + bq, q = ln( x)
16
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
aaX
Ya+b
a
++Figura
b
bb 8.2. Modele ce pot fi liniarizate
ln(x)
(ex1x
x
)
În exemplele anterioare, doar variabila X a fost transformată. Acelaşi lucru se poate întâmpla şi cu
variabila Y, aşa cum este cazul modelului: , forma generală a acestuia
y = Ax β ⇒ ln( y) = α + β ln( x)
fiind:
f ( yi ) = α + β g ( xi ) + ε i
Există însă şi modele ce nu pot fi liniarizat, cum este cel de forma: .
1
y =α +
β+x
Ipoteza de liniaritate a modelului include şi aditivitatea erorilor. Modelul trebuie să fie de forma:
, fie în variabilele iniţiale, fie după ce au fost făcute transformările potrivite. De
y =α + β x+ε
exemplu, modelul se transformă prin logaritmare în modelul liniar:
y = Ax β eε
. Însă modelul nu mai poate fi transformat în model liniar.
ln( y ) = ln( A) + β ln( x) + ε y = Ax β + ε
Dacă ipoteza de liniaritate este verificată, variabila dependentă observată este suma a două
elemente:
− componenta predictibilă:
α +βx
o componentă aleatoare: ε.
2. Media erorilor este zero: , este naturală atâta timp cât ε este văzută ca suma
µ (ε i ) = 0∀i
efectelor individuale, cu semne diferite. Această presupunere indică faptul că media valorilor Y este
17
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
xoy a) b)
Figura 8.4. Dispersia reziduurilor:a) constantă; b) variabilă;
4. Non-autocorelarea erorilor:
E (ε iε j ) = 0∀i ≠ j
Această ipoteză nu implică faptul că şi sunt necorelate, ci faptul că deviaţiile observaţiilor
yi yj
de la valorile de aşteptare sunt necorelate.
De asemenea, este convenabil a considera că erorile sunt independente şi normal distribuite cu
medie zero şi variaţie constantă pentru obţinerea de rezultate statistice exacte.
18
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
ei = yi − ( a + bxi )
nu este altceva decât o măsură a distanţei de la un punct ( ) la linia de regresie (figura 8.6.):
xi , yi
i i
∂S
∂a = 0 ∑ 2 ( yi − a − b ⋅ x i ) ( −1) = 0 ∑ yi − na − b ∑ x i = 0
⇒ ⇒
∂S = 0 ∑ 2 ( yi − a − b ⋅ x i ) ( − x i ) = 0 ∑ xi yi − a ∑ x i − b ∑ x i = 0
2
∂b
obţinându-se sistemul de ecuaţii normale:
n n
na + b ∑
i =1
xi = ∑
i =1
yi
n n n
a x + b x 2 = x y
∑
i =1
i ∑i =1
i ∑
i =1
i i
19
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
Rezolvarea sistemului poate fi realizată folosind metoda determinanţilor, după cum urmează:
; , unde:
∆a ∆b
a= b=
∆ ∆
∆a =
∑y ∑x i i
∑x y ∑x i i i
2
∆b =
n ∑y i
∑x i ∑x y i i
∆=
n ∑x i
∑ xi ∑x i
2
∆a ∑ yi ⋅ ∑ xi − ∑ xi ⋅ ∑ xi y i
2
a = =
∆ n∑ xi2 − ( ∑ xi )
2
b = ∆b = n ⋅ ∑ xi yi − ∑ xi ⋅ ∑ yi
∆ n∑ xi2 − ( ∑ xi )
2
Sau
n
n
∑ yi − b ∑ xi
i =1
a = y − bx = i =1
n
( )( )
n
∑ xi − x yi − y
∑i xi yi − nxy i =1
n s
b = = = xy2
∑
2 2
sx
( )
n
xi2 − nx
i ∑ i =1
xi − x
n
■ Rămâne de verificat dacă este îndeplinită condiţia de ordin 2, adică soluţia găsită este un punct
de minim. Matricea derivatelor parţiale de ordin doi trebuie să fie pozitiv definită:
∂2 (S ) ∂ 2 (S )
∂ 2 a2 2n 2∑ xi
2 ∂a∂ b
= i
∂ 2 ( S ) 2∑ xi
2
∂ (S ) 2∑ xi
∂b∂a i
∂ 2b 2
i
20
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
2n > 0
4n x 2 − 4( x )2 = 4n ( x − x)2 > 0
∑i i ∑i i ∑i i
=a+bx
xoy=a+bxa) b) c)
b>0
b<0
b=0 Figura 8.7. Linii de regresie cu:
a) pantă pozitivă; b) pantă negativă; c) pantă egală cu zero
∑ y = ∑ $y
i =1
i
i =1
i
Este de remarcat faptul că, dacă datele au fost sistematizate utilizând metoda grupării, iar valorile
şi se întâlnesc cu frecvenţele , atunci sistemul de ecuaţii normale, pentru determinarea
xi yi ni
coeficienţilor a şi b, devine:
;
r r r
a ∑ ni + b∑ xi ni = ∑ yi ni
i =1 i =1 i =1
r r r
a x n + b x2 n = x y n
∑i =1
i i ∑i =1
i i ∑i =1
i i i
21
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
.
r r
∑ y n = ∑ y$ n
i =1
i i
i =1
i i
În cazul în care datele au fost sistematizate într-un tabel cu dublă intrare, iar valorile şi se
xi yi
întâlnesc cu frecvenţele , sistemul devine:
nij
;
r m r m
a ∑∑ nij + b∑ xi ni = ∑ y j n j
i =1 j =1 i =1 j =1
r r r m
a x n + b x2 n =
∑ ∑ ∑∑
i i. i i. xi yi nij
i =1 i =1 i =1 j =1
∑ y j n j = ∑ $y j n j
j =1 j =1
Reamintim că, în cazul legăturii simple liniare, o măsură relativă a dependenţei dintre două
variabile o constituie coeficientul de corelaţie. Acest indicator al corelaţiei standardizează media
produselor abaterilor, semnul lui indicând direcţia legăturii, iar valoarea – intensitatea legăturii.
∑( x − x) ( y − y)
n
cov( x, y ) s i i
rxy = = xy = i =1
sx s y sx ⋅ sy n 2
n 2
(
∑ xi − x
i =1
) (
∑ yi − y
i =1
)
sau, prin transformări elementare:
,
n n n
n∑ xi yi − ∑ xi ∑ yi
∆b
rxy = i =1 i =1 i =1
=
n 2 n 2 n 2 n
2
∆ ⋅ ∆∗
n∑ xi − ∑ xi n∑ yi − ∑ yi
i =1 i =1 i =1 i =1
unde
2
n n
∆ = n∑ y − ∑ yi
∗ 2
i
i =1 i =1
22
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
Valoarea coeficientului de corelaţie ( sau simplu, r) este situată între -1 şi 1. O valoare 1 indică
rxy
o corelaţie liniară directă şi perfectă (funcţională), iar o valoare -1 indică o corelaţie liniară inversă
perfectă. O valoare zero arată (de obicei) lipsă legăturii între variabile. Totuşi, această interpretare trebuie
făcută cu precauţie, deoarece o legătură neliniară, valorile extreme sau aberante pot distorsiona
interpretarea coeficientului de corelaţie. Diagrama de împrăştiere ne va ajuta, în plus, la interpretarea lui r.
Aşadar, coeficientul de corelaţie, r, este un indicator ce caracterizează direcţia şi intensitatea
legăturii liniare. De altfel, se observă că , iar b, coeficientul de regresie (panta liniei drepte),
sx y
rxy =
sx s y
este . Aşadar .
sx y sx
b= r =b
s 2
x
sy
Coeficientul de corelaţie (r) are, deci, acelaşi semn cu coeficientul de regresie (b) şi anume
semnul dat de direcţia legăturii dintre variabile, deoarece şi sunt întotdeauna pozitive.
sx sy
Componentele unei serii cronologice. Ştim că dacă datele statistice sunt transversale (sau dinamice),
adică dacă variabila este măsurată în timp, în ordine secvenţială, atunci, în urma sistematizării, se obţine o
serie cronologică de tipul:
,
1 2 ... t ... n t t = 1, n
=
y1 y2 ... yt ... yn yt
unde reprezintă unităţile de timp (perioade sau momente), iar yt reprezintă nivelurile variabilei
t = 1, n
studiate, Y. Aşadar, într-o serie cronologică, ordinea datelor oferă informaţii importante. O serie
cronologică poate fi formată din patru componente diferite şi anume: 1. Componenta de lungă durată –
trend (YT); 2. Componenta sezonieră (YS); 3. Componenta ciclică (YC); 4. Componenta reziduală (YR).
1. Tendinţa de lungă durată (numită şi trend, tendinţă seculară sau tendinţă pe termen lung) se
manifestă sub influenţa unor factori sistematici cu acţiune îndelungată şi conferă o formă aproximativ
netedă şi o direcţie aproximativ stabilă de evoluţie a fenomenului. Tendinţa de lungă durată se manifestă şi
se pune în evidenţă pe un număr mare de termeni, peste 10-15 termeni. Spre exemplu, populaţia României
(indicator de interes pentru multe din activităţile sectorului terţiar), a cunoscut următoarea evoluţie în
perioada 1980-2005 (număr mediu de locuitori la 1 iulie):
23
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
După cum se observă (figura 11.1), tendinţa de lungă durată nu trebuie întotdeauna să fie liniară. În acest
exemplu, numărul populaţiei a crescut până în 1990, după care se constată o tendinţă descrescătoare, în
perioada 1990-2005. Cu toate acestea, multe variabile social-economice de interes pot avea o tendinţă
liniară pe termen lung, crescătoare ori descrescătoare.
2. Componenta sezonieră are tot o influenţă sistematică, sub forma unor valuri (cicluri) repetitive,
care apar la perioade calendaristice scurte şi, prin definiţie, au o durată mai mică de un an de zile.
Termenul de „variaţii sezoniere” se poate referi, în mod tradiţional, la cele patru anotimpuri (sau
trimestre), ori la fluctuaţiile ce apar în timpul unei luni, unei zile sau chiar în cursul unei zile. Cererea de
produse turistice, producţia şi preţul de vânzare al unor produse agroalimentare, tarifele unor servicii etc.
Pot prezenta astfel de variaţii sezoniere. În general, industria turismului este afectată de sezonalitate. În
funcţie de momentul de re-ferinţă anchetele statistice pot oferi date şi informaţii privind fie trimestrele
calendaristice, fie trimestrele sezoniere. Anchetele bazate pe trimestre sezoniere oferă date decalate cu o
lună faţă de cele calendaristice (Sursa: CANSTAT, Statistical Bulletin, Bucharest, 2002, pg. 96).
Exemplu
Hotelul „CREASTA” dintr-o zonă montană, cu o capacitate de cazare existentă de 140 locuri a înregistrat,
în perioada 2003-2006, următorii indici trimestriali de utilizare netă a capacităţii în funcţiunee (%) (tabelul
11.1.):
Din reprezentarea grafică (figura 11.2.) se observă cu uşurinţă că, în trimestrul III, indicii de utilizare netă
a capacităţii în funcţiune sunt mai ridicaţi decât în celelalte trimestre.
3. Componenta ciclică are, de asemenea, o influenţă sistematică sub forma unor valuri, dar care
apar la un număr mai mare de ani (2-10 ani). Prin definiţie, ciclurile au o durată mai mare de un an de zile
şi sunt determinate de interacţiunea unor factori ce influenţează economia ori planul social (figura 11.3.).
Exemple de astfel de cicluri includ bine-cunoscutele cicluri de afaceri ce includ perioade de recesiune şi
expansiune, ciclurile pe termen lung privind cererea unor mărfuri, ciclurile în sectorul monetar şi
financiar. În practică, ciclurile apar rareori cu regularitate şi adesea se manifestă în combinaţie cu alte
componente. În industria turismului, întâlnim cicluri de viaţă ale destinaţiilor turistice (vezi Stănciulescu,
Gabriela – coord. – Lexicon de termeni turistici, Editura Oscar Print, Bucureşti, 2002).
24
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
aceea, chiar dacă vom caracteriza precis şi exact celelalte componente, nu vom putea previziona la fel de
exact evoluţia viitoare a unei variabile.
Componentele unei serii cronologice pot fi prezentate, pe scurt, astfel (tabelul 11.2.):
Dacă putem determina şi caracteriza componentele care există într-o serie cronologică, vom putea,
apoi, să efectuăm o previzionare validă a evoluţiei viitoare. Caracterizarea şi descrierea tendinţei de lungă
durată se poate face folosind metode statistice (simple) sau analitice. În alegerea uneia sau alteia dintre
metode un rol important îl joacă graficul statistic şi modul în care reuşim să descoperim existenţa şi forma
diferitelor componente din reprezentarea seriei cronologice. Metodele mecanice de descriere a trendului
unei serii cronologice cuprind: metoda modificării medii absolute, metoda indicelui mediu de modificare
şi metoda mediilor mobile. Metodele analitice presupun utilizarea unei funcţii analitice de tendinţă.
Tehnicile de netezire (sau ajustare) a seriei cronologice urmăresc, aşadar, eliminarea sau atenuarea
oscilaţiilor (fluctuaţiilor) sistematice şi nesistematice. Prezentăm, în continuare, modul de estimare a
tendinţei de lungă durată a unei serii cronologice prin metoda mediilor mobile. Metoda mediilor mobile
este utilizată cu deosebire atunci când seria cronologică prezintă fluctuaţii regulate (sezoniere sau ciclice),
pentru a netezi evoluţia fenomenului. Tendinţa pe termen lung se determină sub forma unor medii,
calculate din atâţia termeni (m), la câţi se manifestă o oscilaţie completă. Mediile se numesc mobile,
glisante, deoarece, în permanenţă, în calculul unei astfel de medii se lasă în afară primul termen al mediei
anterioare şi se introduce următorul termen. Astfel, dacă mediile mobile sunt calculate, spre exemplu, din
cinci termeni, fiecare valoare ajustată va cuprinde termenul din perioada respectivă, cei doi termeni
anteriori şi cei doi termeni următori.
25
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
, .
yt − 2 + yt −1 + yt + yt +1 + yt t = 3, n − 2
ytTMM = +2
5
În general, dacă mediile sunt calculate din m termeni (m, număr impar) se vor pierde, prin calculul
mediilor, (m – 1) termeni şi fiecare valoare ajustată va fi situată în dreptul unei valori înregistrate. Dacă,
însă, mediile mobile se calculează din m termeni (m număr par), atunci valorile medii se situează între
termenii reali şi vom centra nivelurile, astfel ajustate, prin calculul unor medii de medii (medii parţiale).
Spre exemplu, dacă o oscilaţie completă are loc la 6 termeni, atunci calculăm medii mobile centrate:
, .
yt −3 y t = 4, n − 3
+ yt − 2 + yt −1 + yt + yt +1 + yt + 2 + t +3
ytTMM = 2 2
6
În acest caz se vor pierde, prin calculul mediilor centrate, m termeni. Prin calculul mediilor mobile,
abaterile sezoniere se compensează.
Exemplu. Să considerăm seria cronologică privind sosirile trimestriale de turişti la hotelul „Creasta”
dintr-o zonă montană (tabelul 11.3.):
Pentru calcularea tendinţei pe termen lung, folosind metoda mediilor mobile din 4 termeni (la câţi
se manifestă o oscilaţie completă), putem sistematiza datele astfel (tabelul 11.4.):
Tabelul 11.4. Calculul mediilor mobile
Anul Trimestrul Perioada(t) yt ytT(MM)
0 1 2 3 4
I 1 940 −
II 2 650 −
2003 1222
III 3 1934
IV 4 1360 1231
I 5 952 1255
II 6 706 1278
2004
III 7 2072 1289
IV 8 1406 1297
I 9 992 1303
II 10 734 1314
2005
III 11 2088 1327
IV 12 1478 1332
I 13 1026 1346
II 14 740 1360
2006
III 15 2190 −
IV 16 1492 −
26
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
Variaţiile sezoniere pot să apară în interiorul unui an sau chiar al unui interval mai scurt de timp, cum ar fi
luna, săptămâna sau ziua. Rezultă deci că, pentru studiul statistic al componentei sezoniere, este necesar să
avem la dispoziţie date sistematizate pe intervale de timp mai mici de un an de zile. Pentru a măsura
efectul sezonier, putem determina devieri sezoniere sau indici de sezonalitate. Devierile sezoniere
măsoară, în medie, abaterile fiecărui sezon de trend, iau valori pozitive şi negative, astfel încât suma
devierilor sezoniere, pentru toate sezoanele, este egală cu zero. Indicii de sezonalitate măsoară, în medie,
de câte ori se abate variabila, în fiecare sezon, de la trend, iau valori supraunitare sau subunitare, astfel
încât produsul lor este egal cu 1.
1. Determinarea devierilor sezoniere
Pentru determinarea devierilor sezoniere se parcurg următorii paşi: 1. Se înlătură din valorile
seriei cronologice (yt) componenta de trend (ytT) determinată prin metoda mediilor mobile sau printr-o
metodă analitică (vom considera o serie fără componenta ciclică, Ct). Atunci: .
yt − ytT = ytS + ytR
2. Pentru fiecare sezon în parte, calculăm media rezultatelor obţinute la pasul 1. În felul acesta
(prin calculul mediei) se înlătură cea mai mare parte din variaţiile reziduale (deşi foarte rar le putem
înlătura în întregime). Aceste medii, calculate pentru m sezoane, măsoară diferenţele faţă de linia de
tendinţă, date de componenta sezonieră.
27
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
3. Devierile sezoniere se vor calcula din valorile obţinute la pasul al doilea, ajustate astfel încât
suma lor să fie egală cu zero .
m
∑ ySk = 0
k =1
Exemplu. După cum se ştie, industria turistică este subiectul unor serioase variaţii sezoniere. Folosind
datele din tabelul 11.3., vom urmări să determinăm devierile sezoniere ale variabilei, „sosiri de turişti”.
Pentru aceasta, vom înlătura mai întâi componenta de trend (col. 3 – col. 4, tabelul 8.4), iar rezultatele (
) le vom sistematiza în tabelul 11.5.
ytS + ytR
persoane, persoane
yS 2 = −590, 7 − (− 5,5) = − 585, 2 ≈ − 585 yS 3 = 752 − ( −5, 5) = 757,5 ≈ 758
persoane
yS 4 = 128 − (− 5, 5) = 133, 5 ≈ 134
Devierile sezoniere în trimestrele I şi II sunt negative (niveluri sub trend), iar trimestrele III şi IV
sunt pozitive (vârfuri de activitate). Rezultatele ne arată că factorul sezonier deviază numărul sosirilor de
28
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
turişti în trimestrul I cu 306 persoane sub linia de trend, în trimestrul II cu 585 persoane sub trend, iar în
trimestrele III şi IV cu 758, respectiv, cu 133 persoane peste tendinţa de lungă durată.
Determinarea indicilor sezonieri. Pentru determinarea indicilor de sezonalitate, metodologia este
similară, parcurgându-se următorii paşi:
1. Se înlătură componenta de trend:
.
yt
= ytS ⋅ ytR
ytT
2. Se calculează, pentru fiecare sezon, media rezultatelor obţinute la punctul 1, eliminând
astfel variaţiile reziduale. 3. Indicii de sezonalitate se determină din mediile obţinute la pasul 2,
ajustate astfel încât indicele mediu să fie egal cu 1. Cele mai exacte rezultate se obţin dacă vom folosi
în calcule media geometrică. Cu toate acestea, pentru uşurinţa calculelor, deseori se foloseşte media
aritmetică.
Exemplu. Pe baza datelor din tabelul 8.3., vom înlătura componenta de trend (col. 3: col. 4) şi
yt : ytT
vom obţine , valori sistematizate în tabelul 11.6.
ytS ⋅ ytR
∏y
k =1
Sk = 0, 761⋅ 0, 555 ⋅1,588 ⋅1, 099 = 0, 737
29
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
∏y
k =1
Sk =1
Indicii de sezonalitate astfel obţinuţi ne arată că, în medie, sosirile de turişti în trimestrele III şi IV
se află peste tendinţa de lungă durată cu 71,4%, respectiv cu 18,6%, iar în trimestrele I şi II, sosirile de
turişti se situează sub linia de trend cu 17,9%, respectiv cu 40,1%. În previzionarea sosirilor de turişti va
trebui să ţinem cont, pentru fiecare trimestru, de influenţa factorului sezonier, influenţă determinată sub
forma devierilor sezoniere sau a indicilor de sezonalitate. După ce am determinat devierile sezoniere ori
indicii de sezonalitate, vom desezonaliza seria cronologică ( ) pentru devieri şi pentru
yt − y Sk yt ySk
indici. Rezultatele astfel obţinute vor conţine doar componenta de tendinţă seculară (ytT) şi componenta
reziduală (ytR). Putem acum să determinăm tendinţa de lungă durată, aplicând o metodă mecanică ori
analitică. Să subliniem însă că, atunci când vom ajunge la etapa de previzionare, va trebui să ţinem cont şi
de devierile sezoniere, ori de indicii de sezonalitate.
A. TC. EXEMPLU
Obiectivul Econometriei
A fost formulată de către statisticianul Ragnar Frisch, în chiar primul număr al revistei Econometrica,
astfel: „experienţa a arătat că fiecare din următoarele trei puncte de vedere, al statisticii, a teoriei
economice şi al matematicii, este o condiţie necesară, dar nu şi suficientă pentru o înţelegere efectivă
a relaţiilor cantitative din economia modernă; unificarea lor este aceea care asigură eficienţa.
Econometria este tocmai această unificare.” Altfel spus, econometria reprezintă studierea
fenomenelor economice pe baza datelor statistice cu ajutorul modelelor matematice.
Definiţia restrictivă: A fost propusă de Cowles Comission for Research in Economics (Chicago,
1940-1950); în această viziune se consideră că econometria presupune investigarea fenomenelor
economice numai cu ajutorul modelelor aleatoare (stochastice, probabilistice); ea include doar
cercetările economice ce utilizează metodele inducţiei matematice la verificarea relaţiilor cantitative
formulate în teoria economică cu privire la fenomenele sau procesele studiate.
Definiţia extinsă: Aparţine economiştilor anglo-saxoni şi consideră că econometria în sens larg
înseamnă econometria în sens restrâns, la care se adaugă metodele cercetării operaţionale.
În prezent, econometria cuprinde şi tehnicile moderne de analiză a datelor (analiza marilor tabele, de
exemplu). Econometria poate fi folosită în două moduri, care nu sunt mutual exclusive: Ca
instrument de previziune (date fiind valori ipotetice ale anumitor variabile, putem previziona valoarea
variabilei de interes). Ca metodă explicativă (poate fi folosită pentru a confirma sau infirma o teorie
economică).
Modelul econometric este instrumentul de cercetare ştiinţifică ce stă la baza econometriei. Modelul
econometric, prin definiţie, este un model economic formulat astfel încât parametrii să poată fi
estimaţi dacă se face presupunerea că modelul este corect. Un model econometric poate fi format din
una sau mai multe relaţii statistice.
30
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
Specificul disciplinei
Deşi în domeniul economic există o mare diversitate de modele, modelarea acestora la orice nivel micro
sau macro economic se poate interpreta ca sistem intrare/ieşire unde Y = (yi) – volumul ieşirilor din
sistem, i=1,...,n, X = (xj) – factorii cantitativi şi calitativi care influenţează ieşirile yi, j=1,...,m, S –
structura sistemului prin intermediul căreia factorii xj determină ieşirile yi
Modelele pot fi:
➢ Modele deterministe: y= f(x) se utilizează frecvent în practica economică în
analiza pe factori a variaţiei, în timp sau spaţiu, a fenomenelor social economice (de
exemplu: Q = wL, unde Q este producţia, w este productivitatea muncii iar L este forţa de
muncă).
➢ Modele nedeterministe (econometrice) descriu legătura statistică sau stochastică
dintre intrările sistemului – factorii de influenţă X – şi ieşirile acestuia , variabilele
rezultative Y, după o relaţie de forma: Y = f(x)+ε, unde:
─ X sunt factorii de influenţă
─ Y este variabila rezultativă
─ f este legea de manifestare a unui fenomen sau proces economic
─ ε este variabila aleatoare
Modelul econometric este instrumentul de cercetare ştiinţifică ce stă la baza econometriei. Modelul
econometric, prin definiţie, este un model economic formulat astfel încât parametrii să poată fi estimaţi
dacă se face presupunerea că modelul este corect.
Un model econometric poate fi format din una sau mai multe relaţii statistice. Aceste relaţii pot fi:
─ relaţii de identitate sau deterministe: sunt formulări logice cu privire la procesul economic descris
(exemplu: VND=C + I, unde VND reprezintă Venitul Naţional Disponibil, C reprezintă consumul total, iar
I reprezintă investiţiile publice şi private);
─ relaţii de comportament: au în vedere modificările tradiţiilor, atitudinilor, înclinaţiilor (sub
raportul satisfacţie/efort) (exemplu: C = a + bV, unde C este consumul, iar V este venitul);
─ relaţii tehnologice: restricţiile impuse output-urilor în raport cu input-urile (exemplu: funcţia
Cobb Douglas: Q=ρI∝L1-α,0<α<1);
─ relaţii instituţionale: sunt relaţii de apar în conformitate cu unele reglementări impuse de lege
(exemplu: amortizarea, impozitul pe venit etc.).
Structura modelului econometric este determinată de variabilele economice. Acestea pot fi:
─ endogene: variabile determinate în cadrul sistemului;
─ exogene: variabile determinate în afara sistemului, despre care modelul econometric nu are nimic
de spus.
Din punct de vedere cronologic, observarea fenomenelor şi proceselor se poate realiza static şi dinamic,
datele primare putând fi:
─ fie o imagine de tip static a populaţiei statistice (datele fiind legate de starea populaţiei la un
moment dat);
─ fie o imagine de tip dinamic, evolutiv – în care datele oferă informaţii despre evoluţia în timp a
uneia din unităţi sau a întregii populaţii.
Aceste două modalităţi de observare a unităţilor unei populaţii conduc la gruparea datelor în trei categorii:
a) date de tip profil – reprezintă rezultatul unor măsurători efectuate la un anumit moment dat asupra
uneia sau mai multor variabile, pe mulţimea unităţilor populaţiei.
Aceste date de profil se mai numesc date de tip secvenţă sau date de tip secţiune şi reprezintă „tăieturi
informaţionale” efectuate într-o populaţie la un moment dat, „tăieturi” care sunt de tip transversal, în
raport cu axa timpului.
Se remarcă următoarele:
─ o observaţie în contextul datelor de tip profil este reprezentată de valoarea sau valorile unei
singure entităţi, ale unei singure unităţi din populaţie; numărul observaţiilor coincide, în cazul datelor de
tip profil, cu numărul unităţilor observate şi investigate;
─ acest tip de date nu încorporează, prin semnificaţia pe care o poartă, influenţa timpului asupra
formării caracteristicilor (semnul scurgerii timpului) nici în mod explicit şi nici în mod implicit;
31
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
a) date de tip serii de timp – numite şi serii cronologice – reprezintă rezultate ale unor măsurători
efectuate asupra caracteristicilor, unităţilor populaţiei studiate, de-a lungul timpului, la momente succesive
sau la anumite intervale de timp.
Acestea sunt date de tip stoc sau de tip flux şi reprezintă „secţiuni informaţionale” de-a lungul axei
timpului, de-a lungul evoluţiei; adică sunt secţiuni longitudinale în raport cu axa timpului.
b) date de tip panel sunt combinaţii, mixturi ale datelor de tip profil şi ale datelor de tipul seriilor de
timp.
Ele sunt rezultate ale măsurătorilor efectuate asupra caracteristicilor unor unităţi individuale, atât de-a
lungul unităţilor individuale, cât şi de-a lungul timplui, sunt „tăieturi informaţionale mixte” transversale şi
longitudinale, în raport cu axa timpului. Caracteristica esenţială a acestor date este, deci, simultaneitatea.
Deşi tipologia modelelor econometrice este foarte variată, ele se pot încadra în câteva tipuri sau clase
principale:
1. După numărul factorilor luaţi în considerare:
─ modelele unifactoriale: y = f(x)+ ε se fundamentează pe ipoteza că, în rândul factorilor de
influenţă ai variabilei rezultative Y, există un factor determinant X, ceilalţi factori, cu excepţia acestuia
având o influenţă întâmplătoare (exprimată prin intermediul variabilei reziduale ε) sau fiind invariabili în
perioada analizată;
─ modele multifuncţionale: y = f(x1,x2,…,xp)+ε elimină deficienţa modelului unifactorial, însă
trebuie ca numărul factorilor luaţi în considerare să nu fie foarte mare pentru a nu fi mult prea complex,
dificil de estimat etc.
1. După forma legăturii dintre variabila rezultativă şi variabilele cauză:
─ modele liniare: dacă legătura este liniară;
─ modele neliniare: dacă legătura este neliniară.
1. După includerea factorului timp în model:
─ modele statice: dependenţa variabilei endogene Y faţă de valorile variabilei exogene Xj se
realizează în aceeaşi perioadă de timp:
y = f(x1t,…,xjt,…,xkt)+εt
─ modele dinamice:
─ introducerea variabilei timp ca o variabilă explicativă
y = f(xt,t)+εt;
─ autoregresive: variabila rezultativă cu valori decalate este una din variabilele explicative
y = f(xt,yt-k)+εt
─ model cu decalaj: variabila explicativă X îşi exercită influenţa asupra variaţiei variabilei
rezultative pe mai multe perioade de timp:
y = f(xt,xt-1,…,xt-k)+εt
1. Modele cu o ecuaţie sau cu ecuaţii multiple:
─ modele cu o singură ecuaţie: toate modelele prezentate anterior
─ modele cu ecuaţii multiple: sunt formate dintr-un sistem de ecuaţii
Y1+b12+…+b1nYn+c11X1+c12X2+…+c1mXm=ε1b21Y2+Y2+…
+b2nYn+c21X1+c22X2+…+c2mXm=ε2⋮bn1Y2+bn2Y2+…+Yn+cn1X1+cn2X2+…
+cnmXm=εn
Yi,i=1,n – variabile rezultative sau endogene
Xj,j=1,m – variabile explicative sau exogene
Procesul de luare a deciziilor presupune analiza, judecarea si interpretarea evidenţelor oferite de datele pe
care le avem la dispoziţie. Managerii trebuie să fie pregătiţi să ia decizii privind acţiunile viitoare pe baza
informaţiilor disponibile. Astfel, ei emit ipoteze pe care le pot testa ştiinţific utilizând metodele si tehnicile
statistice.
32
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
Testarea ipotezelor statistice reprezintă o altă modalitate, alături de estimaţia pe interval de încredere, de
a realiza inferenţă statistică. Scopul acestui tip de inferenţă statistică este să determinăm dacă există
suficiente dovezi statistice care să ne permită să concluzionăm că o afirmaţie (sau o ipoteză) dspre un
parametru este adevărată. În urma prelevării unui eşantion dintr-o populaţie statistica, prin prelucrarea
datelor provenite din sondaj se obţine un estimator al parametrului urmărit în populaţia de origine. Se pune
atunci problema în ce măsură parametrul estimat pe baza rezultatelor sondajului asigură „credibilitatea”
aprecierilor făcute asupra întregii colectivităţi. Estimatorul este, aşadar, o „presupunere” asupra
parametrului, deci o ipoteză statistică. Nu este nevoie să testăm ipoteze statistice atunci când ştim totul
despre un fenomen, ci doar când există incertitudine.
Ipoteza statistică este ipoteza care se face cu privire la parametrul unei repartiţii sau la legea de repartiţie
pe care o urmează anumite variabile aleatoare. O ipoeză statistică nu este neapărat adevărată. Ea poate fi
corectă sau greşită. În statistică, ipotezele apar întotdeauna în perechi: ipoteza nulă si ipoteza alternativă.
Ipoteza statistică ce urmează a fi testată se numeşte ipoteză nulă şi este notată, uzual, H0. Ea constă
întotdeauna în admiterea caracterului întâmplător al deosebirilor, adică în presupunerea că nu există
deosebiri esenţiale. Respingerea ipotezei nule care este testată implică acceptarea unei alte ipoteze.
Această altă ipoteză este numită ipoteză alternativă, notată H1. Cele două ipoteze reprezintă teorii,
mutual exclusive si exhaustive, asupra valorii parametrului populaţiei sau legii de repartiţie. Spunem că
ele sunt mutual exclusive deoarece este imposibil ca ambele ipoteze să fie adevărate. Spunem că ele sunt
exhaustive deoarece acoperă toate posibilităţile, adică ori ipoteza nulă, ori ipoteza alternativă trebuie să
fie adevărată. Procedeul de verificare a unei ipoteze statistice se numeşte test sau criteriu de
semnificaţie. O secvenţă generală de paşi se aplică la toate situaţiile de testare a ipotezelor statistice.
Există patru componente principale ale unui test privind o ipoteză: ipoteza nulă; ipoteza alternativă; testul
statistic; regiunea critică (de respingere). Ipotezele se vor schimba, tehnicile statistice aplicate se vor
schimba, dar procesul rămâne acelaşi, parcurgându-se următorii paşi:
1) Se identifică ipoteza statistică specială despre parametrul populaţiei sau legea de repartiţie (H0).
Ipoteza statistică – numită şi ipoteză nulă – specifică întotdeauna o singură valoare a parametrului
populaţiei şi reprezintă status-quo-ul, ceea ce este acceptat până se dovedeşte a fi fals.
2) Întotdeauna, ipoteza nulă este însoţită de ipoteza alternativă (de cercetat), H1, ce reprezintă o teorie care
contrazice ipoteza nulă. Ea va fi acceptată doar când există suficiente dovezi, evidenţe, pentru a se
stabili că este adevărată.
Ipoteza alternativă este cea mai importantă, deoarece este ipoteza care ne răspunde la întrebare. Ipoteza
alternativă poate căpăta trei forme, care răspund la trei tipuri de întrebări referitoare la parametrul studiat:
─ dacă parametrul este diferit (mai mare sau mai mic) decât valoarea specificată în ipoteza nulă;
─ dacă parametrul este mai mare decât valoarea specificată în ipoteza nulă;
─ dacă parametrul este mai mic decât valoarea specificată în ipoteza nulă.
3) Se calculează indicatorii statistici în eşantion, utilizaţi pentru a accepta sau a respinge ipoteza nulă şi se
determină testul statistic ce va fi utilizat drept criteriu de acceptare sau de respingere a ipotezei nule.
Pentru cele mai multe testări statistice ale ipotezelor, testul statistic este derivat din estimatorul punctual al
parametrului ce va fi testat. Spre exemplu, deoarece media eşantionului este un estimator punctual al
mediei din colectivitatea generală, ea va fi utilizată în testarea ipotezelor privind parametrul media
colectivităţii generale.
4) Se stabileşte regiunea critică, Rc. Regiunea critică reprezintă valorile numerice ale testului statistic
pentru care ipoteza nulă va fi respinsă. Regiunea critică este astfel aleasă încât probabilitatea ca ea să
conţină testul statistic, când ipoteza nulă este adevărată, să fie α, cu α mic (α = 0.01 etc). Verificarea
ipotezei nule se face pe baza unui eşantion de volum n, extras din populaţia X, care este o variabilă
aleatoare. Dacă punctul definit de vectorul de sondaj x1, x2, ..., xn cade în regiunea critică Rc, ipoteza H0 se
respinge, iar dacă punctul cade în afara regiunii critice Rc, ipoteza H0 se acceptă. Regiunea critică este
delimitată de valoarea critică, C – punctul de tăietură în stabilirea acesteia. În baza legii numerelor mari,
numai într-un număr foarte mic de cazuri punctul rezultat din sondaj va cădea în Rc, majoritatea vor cădea
în afara regiunii critice. Nu este însă exclus ca punctul din sondaj să cadă în regiunea critică, cu toate că
ipoteza nulă despre parametrul populaţiei este adevarată. Cu alte cuvinte, atunci când respingem ipoteza
nulă, trebuie să ne gândim de două ori, deoarece există două posibilităţi: ea este falsă într-adevăr şi ea este
totuşi adevărată, deşi pe baza datelor din sondaj o respingem.
33
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
La fel şi pentru situaţia în care acceptăm ipoteza nulă H0. Când ipoteza nulă nu poate fi respinsă (nu există
suficiente dovezi pentru a fi respinsă), sunt două posibilităţi: ipoteza nulă este adevărată si ipoteza nulă
este totuşi falsă, greşită, deşi nu am respins-o. De aceea, este mai corect să spunem că, pe baza datelor
din eşantionul studiat,nu putem respinge ipoteza nulă, decât să spunem că ipoteza nulă este adevărată.
Eroarea pe care o facem eliminând o ipoteză nulă, deşi este adevărată, se numeşte eroare de genul întâi.
Probabilitatea comiterii unei astfel de erori reprezintă riscul de genul întâi (α) şi se numeşte nivel sau
prag de semnificaţie.
Nivelul de încredere al unui test statistic este (1 – α), iar în expresie procentuală, (1 – α)100 reprezintă
probabilitatea de garantare a rezultatelor. Eroarea pe care o facem acceptând o ipoteză nulă, deşi este falsă,
se numeşte eroare de genul al doilea, iar probabilitatea (riscul) comiterii unei astfel de erori se notează cu
β. Puterea testului statistic este (1 – β).
Se cere să se determine, folosind testul F de analiză dispersională, dacă variaţia timpului scurs până la
prima promovare este influenţată semnificativ de mărimea firmei.
Rezolvare:
Notăm cu X – caracteristica „mărimea firmelor” – factorul de grupare şi cu Y – caracteristica „număr de
săptămâni de la angajare până la prima promovare”. Se formulează următoarele ipoteze:
H 0 : µ1 = µ2 = µ3
H1 : µi ≠ µ j , i ≠ j
Unde i reprezintă timpul mediu de promovare pentru firma din grupa „i”, la nivelul colectivităţii
generale. Calculăm, la nivelul eşantionului, mediile pentru fiecare grupă i ( ), cu , unde i
yi i = 1,3
reprezintă grupa (mărimea firmei):
săptămâni;
3
∑y
j =1
1j
30 + 26 + 30 + 38 + 32 + 24 + 32 + 28
y1 = = = 30, 00
n1 8
săptămâni;
5
∑y
j =1
2j
34 + 32 + 25 + 36 + 33
y2 = = = 32
n2 5
34
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
săptămâni.
7
∑y
j =1
3j
47 + 41 + 43 + 48 + 40 + 49 + 40
y3 = = = 44
n3 7
Numărul mediu de săptămâni pentru întreaga colectivitate de 20 de firme poate fi calculat ca medie a
mediilor parţiale:
săptămâni.
y=
∑yn i i
=
30 ⋅ 8 + 32 ⋅ 5 + 44 ⋅ 7
=35, 4
∑n i 20
Determinăm dispersia fiecărei grupe i ( ):
si2
∑( y )
8 2
1j − y1
j =1 (26 − 30)2 + (32 − 30)2 + (38 − 30) 2
s =
2
1 = +
n1 8
(24 − 30)2 + (32 − 30) 2 + (28 − 30) 2 128
+ = =16
8 8
∑( y )
5 2
2j − y2
j =1 (34 − 32) 2 + (25 − 32)2 + (36 − 32)2 + (33 − 32)2
s22 = = =
n2 5
70
= = 14
5
∑( y )
7 2
3j − y3
j =1 (47 − 44)2 + (41 − 44) 2 + (43 − 44) 2
s32 = = +
n3 7
(48 − 44) 2 + 2(40 − 44) 2 + (49 − 44) 2 92
= = = 13,14
7 7
Varianţa sistematică va fi:
( )
r 2
S1 = ∑ yi − y ⋅ ni =(30 −35, 4)2 ⋅8 +(32 −35, 4)2 ⋅5 +
i =1
( )
r ni 2 r
S 2 = ∑∑ yij − y i = ∑ si2 ⋅ ni = 128 + 70 + 92 = 290
i =1 j =1 i =1
35
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
S1 808,8
s12 = = = 404, 4
r −1 2
Dispersia corectată reziduală este:
S2 290
s22 = = =17, 06
n − r 17
Testul F:
s12 404, 4
F= = = 23, 7
s22 17, 06
2. În vederea fundamentării deciziei de înlocuire a unor utilaje din dotarea unei fabrici, managerul
acesteia solicită o analiză a vechimii utilajelor şi a costului de întreţinere anual al acestora. Astfel, cele 110
utilaje din dotarea fabricii sunt grupate după vechime (ani) şi după costul de întreţinere (mii lei):
Costul de întreţinere (mii lei)
Vechime(ani) Total
5–7 7–9 9–11 11–13
Mică (< 5 ani) 10 8 5 − 23
Medie (5–10 ani) − 15 20 7 42
Mare (> 10 ani) − 2 25 18 45
Total 10 25 50 52 110
Se cere să se determine dacă influenţa vechimii asupra variaţiei costului de întreţinere este semnificativă,
utilizând testul F de analiză dispersională.
Rezolvare: Notăm cu X – caracteristica „vechime” – factorul de grupare şi cu Y – caracteristica „costul de
întreţinere”. În vederea calculării indicatorilor necesari determinării statisticii F datele vor fi sistematizate
pentru fiecare categorie de vechime conform tabelelor de mai jos.
36
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
; .
y1 =
∑y n j 1j
=
174
= 7,56 mii RON 2 ∑( y − y )
j 1
2
n1 j 55, 653
s1 = = = 2, 42
∑n 1j 23
∑n 1j 23
5–7 − 6 −
7–9 15 8 120 -1,62 39,366
9–11 20 10 200 0,38 2,888
11–13 7 12 84 2,38 39,6508
Total 42 − 404 − 81,9048
; .
y2 =
∑y n j 2j
=
404
= 9, 62 mii RON 2 ∑( y − y )j 2
2
n2 j 81,9048
s2 = = =1,95
∑n 2j 42
∑n 2j 42
5–7 − 6
7–9 2 8 16 -2,7 14,58
9–11 25 10 250 -0,7 12,25
11–13 18 12 216 1,3 30,42
Total 45 − 482 − 57,25
; .
y3 =
∑y n j 3j
=
485
= 10, 7 mii RON 2 ∑( y − y )j 3
2
n3 j 57, 25
s3 = = = 1, 27
∑n 3j 45
∑n 3j 45
( ) = ∑s
r ni 2 r
S 2 = ∑∑ yij − y i i
2
⋅ ni = 2, 42 ⋅ 23 + 1,95 ⋅ 42 + 1, 27 ⋅ 45 = 194, 7
i =1 j =1 i =1
Costul mediu de întreţinere pentru întreaga colectivitate de 110 utilaje poate fi calculată ca medie a
mediilor parţiale:
.
y=
∑yn i i
=
7,56 ⋅ 23 + 9, 62 ⋅ 42 + 10, 7 ⋅ 45
=9, 64 mii RON
∑n i 110
37
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
( )
r 2
S1 = ∑ yi − y ⋅ ni =(7,56 −9, 64)2 ⋅23 +(9, 62 −9, 64) 2 ⋅42 +
i =1
1. Pentru un magazin de mobilă s-au cules date privind numărul de spoturi publicitare difuzate şi
numărul vizitatorilor (mii pers.) timp de 14 zile:
Se cere:
a) Reprezentaţi grafic datele. Comentaţi graficul.
b) Pe baza datelor de la nivelul eşantionului, determinaţi ecuaţia de regresie care modelează
legătura dintre cele două variabile şi calculaţi numărul zilnic previzionat de vizitatori.
38
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
Rezolvare:
a) Notăm cu X variabila factorială, independentă „nr. spoturi publicitare” şi cu Y variabila
dependentă „nr. vizitatori”.
Pentru a identifica existenţa, forma şi sensul legăturii dintre variabilele analizate, construim
corelograma (figura 4.10.).
Se observă că legătura dintre variabile este directă şi liniară (întrucât dreapta de regresie are pantă
pozitivă), iar ecuaţia de regresie va avea forma:
yˆ i = a + bxi
b) Pentru a determina estimatorii a şi b, rezolvăm sistemul de ecuaţii normale, folosind datele din
tabelul de lucru 4.5.:
na + b∑ xi = ∑ yi
a ∑ xi + b∑ xi = ∑ xi yi
2
(numărul observaţiilor).
n = 14
yˆ i = 2, 2858
( yi − yˆi ) ( yˆi − y ) ( xi − x )
2 2 2
xi yi xi2 xi yi yi2
+5, 0753xi
7 42 49 294 1764 37,81 17,53 3,29 0,13
5 32 25 160 1024 27,66 18,82 69,52 2,70
1 10 1 10 100 7,36 6,96 820,19 31,84
8 40 64 320 1600 42,89 8,34 47,44 1,84
10 61 100 610 3721 53,04 63,39 290,31 11,27
2 8 4 16 64 12,44 19,68 555,25 21,56
6 35 36 210 1225 32,74 5,12 10,64 0,41
7 34 49 238 1156 37,81 14,54 3,29 0,13
9 45 81 405 2025 47,96 8,78 143,12 5,56
3 11 9 33 121 17,51 42,40 341,82 13,27
12 64 144 768 4096 63,19 0,66 739,24 28,70
8 37 64 296 1369 42,89 34,67 47,44 1,84
4 30 16 120 900 22,59 54,96 179,91 6,98
39
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
∆ 2y = 4046, 000 n −1 =
Totală
= 14 − 1 = 13
Valoarea teoretică pentru un prag de semnificaţie = 0,005 şi 1, respectiv 12 grade de libertate,
preluată din tabelul repartiţiei Fisher, este .
Fα ;k ;n − k −1 = 4, 75
Întrucât se respinge H0, adică se concluzionează că modelul este valid.
Fcalc > Fα ;k ;n −k −1
Calculele intermediare se găsesc în tabelul 4.5.
40
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
,
yi = α + β xi + ε i
iar la nivelul eşantionului:
yi = a + bxi + ei
Pentru testarea semnificaţiei parametrilor modelului de regresie liniară şi estimarea lor pe
intervalele de încredere se procedează astfel:
1) pentru parametrul β
Ipotezele testate sunt:
,
H 0 : β = 0( µb = β = 0)
.
H1 : β ≠ 0
Deoarece volumul eşantionului este mic ( ), vom utiliza testul t:
n < 30
, statistică ce urmează o distribuţie t cu ( ) grade de libertate.
b − µb b − 0 n−2
tcalc = =
sb sb
Unde
se 5, 046
sb = = = 0, 4187
n
145, 21
∑ (x − x )
i =1
i
2
Iar
n
∆ e2 ∑ ( y − yˆ )
i i
2
305,53
se = = i=1
= = 5, 046
n−2 n−2 12
Se obţine
tcalc = 12,1206
Pentru un prag de semnificaţie de 5%, valoarea teoretică a testului este . Deoarece
tα 2;13 = 2,179
vom concluziona că este foarte improbabil ca estimatorul b să provină dintr-o populaţie cu
tcalc > tα 2;13
(adică β este semnificativ diferit de zero), deci parametru β este semnificativ statistic.
β =0
Intervalul de încredere pentru parametrul β, coeficientul de regresie din colectivitatea generală,
este:
41
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
, adică .
b − tα 2, n −2 ⋅ sb ≤ β ≤ b + tα 2, n −2 ⋅ sb 4,1629 ≤ β ≤ 5, 9876
2) pentru parametrul a
Ipotezele testate sunt:
,
H0 : α = 0
.
H1 : α ≠ 0
Statistica t este:
.
a − µa a − 0
tcalc = =
sa sa
Unde
n
∑x 2
i
763
sa = se i =1
= 5, 046 ⋅ = 3, 0912
n
14 ⋅145, 21
n∑ ( xi − x ) 2
i =1
tcalc = 0, 7394
Pentru un prag de semnificaţie de 5%, valoarea teoretică a testului este . Deoarece
tα 2;13 = 2,179
vom concluziona că este foarte probabil ca estimatorul a să provină dintr-o populaţie cu
tcalc < tα 2;13
(adică α nu este semnificativ diferit de zero).
α =0
Intervalul de încredere pentru parametrul α este dat de:
, adică .
a − tα 2,n −2 ⋅ sa ≤ α ≤ a + tα 2, n − 2 ⋅ sa −4, 4495 ≤ α ≤ 9, 0210
Un argument suplimentar pentru concluzia că parametrul α este nesemnificativ statistic este acela
că intervalul de încredere include şi valoarea zero.
e) Pentru a măsura intensitatea legăturii dintre cele două variabile, se va calcula mai întâi
coeficientul de corelaţie liniară:
42
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
n∑ xi yi − ∑ xi ∑ yi ∆b
r= = =
n x 2 − ( x ) n y2 − (
∑ i ∑ i ∑ i ∑ yi ) ∆ n∑ yi2 − ( ∑ yi )
2 2 2
10318 10318
= = = 0, 9615
2033(14 ⋅ 22190 − 504 ) 10731
2
Acest indicator ne arată o legătură directă şi foarte puternică (r este pozitiv şi apropiat de valoarea
unitară).
Pentru testarea semnificaţiei coeficientului de corelaţie liniară simplă, se procedează astfel:
Ipotezele testate sunt:
(ρ nu este semnificativ statistic)
H0 : ρ = 0
(ρ este semnificativ statistic).
H1 : ρ ≠ 0
Statistic t este:
.
r r n − 2 0,9615 ⋅ 12
tcalc = = = =12,12
sr 1− r2 1 − 0,96152
Cum valoarea tabelară a testului t, pentru un prag de semnificaţie de 5% şi 12 grade de libertate
este 2,179 rezultă ,deci coeficientul de corelaţie este semnificativ statistic.
tcalc > tα ;n − 2
Un alt indicator utilizat atât în cazul legăturilor liniare, cât şi al celor neliniare este raportul de
corelaţie R:
R = Ry / x = 1 −
∑ ( y − yˆ )
i i
2
= 1−
305, 53
= 0, 9615
∑ ( y − y)i
2
4046
y=
∑y i
=
504
= 36
n 14
, deci există o legătură liniară, puternică şi directă între cele două variabile.
Ry / x = ry / x = 0,9615
Testarea semnificaţiei raportului de corelaţie se face cu testul F:
n − k −1 R2
F= ⋅ = 146,9
k 1− R2
Valoarea teoretică pentru un prag de semnificaţie α = 0,05 şi 1, respectiv 12 grade de libertate,
preluată din tabelul repartiţiei Fisher, este .
Fα ;k ;n −k −1 = 4,75
43
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
( xi − x )
i =1
Intervalul de încredere este:
, adică (64,71; 92,11) mii persoane.
( )
2
1 xn +1 − x
$
y n +1,i ± tα /2, n −2 se 1 + + n
n
∑ ( xi − x)2
i =1
2
1
= se2 + n
x n(+1 − x ) 1 (8 − 6, 64) 2
= 25, 461⋅ +
s(2yˆ n+1 ) = 2,14
n 2 14 145, 21
∑i =1
( xi − x)
Intervalul de încredere pentru media de răspuns este:
44
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
( )
2
1 xn +1 − x
$
y n +1 ± tα /2,n − 2 se + n
n
∑ ( xi − x)2
i =1
Se cere:
a) Să se determine mediile mobile din câte 4 termeni consecutivi.
b) Să se determine abaterile sezoniere şi coeficienţii (indicii) sezonieri.
c) Să se determine trendul pentru seria desezonalizată.
d) Să se extrapoleze seria de date privind volumul vânzărilor de jucării electronice pentru
trimestrul III, anul 2006, folosindu-se cea mai bună metodă de ajustare.
Rezolvare:
a) Datele fiind trimestriale, se vor calcula medii mobile din număr par de termeni (p = 4).
Mecanismul de calcul şi mediile mobile parţiale şi finale sunt prezentate în tabelul 8.12., coloanele 2 şi 3.
Tabelul 8.12.
Anul şi trimestrul Termenii seriei Medii mobile parţiale Medii mobile centrate
0 1 2 3
I 10 −
II 14 −
2002 III 11 14 14,125
IV 21 14,25 14,5
I 11 14,75 14,625
II 16 14,5 14,625
2003 III 10 14,75 15,125
IV 22 15,5 15,75
I 14 16 16,375
2004 II 18 16,75 16,75
III 13 16,75 16,625
IV 22 16,5 16,25
I 13 16 15,5
2005 II 16 15 15,375
III 9 15,75 −
IV 25 −
45
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
10 11
+ 14 + 11 + 21 +
MM 1 = 2 2 = 14,125
4
A doua medie mobilă va fi:
14 16
+ 11 + 21 + 11 +
MM 2 = 2 2 = 14,5
4
Etc.
Ultima medie mobilă va fi:
22 25
+ 13 + 16 + 9 +
MM 12 = 2 2 = 15,375
4
b) Se vor folosi datele din tabelul 8.11., pentru care s-au calculat mediile mobile din tabelul 8.12.
Pentru analiza sezonalităţii vom aplica, pe rând, modelul aditiv şi cel multiplicativ.
I) Modelul aditiv
• Se elimină din termenii reali yt valorile de trend ( ), determinate prin metoda mediilor mobile.
yˆt
Rezultaele se găsesc în coloana 3 a tabelului 8.13., începând cu trimestrul III/2002:
( yt − yˆ t ) III /'02 = 11 − 14,125 = −3,125 mii buc.
1,375 + 1, 25 + 0, 625
S II' = =1, 083 mii buc.
3
46
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
6, 5 + 6, 25 + 5, 75
S IV' = = 6,167 mii buc.
3
Media devierilor sezoniere brute:
S I' + S II' + S III
'
+ S IV' −2, 667 + 1, 083 − 3,958 + 6,167
S =
'
= = 0,15625
4 4
Devierile sezoniere corectate:
Tabelul 8.13.
Trendul (medii
mobile) SCR
yt − yˆ t Componenta
Anul şi trimestrul yt corectată yt
yˆ t aleatoare ε t
- sj
0 1 2 3 4 5 6
I 10 − − 13 −
II 14 − − 13 −
2002
III 11 14,125 -3,125 15 0,989
IV 21 14,5 6,5 15 0,489
47
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
Tabelul 8.14.
Diferenţe sezoniere Devieri
sezoniere Devieri
brute sezoniere
Trim.
2002 2003 2004 2005 corectate
S 'j (Sj)
0 1 2 3 4 5 6
I − -3,125 -2,375 -2,5 -2,667 -2,823 ~ -3
II − 1,375 1,25 0,625 1,083 0,927 ~ 1
III -3,125 -5,125 -3,625 − -3,958 -4,144 ~ -4
IV 6,5 6,25 5,75 − 6,167 6,011 ~ 6
'
S II* = 3 1, 094 ⋅1, 075 ⋅1, 041 =1, 07
*'
S III = 3 0, 779 ⋅0, 661 ⋅0, 792 = 0, 741
48
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
'
S IV* = 3 1, 448 ⋅1,397 ⋅1,354 =1, 400
Media indicilor de sezonalitate bruţi:
' 4 '
S * = S I* ⋅ SII* ⋅ SIII
*
⋅ SIV
*
= 4 0,824 '⋅1, 07 ⋅ 0, 741⋅1, 400 = 1, 00875
Indicii de sezonalitate corectaţi:
' '
S I* 0,824 S II* 1, 07
S = *
I = = 0,817 S = *
II = = 1, 061
*' 1, 00875 *' 1, 00875
S S
*' *'
S III 0, 741 S IV 1, 4
S *
III = = = 0, 734 S *
IV = = = 1,388
*' 1, 00875 *' 1, 00875
S S
• Se calculează termenii seriei cronologice corectate, împărţindu-se termenii reali la indicii de
sezonalitate bruţi (coloana 5/tabelul 8.15.).
• Se determină componenta aleatoare, împărţindu-se termenii reali la produsul dintre trend şi
indicii de sezonalitate (coloana 6/tabelul 8.15.).
Tabelul 8.15.
Trendul (medii Componenta
mobile) SCR aleatoare
Anul şi trim. yt yt / yˆ t corectată
yˆ t yt / sj* ε t*
0 1 2 3 4 5 6
I 10 − − 12,240 ~ 12 −
II 14 − − 13,195 ~ 13 −
2002
III 11 14,125 0,779 14,986 ~ 15 1,061
IV 21 14,5 1,448 15,130 ~ 15 1,043
I 11 14,625 0,779 13,464 ~ 13 0,921
II 16 14,625 1,094 15,080 ~ 15 1,031
2003
III 10 15,125 0,661 13,624 ~ 14 0,901
IV 22 15,75 1,397 15,850 ~ 16 1,006
I 14 16,375 0,855 17,136 ~ 17 1,046
II 18 16,75 1,075 16,965 ~ 17 1,013
2004
III 13 16,625 0,782 17,711 ~ 18 1,065
IV 22 16,25 1,354 15,850 ~ 16 0,975
I 13 15,5 0,839 15,912 ~ 16 1,026
II 16 15,375 1,041 15,080 ~ 15 0,981
2005
III 9 − − 12,261 ~ 12 −
IV 25 − − 18,011 ~ 18 −
Tabelul 8.16.
Trim. Indici de sezonalitate Indici de Indici de
sezonalitate sezonalitat
2002 2003 2004 2005 e corectaţi
49
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
bruţi ( )
' S*
0 1 2 3 4 5 S *j 6j
I − 0,799 0,855 0,839 0,824 0,817
II − 1,094 1,075 1,041 1,07 1,061
III 0,779 0,661 0,782 − 0,741 0,734
IV 1,448 1,397 1,354 − 1,400 1,388
Total 1,00875
În trimestrul I al fiecărui an, factorul sezonier a determinat o scădere a valorii producţiei vândute
cu aproximativ 81,7 – 100 = –18,3%; în trimestrul II al fiecărui an, factorul sezonier a determinat o
creştere a valorii producţiei vândute cu 106,1 – 100 = 6,1% faţă de linia de trend; în trimestrul III al
fiecărui an, factorul sezonier a dus la o scădere a valorii producţiei cu 73,4 – 100 = –26,6% faţă de linia de
trend, iar în trimestrul IV al fiecărui an, factorul sezonier a determinat o creştere a valorii producţiei cu
138,8 – 100 = 38,8% faţă de linia de trend.
c) Pentru seria corectată de sezonalitate cu ajutorul indicilor de sezonalitate (tabelul 8.15., coloana
5), determinarea trendului se poate face prin metode mecanice sau analitice.
Tabelul 8.17.
0 1 2 3 4 5 6 7 8
I 12 12,0 12,00 -15 225 -180 13,67
2002 II 13 12,4 12,32 -13 169 -169 13,86
III 15 12,8 12,66 -11 121 -165 14,06
IV 15 13,2 13,00 -9 81 -135 14,25
I 13 13,6 13,35 -7 49 -91 14,45
II 15 14,0 13,71 -5 25 -75 14,64
2003
III 14 14,4 14,08 -3 9 -42 14,83
IV 16 14,8 14,46 -1 1 -16 15,03
I 17 15,2 14,85 1 1 +17 15,22
II 17 15,6 15,25 3 9 +51 15,42
2004
III 18 16,0 15,66 5 25 +90 15,61
IV 16 16,4 16,09 7 49 +112 15,80
I 16 16,8 16,52 9 81 +144 16,00
2005 II 15 17,2 16,97 11 121 +165 16,19
III 12 17,6 17,42 13 169 +156 16,39
IV 18 18,0 18,00 15 225 +270 16,58
Total 242 0 1360 132
50
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
;
n
∑∆ t / t −1
∆ n /1 y n − y1 18 − 12
∆= t =2
= = = = 0, 4 mii.buc.
n −1 n −1 n −1 15
yˆt ( ∆ ) = y1 + ( t −1) ⋅ ∆
; (tabelul 8.17. coloana 3)
yˆt ( ∆ ) = 12 + (t − 1) ⋅ 0, 4; t = 1,16
( )
t −1
yˆt ( I ) = y1 ⋅ I
∑ t 2 1360
(tabelul 8.17. coloana 8)
yˆt = 15,125 + 0, 097 ⋅ t
d) Alegem cea mai bună metodă de ajustare a seriei cronologice, ca fiind cea pentru care se obţine
minimul expresiei: . Conform tabelului 8.18. valoarea minimă a expresiei se obţine pentru
∑ ( y − yˆ )
2
t t
( yt − yˆt ) ( yt − yˆ t )
2 2
( yt − yˆ t )
2
51
Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
Determinăm întâi valoarea de trend pentru trimestrul III 2006, pe baza metodei trendului liniar.
mii buc.
yˆ III 2006 = 15,125 + 0, 097 ⋅ 21 = 17,162
Se calculează apoi volumul previzionat al vânzărilor pentru trimestrul III 2006, ţinându-se cont şi de
influenţa factorului sezonier: pe baza modelului aditiv: mii buc.; pe
yIIIp 2006 = 17,162 − 4,114 = 13, 048
baza modelului multiplicativ: mii buc.
yIIIp 2006 = 17,162 ⋅ 0, 734 = 12,597
OBSERVAŢII FINALE
1. Se va alege un singur exemplu pentru aplicaţia din TC (punctul 3) din cele de mai sus.
2. TC se va utiliza în timpul lucrării de verificare.
3. Întrebările la Verificare (lucrarea scrisă) vor fi din TC, astfel:
a. Definiţi ob. de studiu al econometriei (1 punct)
b. Precizaţi şi exemplificaţi noţiunea de model econometric (2 puncte)
c. Specificul econometriei (2puncte)
d. Daţi un exemplu cu elementele definitorii (nu cu tot cu calcule). (4 puncte).
e. 1 punct din oficiu.Total 10puncte. Timp de lucru 60 minute. Rezultatele se dau după
o oră de la finalul lucrări (adică la ora 19,30).
52