GhidECO2009 AAI

Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)
MATERIAL UTIL PENTRU ACOPERIREA TUTUROR ELEMENTELOR

NECESARE VERIFICĂRII (Disponibil în format electronic)
A. TEORIE (27p)
Etapele demersului econometric sunt:
➢ Delimitarea ipotezelor din teoria economică ce urmează a fi testate;
➢ Formularea matematică a ipotezelor economice;
➢ Specificarea modelului econometric;
➢ Culegerea datelor;
➢ Estimarea parametrilor;
➢ Predicţia pe baza modelului;
➢ Concluzii şi recomandări.
Modelul econometric
Deşi în domeniul economic există o mare diversitate de modele, modelarea acestora la orice nivel
micro sau macro economic se poate interpreta cu ajutorul modelului de sistem Intrare/Ieşire: unde Y = (yi)
– volumul ieşirilor din sistem, i=1,...,n
X = (xj) – factorii cantitativi şi calitativi care influenţează ieşirile yi, j=1,...,m
S – structura sistemului prin intermediul căreia factorii xj determină ieşirile yi
Modelele pot fi:

➢ Modele deterministe: y= f(x) se utilizează frecvent în practica economică în analiza pe
factori a variaţiei, în timp sau spaţiu, a fenomenelor social economice (de exemplu: Q =
wL, unde Q este producţia, w este productivitatea muncii iar L este forţa de muncă).
➢ Modele nedeterministe (econometrice) descriu legătura statistică sau stochastică dintre
intrările sistemului – factorii de influenţă X – şi ieşirile acestuia , variabilele rezultative Y,
după o relaţie de forma: Y = f(x)+ε
unde: X sunt factorii de influenţă, Y este variabila rezultativă, f este legea de manifestare a unui fenomen
sau proces economic, ε este variabila aleatoare
Modelul econometric este instrumentul de cercetare ştiinţifică ce stă la baza econometriei.

Modelul econometric, prin definiţie, este un model economic formulat astfel încât parametrii să poată fi
estimaţi dacă se face presupunerea că modelul este corect.
Un model econometric poate fi format din una sau mai multe relaţii statistice. Aceste relaţii pot fi:
─ relaţii de identitate sau deterministe: sunt formulări logice cu privire la procesul
economic descris (exemplu: VND=C + I, unde VND reprezintă Venitul Naţional Disponibil, C reprezintă
consumul total, iar I reprezintă investiţiile publice şi private);
─ relaţii de comportament: au în vedere modificările tradiţiilor, atitudinilor, înclinaţiilor
(sub raportul satisfacţie/efort) (exemplu: C = a + bV, unde C este consumul, iar V este venitul);
─ relaţii tehnologice: restricţiile impuse output-urilor în raport cu input-urile (exemplu:
funcţia Cobb Douglas: Q=ρI∝L1-α,0<α<1);
─ relaţii instituţionale: sunt relaţii de apar în conformitate cu unele reglementări impuse de
lege (exemplu: amortizarea, impozitul pe venit etc.).
Structura modelului econometric este determinată de variabilele economice. Acestea pot fi:
─ endogene: variabile determinate în cadrul sistemului;
─ exogene: variabile determinate în afara sistemului, despre care modelul econometric nu
are nimic de spus.
Din punct de vedere cronologic, observarea fenomenelor şi proceselor se poate realiza static şi
dinamic, datele primare putând fi:
1
─ fie o imagine de tip static a populaţiei statistice (datele fiind legate de starea populaţiei la
un moment dat);
─ fie o imagine de tip dinamic, evolutiv – în care datele oferă informaţii despre evoluţia în
timp a uneia din unităţi sau a întregii populaţii.
Aceste două modalităţi de observare a unităţilor unei populaţii conduc la gruparea datelor în trei
categorii:
a) date de tip profil – reprezintă rezultatul unor măsurători efectuate la un anumit moment
dat asupra uneia sau mai multor variabile, pe mulţimea unităţilor populaţiei.
Aceste date de profil se mai numesc date de tip secvenţă sau date de tip secţiune şi reprezintă
„tăieturi informaţionale” efectuate într-o populaţie la un moment dat, „tăieturi” care sunt de tip
transversal, în raport cu axa timpului.
Se remarcă următoarele:
─ o observaţie în contextul datelor de tip profil este reprezentată de valoarea sau valorile
unei singure entităţi, ale unei singure unităţi din populaţie; numărul observaţiilor coincide, în cazul datelor
de tip profil, cu numărul unităţilor observate şi investigate;
─ acest tip de date nu încorporează, prin semnificaţia pe care o poartă, influenţa timpului
asupra formării caracteristicilor (semnul scurgerii timpului) nici în mod explicit şi nici în mod implicit;
─ ele se referă la starea pe care o au la un moment dat unităţile populaţiei statistice.
a) date de tip serii de timp – numite şi serii cronologice – reprezintă rezultate ale unor
măsurători efectuate asupra caracteristicilor, unităţilor populaţiei studiate, de-a lungul timpului, la
momente succesive sau la anumite intervale de timp.
Acestea sunt date de tip stoc sau de tip flux şi reprezintă „secţiuni informaţionale” de-a lungul
axei timpului, de-a lungul evoluţiei; adică sunt secţiuni longitudinale în raport cu axa timpului.
b) date de tip panel sunt combinaţii, mixturi ale datelor de tip profil şi ale datelor de tipul
seriilor de timp.
Ele sunt rezultate ale măsurătorilor efectuate asupra caracteristicilor unor unităţi individuale, atât
de-a lungul unităţilor individuale, cât şi de-a lungul timplui, sunt „tăieturi informaţionale mixte”
transversale şi longitudinale, în raport cu axa timpului. Caracteristica esenţială a acestor date este, deci,
simultaneitatea.
Deşi tipologia modelelor econometrice este foarte variată, ele se pot încadra în câteva tipuri sau
clase principale:
1. După numărul factorilor luaţi în considerare:
─ modelele unifactoriale: y = f(x)+ ε se fundamentează pe ipoteza că, în rândul factorilor de
influenţă ai variabilei rezultative Y, există un factor determinant X, ceilalţi factori, cu excepţia acestuia
având o influenţă întâmplătoare (exprimată prin intermediul variabilei reziduale ε) sau fiind invariabili în
perioada analizată;
─ modele multifuncţionale: y = f(x1,x2,…,xp)+ε elimină deficienţa modelului
unifactorial, însă trebuie ca numărul factorilor luaţi în considerare să nu fie foarte mare pentru a nu fi mult
prea complex, dificil de estimat etc.
1. După forma legăturii dintre variabila rezultativă şi variabilele cauză:
─ modele liniare: dacă legătura este liniară;
─ modele neliniare: dacă legătura este neliniară.
1. După includerea factorului timp în model:
─ modele statice: dependenţa variabilei endogene Y faţă de valorile variabilei exogene Xj se
realizează în aceeaşi perioadă de timp:
y = f(x1t,…,xjt,…,xkt)+εt
─ modele dinamice:
─ introducerea variabilei timp ca o variabilă explicativă
y = f(xt,t)+εt;
2
─ autoregresive: variabila rezultativă cu valori decalate este una din variabilele explicative
y = f(xt,yt-k)+εt
─ model cu decalaj: variabila explicativă X îşi exercită influenţa asupra variaţiei variabilei
rezultative pe mai multe perioade de timp:
y = f(xt,xt-1,…,xt-k)+εt
1. Modele cu o ecuaţie sau cu ecuaţii multiple:
─ modele cu o singură ecuaţie: toate modelele prezentate anterior
─ modele cu ecuaţii multiple: sunt formate dintr-un sistem de ecuaţii
Y1+b12+…+b1nYn+c11X1+c12X2+…+c1mXm=ε1b21Y2+Y2+…
+b2nYn+c21X1+c22X2+…+c2mXm=ε2⋮bn1Y2+bn2Y2+…+Yn+cn1X1+cn2X2+…
+cnmXm=εn
Yi,i=1,n – variabile rezultative sau endogene
Xj,j=1,m – variabile explicative sau exogene
Transformarea datelor primare

Datele înregistrate, obţinute prin măsurarea pe o scală corespunzătoare şi nesupuse procesului de
transformare sau de prelucrare, se numesc date de intrare, date primare, date totale sau date originale.
a) Rafinarea datelor (purificarea datelor) primare este necesară deoarece le asigură
acestora: consistenţă, relevanţă, comparabilitate.
Aceste cerinţe sunt determinate de diverşi factori: factori specifici, accidentali care conduc la date
aberante; datele exprimate valoric (mai ales ale indicatorilor macroeconomici) sunt afectate de influenţa
modificării preţurilor, modificarea structurilor şi influenţează în consecinţă comparabilitatea lor.
Rafinarea datelor se realizează în general prin: recalcularea datelor după metodologii care au ca
ieşire date comparabile; interpolarea sau completarea datelor omise; extrapolarea: completarea datelor
omise la capetele seriilor de timp; ajustarea datelor, netezirea datelor: pentru eliminarea perturbaţiilor sau
zgomotelor (perturbaţiile aleatoare sunt denumite şi zgomote albe) şi obţinerea datelor care exprimă
tendinţa (trendul evoluţiei).
b) Prelucrarea primară a datelor se realizează prin operaţii de centrare şi standardizare.
Centrarea observaţiilor. Operaţia de centrare a datelor constă în substituirea valorilor fiecărei
observaţii aparţinând unei variabile numerice cu o valoare nouă (transformată), reprezentând abaterea
valorii originale faţă de medie (calculată pe baza datelor iniţiale), după relaţia: xkic=xki-xi, unde xi este
media variabilei i. Standardizarea observaţiilor: presupune operaţii prin care se substituie valoarea
individuală a fiecărei variabile (observaţie) cu o nouă valoare (transformată) individuală, reprezentând
raportul individual dintre valoarea centrată şi abaterea standard a respectivei variabile.
Deci: xkis=xkicSi=xki-xiSi, i=1,2,...,n.
Unde xi este media variabilei i, iar si este abaterea standard a variabilei i.
Variabile aleatoare
În activitatea economică se întâlnesc multe mărimi numerice care variază întâmplător (aleator).
Exemple:
1) Numărul calculatoarelor vândute la un magazin într-o zi este o variabilă aleatoare care
poate lua una din valorile 0, 1 ,2 ,..., n, unde n este numărul total de calculatoare din magazin. Aici,
mulţimea valorilor posibile este {0, 1 ,2 ,..., n}.
2) Timpul necesar servirii unui automobilist la o staţie de benzină este o variabilă aleatoare
care poate lua o valoare dintr-un interval dat (a, b). Aici, mulţimea valorilor posibile este (a, b).
Variabila aleatoare reprezintă o mărime care, în urma unei experienţe, poate lua o valoare dintr-o
mulţime bine definită, numită mulţimea valorilor posibile. Nu se cunoaşte dinainte ce valoare ia variabila
aleatoare; această valoare va fi cunoscută numai după efectuarea experimentului.
Dacă mulţimea valorilor posibile este discretă, atunci variabila aleatoare se numeşte discretă, iar dacă
mulţimea valorilor posibile este continuă (un interval finit sau infinit din R), variabila aleatoare se
numeşte continuă.
3
Variabilele aleatoare se notează, de regulă, cu litere mari de la sfârşitul alfabetului, X, Y, Z etc., iar valorile
pe care le pot lua variabilele aleatoare cu litere mici , x, y, z etc.
3.1.1 Variabile aleatoare discrete

Pentru a defini o variabilă aleatoare discretă, trebuie să enumerăm toate valorile posibile ale
variabilei aleatoare precum şi probabilităţile corespunzătoare.
Exemplu. În cazul aruncării unui zar, definim variabila aleatoare astfel:
1 2 3 4 5 6
X : 1 1 1 1 1

1
 
6 6 6 6 6 6
Se numeşte repartiţie a unei variabile aleatoare discrete enumerarea tuturor valorilor posibile ale
variabilei aleatoare precum şi a probabilităţilor corespunzătoare. În general, fie variabila aleatoare X şi xi,
(i=1, 2, ..., n) valorile ei posibile. Fie Ei evenimentul ca variabila aleatoare , i=1, 2, ..., n şi fie
X = xi
, probabilitatea corespunzătoare unde este funcţia de
P ( Ei ) = P ( X = xi ) = f ( xi ) = pi f ( xi )
probabilitate. Atunci putem scrie:
 x1 x2 ... xn 
X : 
 f ( x1 ) f ( x2 ) ... f ( xn ) 
Mulţimea perechilor ordonate ( ) se numeşte repartiţia variabilei aleatoare discrete X.
xi , f ( xi )
Din exemplele prezentate rezultă că funcţia de probabilitate trebuie să îndeplinească următoarele două
condiţii:
1) ; 2) , deoarece Ei=(X=xi) este un sistem complet de
f ( xi ) ≥ 0, i = 1,…, n n
∑f ( x ) =1
i =1
i
evenimente, adică: .
n
UE
i =1
i = Ω, Ei ∩ E j = Φ, i ≠ j , i, j = 1, …, n
Exemple:
1. Repartiţia binomială (Bernoulli): .
 x 
X : x x n − x  , x = 0,1,… , n
 f ( x ) = Cn p q 
arată probabilitatea ca din n extrageri, x să fie bile albe. Arătăm în continuare că f(x)
f ( x) = C p q
x
n
x n −x
este o funcţie de probabilitate.
4
1) Evident, ;
f ( x) ≥ 0
2) (binomul lui Newton).
n n
∑ f ( x ) = ∑C
x =o x= 0
x
n p x q n − x = ( p + q) n = 1
1. Repartiţia geometrică (Pascal):

Fie X evenimentul ca extragerea bilei albe să se realizeze prima dată la extragerea de ordinul x:
X=(A∩…∩Ax-1∩A), deci . , x=1,2,3,...,n, unde p>0, q>0 şi
P ( x ) = pq x −1  x 
X : x −1 
 f ( x) = p ⋅ q 
p+q=1. Evident : ; , deoarece seria este
f ( x) ≥ 0 ∞ ∞
1 p ∞
∑p ⋅ q
x =1
x −1
= p ⋅ ∑q x −1 = p ⋅
x =1
= =1
1− q p
∑q
x =1
x −1
seria geometrică de raţie 0<q<1, convergentă, cu suma .

1
1− q
Operaţii cu variabile aleatoare discrete; variabile aleatoare independente
Fie ; .
 x ... xi ... xn   y1 ... y j ... ym 
X : 1  X : 
 p1 ... pi ... pn   q1 ... q j ... qm 
.
n m
pi = f ( xi ) ≥ 0; ∑ pi =1; q j = f( y j) ≥0; ∑ q j =1
i =1 j =1
Evenimentul care constă în faptul că:

➢ X ia valoarea xi îl notăm ;
(X = xi ) , i = 1,… , n, P ( X = xi ) = pi
➢ Y ia valoarea yj îl notăm .
( Y = y ) , j = 1, …, m, P ( Y = y )
j j =qj
Evenimentul şi este .
X = xi Y = yj ( X = xi ) ∩ ( Y = y j ) , i = 1, …, n; j = 1, …, m
are o probabilitate bine determinată, notată pij.
P[( X = xi ) ; ( Y = y j ) ] = P[( X = xi ) ∩( Y = y j) ]
5
Variabilele aleatoare X şi Y se numesc independente dacă evenimentele ( ) şi ( ),

X = xi Y = yj
sunt independente. În acest caz:
i = 1, …, n; j = 1, …, m
.
P ( X = xi ) ; ( Y = yj )  = P ( X = xi ) ∩( Y = yj )  = pij = pi ⋅ qj
3.1.2 Variabile aleatoare continue. Fie Y variabila aleatoare , unde x ∈[a,b], iar f(x) este
 x 
X : 
 f ( x) 
probabilitatea de apariţie a lui x. Funcţia f(x) se numeşte densitatea de probabilitate a variabilei aleatoare
X.
Proprietăţile densităţii de probabilitate:
1) ;
f ( x) ≥ 0
2) .
b
∫ f ( x)dx = 1
a
Funcţia de repartiţie a unei variabile aleatoare:

Prezentarea unei variabile aleatoare prin funcţia de probabilitate f(xi) sau prin densitatea de
probabilitate prezintă aspecte diferite. Considerăm evenimentul (X < x), x∈ R.
Se numeşte funcţie de repartiţie a variabilei aleatoare X, funcţia F:R→R dată de Fx=P(X<x).
Variabila aleatoare X este discretă (continuă), după cum funcţia de repartiţie F(x) este o funcţie discretă
(continuă).
Concepte generale in testarea ipotezelor statistice
Procesul de luare a deciziilor presupune analiza, judecarea si interpretarea evidenţelor oferite de datele pe
care le avem la dispoziţie. Managerii trebuie să fie pregătiţi să ia decizii privind acţiunile viitoare pe baza
informaţiilor disponibile. Astfel, ei emit ipoteze pe care le pot testa ştiinţific utilizând metodele si tehnicile
statistice. Testarea ipotezelor statistice reprezintă o altă modalitate, alături de estimaţia pe interval de
încredere, de a realiza inferenţă statistică. Scopul acestui tip de inferenţă statistică este să determinăm
dacă există suficiente dovezi statistice care să ne permită să concluzionăm că o afirmaţie (sau o ipoteză)
dspre un parametru este adevărată.
Exemplu. Sute de produse noi sunt lansate în fiecare an. Dintr-o varietate de motive, multe dintre
acestea nu reuşesc să cucerească piaţa. De aceea, produsele care ajung in stagiul final de lansare pe piaţă
sunt evaluate de specialiştii în marketing, care doresc să facă predicţii asupra succesului (cu alte cuvinte,
cât de bine se vor vinde). Evident, informaţii complete şi sigure nu se pot obţine şi atunci specialiştii vor
6
dori să tragă concluzii valide, pe baza datelor disponibile din cercetări parţiale. Să presupunem că un lanţ
de magazine doreşte să vândă un nou produs lansat pe piaţă şi speră să aibă succes. După o analiză
financiară, specialiştii determină că, dacă mai mult de 10% din potenţialii cumpărători vor cumpăra
produsul, lanţul de magazine va obţine profit. Un eşantion aleator de clienţi potenţiali este selectat şi
persoanele sunt întrebate dacă ar cumpăra produsul. Procedeul de eşantionare şi de culegere a datelor este
cunoscut din capitolele precedente, iar parametrul reprezintă proporţia clienţilor care ar cumpăra produsul.
Testarea ipotezei statistice se referă, atunci, la a determina dacă proporţia cumpărătorilor este mai mare de
10%. În urma prelevării unui eşantion dintr-o populaţie statistica, prin prelucrarea datelor provenite din
sondaj se obţine un estimator al parametrului urmărit în populaţia de origine. Se pune atunci problema în
ce măsură parametrul estimat pe baza rezultatelor sondajului asigură „credibilitatea” aprecierilor făcute
asupra întregii colectivităţi. Estimatorul este, aşadar, o „presupunere” asupra parametrului, deci o ipoteză
statistică. Nu este nevoie să testăm ipoteze statistice atunci când ştim totul despre un fenomen, ci doar
când există incertitudine.
Ipoteza statistică este ipoteza care se face cu privire la parametrul unei repartiţii sau la legea de
repartiţie pe care o urmează anumite variabile aleatoare. O ipoeză statistică nu este neapărat adevărată.
Ea poate fi corectă sau greşită. În statistică, ipotezele apar întotdeauna în perechi: ipoteza nulă si ipoteza
alternativă. Ipoteza statistică ce urmează a fi testată se numeşte ipoteză nulă şi este notată, uzual, H0. Ea
constă întotdeauna în admiterea caracterului întâmplător al deosebirilor, adică în presupunerea că nu există
deosebiri esenţiale. Respingerea ipotezei nule care este testată implică acceptarea unei alte ipoteze.
Această altă ipoteză este numită ipoteză alternativă, notată H1. Cele două ipoteze reprezintă teorii,
mutual exclusive si exhaustive, asupra valorii parametrului populaţiei sau legii de repartiţie. Spunem că
ele sunt mutual exclusive deoarece este imposibil ca ambele ipoteze să fie adevărate. Spunem că ele sunt
exhaustive deoarece acoperă toate posibilităţile, adică ori ipoteza nulă, ori ipoteza alternativă trebuie să
fie adevărată. Procedeul de verificare a unei ipoteze statistice se numeşte test sau criteriu de
semnificaţie. O secvenţă generală de paşi se aplică la toate situaţiile de testare a ipotezelor statistice.
Există patru componente principale ale unui test privind o ipoteză:
• ipoteza nulă;
• ipoteza alternativă;
• testul statistic;
• regiunea critică (de respingere).
Ipotezele se vor schimba, tehnicile statistice aplicate se vor schimba, dar procesul rămâne acelaşi,
parcurgându-se următorii paşi:
1) Se identifică ipoteza statistică specială despre parametrul populaţiei sau legea de
repartiţie (H0). Ipoteza statistică – numită şi ipoteză nulă – specifică întotdeauna o singură valoare a
parametrului populaţiei şi reprezintă status-quo-ul, ceea ce este acceptat până se dovedeşte a fi fals.
2) Întotdeauna, ipoteza nulă este însoţită de ipoteza alternativă (de cercetat), H1, ce reprezintă o
teorie care contrazice ipoteza nulă. Ea va fi acceptată doar când există suficiente dovezi, evidenţe,
pentru a se stabili că este adevărată.
Ipoteza alternativă este cea mai importantă, deoarece este ipoteza care ne răspunde la întrebare.
Ipoteza alternativă poate căpăta trei forme, care răspund la trei tipuri de întrebări referitoare la parametrul
studiat: dacă parametrul este diferit (mai mare sau mai mic) decât valoarea specificată în ipoteza nulă;
dacă parametrul este mai mare decât valoarea specificată în ipoteza nulă; dacă parametrul este mai mic
decât valoarea specificată în ipoteza nulă.
3) Se calculează indicatorii statistici în eşantion, utilizaţi pentru a accepta sau a respinge ipoteza
nulă şi se determină testul statistic ce va fi utilizat drept criteriu de acceptare sau de respingere a ipotezei
nule. Pentru cele mai multe testări statistice ale ipotezelor, testul statistic este derivat din estimatorul
7
punctual al parametrului ce va fi testat. Spre exemplu, deoarece media eşantionului este un estimator
punctual al mediei din colectivitatea generală, ea va fi utilizată în testarea ipotezelor privind parametrul
media colectivităţii generale.
4) Se stabileşte regiunea critică, Rc. Regiunea critică reprezintă valorile numerice ale testului
statistic pentru care ipoteza nulă va fi respinsă. Regiunea critică este astfel aleasă încât probabilitatea ca ea
să conţină testul statistic, când ipoteza nulă este adevărată, să fie α, cu α mic (α = 0.01 etc). Verificarea
ipotezei nule se face pe baza unui eşantion de volum n, extras din populaţia X, care este o variabilă
aleatoare. Dacă punctul definit de vectorul de sondaj x1, x2, ..., xn cade în regiunea critică Rc, ipoteza H0 se
respinge, iar dacă punctul cade în afara regiunii critice Rc, ipoteza H0 se acceptă. Regiunea critică este
delimitată de valoarea critică, C – punctul de tăietură în stabilirea acesteia. În baza legii numerelor mari,
numai într-un număr foarte mic de cazuri punctul rezultat din sondaj va cădea în Rc, majoritatea vor cădea
în afara regiunii critice. Nu este însă exclus ca punctul din sondaj să cadă în regiunea critică, cu toate că
ipoteza nulă despre parametrul populaţiei este adevarată. Cu alte cuvinte, atunci când respingem ipoteza
nulă, trebuie să ne gândim de două ori, deoarece există două posibilităţi: ea este falsă într-adevăr şi ea este
totuşi adevărată, deşi pe baza datelor din sondaj o respingem. La fel şi pentru situaţia în care acceptăm
ipoteza nulă H0. Când ipoteza nulă nu poate fi respinsă (nu există suficiente dovezi pentru a fi respinsă),
sunt două posibilităţi: ipoteza nulă este adevărată si ipoteza nulă este totuşi falsă, greşită, deşi nu am
respins-o. De aceea, este mai corect să spunem că, pe baza datelor din eşantionul studiat,nu putem
respinge ipoteza nulă, decât să spunem că ipoteza nulă este adevărată.Eroarea pe care o facem eliminând
o ipoteză nulă, deşi este adevărată, se numeşte eroare de genul întâi. Probabilitatea comiterii unei astfel
de erori reprezintă riscul de genul întâi (α) şi se numeşte nivel sau prag de semnificaţie. Nivelul de
încredere al unui test statistic este (1 – α), iar în expresie procentuală, (1 – α)100 reprezintă probabilitatea
de garantare a rezultatelor. Eroarea pe care o facem acceptând o ipoteză nulă, deşi este falsă, se numeşte
eroare de genul al doilea, iar probabilitatea (riscul) comiterii unei astfel de erori se notează cu β. Puterea
testului statistic este (1 – β).
Tabelul 6.1. ilustrează legătura dintre decizia pe care o luăm referitor la ipoteza nulă şi adevărul sau
falsitatea acestei ipoteze.
Tabelul 6.1. Erorile în testarea ipotezelor statistice
Ipoteza adevărată
Decizia de acceptare
H0 H1
Decizie corectă Eroare de gen II
H0
(probabilitate 1 – α) (risc β)
Eroare de gen I Decizie corectă
H1
(risc α) (probabilitate 1 –β)
Cu cât probabilităţile comiterii erorilor de genul întâi şi de genul al doilea sunt mai mici, cu atât
testul este mai bun. Acest lucru se poate realiza prin mărirea volumului eşantionului, n. Nivelurile
riscurilor se stabilesc în funcţie de considerente economice şi de natura testului. Am văzut că:
α = P (respingere H0| H0 este corectă) = P (eroare de gen I);
β = P (acceptare H0| H0 este falsă) = P (eroare de gen II).
Alegerea nivelului (pragului) de semnificaţie depinde şi de costurile asociate cu producerea
unei erori de genul I.
Exemplu
8
Pragul de semnificaţie ales de o firmă ce fabrică îngheţată, interesată în reutatea medie a cutiilor
de îngheţată, va putea fi diferit de pragul de semnificaţie ales de o companie farmaceutică, interesată de
cantitatea medie a unui ingredient activ dintr-un tip de medicament. Evident, costul în prima situaţie
prezentată este mult mai mic, comparativ cu costul asociat în cazul producerii unei erori de genul I pentru
compania farmaceutică: o cantitate prea mică de ingredient activ poate face medicamentul ineficient; o
cantitate prea mare de ingredient activ poate cauza efecte secundare, dăunătoare sau poate avea, chiar,
efecte letale. Similar, există costuri asociate cu producerea unei erori de genul al II-lea. Între eroarea de
genul I şi eroarea de genul al II-lea există o legatură, o condiţionare. O modalitate de a vizualiza această
legătură este să presupunem că există doar două distribuţii care ne interesează. O distribuţie corespunde
ipotezei nule H0, iar cealaltă corespunde ipotezei alternative H1. În acest caz, presupunem că şi ipoteza
nulă şi cea alternativă sunt ipoteze simple. Într-o manieră uşor de înţeles, considerăm că ipoteza nulă este
de forma H0: μ = μ0, iar ipoteza alternativă este de forma H1: μ = μ1 (figura 6.1.):
Figura 6.1. Legătura dintre probabilităţile α şi 
Pe grafic se observă că cele două distribuţii se suprapun şi, din procesul de testare a ipotezei nule, pot
rezulta două tipuri de erori.
Eroarea de genul I apare atunci când respingem ipoteza nulă H0, în situaţia în care, de fapt,
aceasta este adevărată. Adică, deşi distribuţia lui este cea corespunzătoare ipotezei H0, respingem H0,
x
deoarece media de sondaj este mai mare decât valoarea critică, C, şi se situează în regiunea critică.
Probabilitatea comiterii unei astfel de erori (α) este aria de sub curba de distribuţie H0, care se situează la
dreapta valorii critice C. Deseori, când lucrăm cu soft-ware specializat, întâlnim „valoarea-p” („p-value”).
Aceasta reprezintă nivelul observat de semnificaţie, adică cel mai mic nivel la care H0 poate fi respinsă
pentru un set de valori date.
Eroarea de genul al doilea apare atunci când nu respingem (adică acceptăm) H0, deşi H1 în loc de
H0 este corectă. În acest caz, deşi distribuţia lui este cea corespunzătoare ipotezei H1, acceptăm H0
x
deoarece media de sondaj este mai mică decât valoarea critică, C (nu se află în regiunea critică).
Probabilitatea comiterii unei astfel de erori (β) este aria de sub curba de distribuţie H1, care se situează la
stânga valorii critice, C. Dacă alegem un prag de semnificaţie, α, mai mic (adică reducem riscul comiterii
unei erori de genul întâi), va creşte β (riscul comiterii unei erori de genul al doilea). Cu toate acestea, prin
creşterea volumului n al eşantionului, este posibil să reducem riscul β, fără a creşte riscul α.
Cum , o dată cu creşterea volumului n al eşantionului, abaterile medii pătratice ale
sx
sx =
n
distribuţiilor pentru H0 şi H1 devin mai mici şi, evident, atât α, cât şi β descresc (figura 6.2.).
Figura 6.2.  şi β când volumul eşantionului n’>n
9
5) După ce am stabilit pragul de semnificaţie şi regiunea critică, trecem la pasul următor, în care
vom face principalele presupuneri despre populaţia sau populaţiile ce sunt eşantionate (normalitate
etc.).
6) Se calculează apoi testul statistic şi se determină valoarea sa numerică, pe baza datelor din
eşantion.
7) La ultimul pas, se desprind concluziile: ipoteza nulă este fie acceptată, fie respinsă, astfel: a)
dacă valoarea numerică a testului statistic cade în regiunea critică (Rc), respingem ipoteza nulă şi
concluzionăm că ipoteza alternativă este adevărată. Vom şti că această decizie este incorectă doar în 100 α
% din cazuri; b) dacă valoarea numerică a testului nu cade în regiunea critică (Rc), se acceptă ipoteza
nulă H0.
Ipoteza alternativă poate avea, aşa cum am arătat, una din trei forme (pe care le vom
exemplifica pentru testarea egalitaţii parametrului „media colectivităţii generale”, μ cu valoarea μ0):
i) să testăm dacă parametrul din colectivitatea generală (media μ) este egal cu o anumită valoare
(inclusiv zero, μ0), cu alternativa media diferită de valoarea μ0. Atunci:
,
H 0 : µ = µ 0 H1 : µ ≠ µ0 ( µ < µ 0 sauµ > µ 0 )
şi acest test este un test bilateral;
ii) să testăm poteza nulă μ = μ0, cu alternativa media μ este mai mare decât μ0,
H0: μ = μ0, H1: μ > μ0,
care este un test unilateral dreapta;
iii) să testăm ipoteza nulă μ = μ0, cu alternativa media μ este mai mică decât μ0,
H0: μ = μ0, H1: μ < μ0,
care este un test unilateral stânga. Regiunea critică pentru testul bilateral diferă de cea pentru testul
unilateral. Când încercăm să detectăm o diferenţă faţă de ipoteza nulă, în ambele direcţii, trebuie să
stabilim o regiune critică Rc în ambele cozi ale distribuţiei de eşantionare pentru testul statistic. Când
efectuăm un test unilateral, vom stabili o regiune critică într-o singură parte a distribuţiei de eşantionare,
astfel (figura 6.3.):
µ µ µ
a) b) c)
Figura 6.3.Regiunea critică:
a) test bilateral; b) test unilateral dreapta; c) test unilateral stânga.
Modelul de analiză dispersională unifactorială

În modelul de analiză dispesională unifactorială se testează ipoteza nulă: mediile din populaţii sunt
egale , cu ipoteza alternativă: cel puţin două medii din populaţie nu sunt egale
H 0 : µ y1 = µ y 2 = ... = µ yr
H1 : µ yi ≠ µ yj (i ≠ j )
10
xoyyr1 a)medii
xx2 2 ……
de…….
grupă;
xr xr b) mediile de grupă inegale
Figura 7.1.
y2
y1
Se testează, cu alte cuvinte, dacă diferenţele dintre mediile de grupă din eşantion sunt prea mari pentru a fi
atribuite doar întâmplării. Dacă rezultatul testului indică faptul că mediile sunt semnificativ diferite, se
concluzionează că factorul X are un impact asupra variabilei Y. Testul statistic este dezvoltat în
concordanţă cu următorul raţionament. Dacă ipoteza nulă este adevărată, mediile celor r populaţii ar trebui
să fie, toate, egale. Ne aşteptăm atunci ca mediile celor r eşantioane să fie aproximativ egale. Dacă ipoteza
alternativă este adevărată există diferenţe mari între unele medii ale eşantioanelor. Setul de date pentru
analiza dispersională unifactorială constă în valorile variabilei Y pentru cele r grupe independente.
Volumele grupelor pot fi diferite (tabelul 7.1.):
n1 ≠ n2 ≠ ... ≠ nr
Tabelul 7.1. Sistematizarea datelor pentru ANOVA
Grupe după factorul cauză
Gr. 1 Gr. 2 ..... Gr. r
y11 y21 ..... y11
y12 y22 ..... y11
y1n1 y2n2 ..... yrnr

Media y1 y2 ..... yr
y12 y12 ..... y12
Vol. grupă
Presupunerile sub care se aplică testul F în analiza dispersională unifactorială oferă un cadru
solid pentru interfaţa statistică pe baza datelor observate, anume: cele r grupe din eşantion sunt extrase
aleator şi independent din cele r grupe ale colectivităţii generale; fiecare grupă din colectivitatea generală
are o distribuţie normală, iar abaterile medii pătratice sunt egale .
σ 1 = σ 2 = ... = σ r
Testul statistic F pentru analiza dispersională unifactorială este raportul indicatorilor de
variabilitate pentru cele două surse de variaţie: variabilitatea dintre grupe împărţită la variabilitatea din
interiorul grupelor. El poate fi interpretat ca măsurând de câte ori este mai mare variabilitatea mediilor de
grupă, comparativ cu ce ne-am aşteptat dacă ele erau doar aleator diferite. Pentru testarea ipotezei nule,
vom estima mediile de grupă şi media totală din colectivitatea generală pe baza datelor din eşantion.
, , .
ni ni r
i = 1, r r r
∑ yij ∑ ∑ yij ∑yn i i
n = ∑ ni
j =1 i =1 j =1 i =1
yi = yi = = i =1
ni n n
11
Varianţa dintre grupe, dată de influenţa factorului cauzal, numită şi varianţa factorială, este
suma pătratelor abaterilor mediilor de grupă de la media generală:
.
r
S1 = ∑ ( yi − y ) 2 ni
i =1
Din relaţie rezultă că, dacă , . Varianţa din interiorul grupelor, numită şi
y1 = y2 = ... = yr = y S1 = 0
varianţa reziduală, este suma pătratelor abaterilor valorilor individuale de la mediile de grupă:
.
r ni
S 2 = ∑∑ ( yij − yi )2
i =1 j =1
Împrăştierea totală a valorilor individuale fată de media generală este dată de varianţa totală:
y
.
r ni
S = ∑ ∑ ( yij − y)2
i =1 j =1
Raţionamentul analizei dispersionale se bazează pe partiţionarea sumei pătratelor abaterilor:
∑ ∑( ) ∑( ) ( )
r ni 2 r 2 r ni 2
yij − y = yi − y ni + ∑ ∑ y ij − y ⇒ S = S1 +S2
i =1 j =1 i =1 i =1 j =1
Pentru a face comparabile aceste măsuri ale variabilităţii, le vom raporta pe fiecare la gradele de
libertate, transformând astfel suma de pătrate în media pătratelor abaterilor. Pentru varianţa factorială ,
S1
numărul gradelor de libertate este şi acest lucru înseamnă că măsurăm variabilitatea a r medii, dar se
r −1
pierde un grad de libertate, deoarece media totală a fost estimată. Pentru varianţa reziduală (din interiorul
grupelor ) , numărul gradelor de libertate este ; acest lucru înseamnă că măsurăm variabilitatea
S2 n−r
tuturor celor n valori, dar pierdem r grade de libertate, deoarece au fost estimate mediile celor r grupe.
Obţinem astfel dispersia factorială corectă:
∑( y − y)
r 2
i ni
S
s = 1 =
2
1
i =1
r −1 r −1
şi dispersia corectată reziduală:
12
∑∑ ( y )
r ni 2
ij − yi
S2 i =1 j =1
s22 = =
n−r n− r
Statistica F pentru analiza dispersională unifactorială are forma:
= variabilitatea dintre grupevariabilitatea din interiorul grupelor ,
s12
F=
s22
cu gradele de libertate ( ) la numărător şi ( ) la numitor. Testul statistic F se realizează

r −1 n−r
comparând valoarea calculată a statisticii F cu valoarea critică (tabelată) pentru ( ) şi ( )
Fα r −1 n−r
grade de libertate şi probabilitatea aleasă de grantare a rezultatelor. Rezultatul este

100(1 − α)%
semnificativ dacă: , deoarece acest lucru indică diferenţele mai mari între mediile
F > Fα ,( r −1),( n −r )
grupelor decât cele datorate întâmplării. Regiunea critică este dată deci de valorile lui F pentru care
. Astfel spus, dacă valoarea F este mai mică decât maloarea critică , atunci se pot
F > Fα ,( r −1),( n −r ) Fα
face următoarele afirmaţii echivalente: − acceptăm ipoteza nulă ; − nu acceptăm ipoteza alternativă ;
H0 H1
− mediile grupelor nu sunt semnificativ diferite una faţă de alta; − diferenţele observate între mediile
grupelor pot fi datorate doar întâmplării;  rezultatul nu este semnificativ statistic. Dacă valoarea F este mai
mare decât valoarea critică , atunci: − accentuăm ipoteza alternativă ; − respingem ipoteza nulă ;
Fα H1 H0
− mediile grupelor sunt semnificativ diferite una faţă de alta; − diferenţele observate între mediile grupelor
nu sunt datorate doar întâmplării; − rezultatul este semnificativ statistic.
Modelul unifactorial de regresie. Regresia liniară

Definiţie, specificare, identificare
Deseori, apare necesitatea de a explica şi controla, pe cât posibil, fenomenele şi procesele din
economie, care pot reflecta situaţii mai mult sau mai puţin favorabile. De aceea, se elaborează o serie de
instrumente eficiente cu ajutorul cărora să explicăm situaţiile existente şi să eliminăm (sau eventual să
diminuăm) efectele nedorite ce pot apărea într-un anumit context economic. În acest fel, se pot verifica
13
ipotezele teoriei economice, se poate renunţa la unele care nu s-au dovedit viabile sau se pot elabora altele
noi, contribuind astfel la îmbigăţirea sistemului informaţional privind un anumit fenomen sau proces
economic. Modelul devine, astfel, o verigă intermediară între teorie şi practică, o oglindă sintetică,
simplificată a realităţii economice, ale cărei componente principale sunt exprimate sintetic printr-un set de
variabile, precum şi prin relaţiile, intercondiţionările dintre aceste variabile. Modelul poate fi constituit
dintr-una sau mai multe ecuaţii care exprimă dependenţa variabilelor complexe de un ansamblu de factori
principali şi secundari, sistematici şi aleatori, care acţionează în acelaşi sens sau în sensuri diferite, sistem
care exprimă într-o formă matematică, abstractă, problema căreia îi trebuie găsită rezolvarea. Pentru
rezolvarea acestui sistem sunt enunţate o serie de ipoteze raţionale, în concordanţă cu teoria economică,
iar soluţiile trebuie obţinute în condiţii de verosimilitate maximă, pe baza unui eşantion de date privind
evoluţia variabilelor factoriale şi a variabilelor rezultative. În plus, modelele econometrice pot servi la
analiza şi a altor aspecte ale realităţii economice, precum: identificarea şi măsurarea efectului întârziat al
unor factori economico-sociali, previzionarea evoluţiei unor fenomene, sintetizate printr-un set de
variabile, oscilaţiile sistematice, sezoniere sau ciclice ce pot însoţi evoluţia acestora, simularea şi prognoza
proceselor economico-sociale, identificarea şi măsurarea acţiunii unor variabile dihotomice, alternative
sau binare.
Legăturile care există între două variabile statistice pot fi studiate folosind două tehnici: regresia şi
corelaţia. Corelaţia va arăta cât de puternică este legătura, dependenţa dintre variabile, în timp ce
regresia va ajuta în explicarea şi previzionarea unui factor pe baza valorii altuia (altora), ceea ce, evident,
va reduce incertitudinea privitoare la fenomene importante, dar aleatoare. În sens statistic, termenul
regresie îi aparţine statisticianului englez F. Galton (1822-1911). Există trei scopuri principale, atunci
când analiză, legăturile dintre variabile statistice: • să descriem şi să înţelegem relaţiile de dependenţă;
• să previzionăm o nouă valoare a variabilei efect; • să ajustăm şi să controlăm variabila efect,
prin intervenţia asupra variabilei cauză. Un studiu econometric începe cu o serie de presupuneri teoretice
despre anumite aspecte ale economiei.
Definim modelul unifactorial de regresie printr-o relaţie matematică construită pe baza teoriei
economice, care presupune că fenomenul economic Y (fenomenul efect) este rezultatul acţiunii a două
categorii de factori:
⇒ prima, constituită dintr-un singur factor principal, esenţial, determinant – X,
⇒ a doua – formată din toţi ceilalţi factori – consideraţi neesenţiali, cu acţiune întâmplătoare
(specificaţi prin variabila reziduală „ε”) sau constantă, invariabilă, asupra lui Y (şi deci nu au sens a fi
specificaţi în model).
Specificarea modelului unifactorial constă în precizarea variabilei endogene Y şi a celei exogene
X, pe baza teoriei economice; ca orice ipoteză teoretică, ea poate fi adevărată sau falsă.
y = f (x) + ε
Identificarea modelului constă în alegerea unei funţii (sau a unui grup de funcţii) matematice, cu
ajutorul căreia se urmăreşte descrierea valorilor variabilei endogene, doar în funcţie de variaţia variabilei
exogene X. Identificarea modelului se poate face prin:  procedeul grafic; • procedeul conversării ariilor;
• procedeul calculelor algebrice.
Una dintre funcţiile matematice utilizate cel mai des o constituie funcţia liniară. Relaţia dintre
variabila efect (Y) şi variabila cauză (X) studiată de regresia simplă liniară într-o populaţie statistică
generală poate fi descrisă prin modelul probabilistic liniar: , în care:
yi = α + β xi + ε i
14
⇒ reprezintă valorile numerice ale variabilelor cauză (X) şi efect (Y), înregistrate la
( xi , yi )
nivelul unităţii statistice „i”; ⇒ reprezintă parametrii ecuaţiei de regresie (în literatura de
α, β
specialitate se mai notează şi ); α reprezintă punctul de intersecţie al dreptei de regresie cu axa
β0 β1
Oy; β reprezintă panta dreptei, se mai numeşte şi „coeficient de regresie” şi arată cu câte unităţi de
măsură se modifică Y dacă X se modifică cu o unitate de măsură;
⇒ εi reprezintă componenta reziduală (eroare aleatoare) pentru unitatea statistică „i”.
1Figura
1α
0,5
βy 8.1.2Modelul liniar
3 unifactorial
4 x
3
După cum observăm, modelul probabilistic conţine: a) componenta deterministică, adică partea din
valoarea lui , care poate fi determinată cunoscând valoarea ; b) componenta reziduală
yi xi (α + β xi = y$i )
este partea din valoarea lui , care nu poate fi determinată cunoscând valoarea individuală .
yi xi (ε i )
Atunci: = componenta predictuală (deterministică) + eroarea aleatoare sau . Dacă datele
yi yi = $
y i + εi
disponibile provin dintr-un eşantion (aşa cum se întâmplă în cele mai multe aczuri), avem la dispoziţie n
perechi de observaţii , iar modelul de regresie liniară în eşantion este:
( x1 , y1 ), ( x2 , y2 ),..., ( xn , yn )
cu componenta predictibilă: , unde a şi b sunt estimatorii punctului de
yi = a + bxi + ei $
y i = a + bxi
15
intersecţie (α ) şi ai pantei liniei de regresie (β ), obţinuţi pe eşantion, iar , estimatorul componentei

ei
reziduale, .
εi
Ipotezele modelului de regresie liniară. Pentru a obţine proprietăţile dorite ale estimatorilor regresiei, se
fac, de obicei, şase presupuneri (ipoteze) standard pentru modelul din populaţia generală. Ipotezele ce
trebuie verificate sunt formulate astfel:
1. Formula funcţională: ,
2. Media zero a erorilor:
yi = α + β xi + ε i i = 1, n
3. Homoscedasticitatea:
4. Non-autocorelarea erorilor:
5. Necorelarea între regresor şi erori:
6. Normalitatea erorilor. E (ε i ) = 0∀i
constantă
Var (ε i ) = σ 2 ∀i
Cov(ε i , ε j ) = 0∀i ≠ j
i şi j
Cov( xi , ε j ) = 0∀
ε j : N (0, σ 2 )
1. Forma funcţională
Ipoteza de liniaritate nu este atât de restrictivă pe cât pare. Aceasta se referă la felul în care
parametrii intră în ecuaţie, nu neapărat la relaţia dintre variabilele X şi Y. În exemplele prezentate în
continuare s-a procedat la transformarea unor variabile în vederea liniarizării modelelor.
a.
y = a + bx
b.
y = a + bz, z = e x
c.
y = a + br, r = 1 x
d.
y = a + bq, q = ln( x)
16
aaX
Ya+b
a
++Figura
b
bb 8.2. Modele ce pot fi liniarizate
ln(x)
(ex1x
x
)
În exemplele anterioare, doar variabila X a fost transformată. Acelaşi lucru se poate întâmpla şi cu
variabila Y, aşa cum este cazul modelului: , forma generală a acestuia
y = Ax β ⇒ ln( y) = α + β ln( x)
fiind:
f ( yi ) = α + β g ( xi ) + ε i
Există însă şi modele ce nu pot fi liniarizat, cum este cel de forma: .
1
y =α +
β+x
Ipoteza de liniaritate a modelului include şi aditivitatea erorilor. Modelul trebuie să fie de forma:
, fie în variabilele iniţiale, fie după ce au fost făcute transformările potrivite. De
y =α + β x+ε
exemplu, modelul se transformă prin logaritmare în modelul liniar:
y = Ax β eε
. Însă modelul nu mai poate fi transformat în model liniar.
ln( y ) = ln( A) + β ln( x) + ε y = Ax β + ε
Dacă ipoteza de liniaritate este verificată, variabila dependentă observată este suma a două
elemente:
− componenta predictibilă:
α +βx
 o componentă aleatoare: ε.
2. Media erorilor este zero: , este naturală atâta timp cât ε este văzută ca suma
µ (ε i ) = 0∀i
efectelor individuale, cu semne diferite. Această presupunere indică faptul că media valorilor Y este
17
condiţionat de ionat de X, , adică nu există variabile omise asiciate cu regresia

µ ( Y X = X i ) = α + β Xi
în populaţie (vezi figura 8.3.):
Figura 8.3. Distribuţia de probabilitate pentru εi
3. Ipoteza de homoscedasticitate: constantă

Var (ε i ) = σ 2
∀i
Variabilele aleatoare au dispersia constantă, , adică dispersia reziduurilor în populaţie este

εi σ ε2
constantă pentru toate valorile Xi (figurile 8.3. şi 8.4.)
xoy a) b)
Figura 8.4. Dispersia reziduurilor:a) constantă; b) variabilă;
4. Non-autocorelarea erorilor:
E (ε iε j ) = 0∀i ≠ j
Această ipoteză nu implică faptul că şi sunt necorelate, ci faptul că deviaţiile observaţiilor
yi yj
de la valorile de aşteptare sunt necorelate.
De asemenea, este convenabil a considera că erorile sunt independente şi normal distribuite cu
medie zero şi variaţie constantă pentru obţinerea de rezultate statistice exacte.
5. Variabila aleatoare εi este normal distribuită (figura 8.3.)
6. Necorelarea între regresor şi erori: i şi j

Cov ( xi , ε j ) = 0∀
Chiar dacă sunt numere fixate (de exemplu: de cercetător) sau sunt variabile aleatoare, ele sunt
xi
statistic independente de variabila aleatoare ;
εi
Ipotezele modelului de regresie liniară vor fi analizate mai detaliat în capitolul 6.
18
8.1.3. Estimarea parametrilor modelului de regresie
Regresia simplă liniară

Modelul de regresie liniară în eşantion este:
yi = a + bxi + ei
cu componenta predictibilă:
$
y i = a + bx i
unde a şi b sunt coeficienţii funcţiei de regresie, iar , valoarea reziduală (pentru unitatea i) în eşantion:
ei
ei = yi − ( a + bxi )
nu este altceva decât o măsură a distanţei de la un punct ( ) la linia de regresie (figura 8.6.):
xi , yi
Figura 8.6. Abaterea ei de la linia de regresie
Procedeul de determinare a liniei de regresie în eşantion urmăreşte să găsească valorile lui a şi b,

astfel încât valorile estimate ale variabilei dependente ( ) să fie cât mai aproape posibil de valorile
$
y
observate (y) (dreapta să treacă cât mai aproape de toate punctele observate). Un criteriu pentru
determinarea valorilor a şi b este metoda minimizării sumei pătratelor deviaţiilor (abaterilor sau
reziduurilor) ei. Cu cât este mai mică valoarea , cu atât este mai aproape de valoarea . Metoda,
ei µy yi
i
cunoscută ca metoda celor mai mici pătrate, înseamnă minimizarea relaţiei:
S ( a, b) = min ∑ ei2 = min ∑ ( yi − a − bxi )

2
i i
Condiţiile de ordin 1 de minimizare a funcţiei sunt:
 ∂S
 ∂a = 0 ∑ 2 ( yi − a − b ⋅ x i ) ( −1) = 0 ∑ yi − na − b ∑ x i = 0
 ⇒ ⇒
 ∂S = 0 ∑ 2 ( yi − a − b ⋅ x i ) ( − x i ) = 0 ∑ xi yi − a ∑ x i − b ∑ x i = 0
2
 ∂b
obţinându-se sistemul de ecuaţii normale:
 n n


na + b ∑
i =1
xi = ∑
i =1
yi
 n n n
a x + b x 2 = x y
 ∑
i =1
i ∑i =1
i ∑
i =1
i i
19
Rezolvarea sistemului poate fi realizată folosind metoda determinanţilor, după cum urmează:
; , unde:
∆a ∆b
a= b=
∆ ∆
∆a =
∑y ∑x i i
∑x y ∑x i i i
2
∆b =
n ∑y i
∑x i ∑x y i i
∆=
n ∑x i
∑ xi ∑x i
2
 ∆a ∑ yi ⋅ ∑ xi − ∑ xi ⋅ ∑ xi y i
2
a = =
∆ n∑ xi2 − ( ∑ xi )
2


b = ∆b = n ⋅ ∑ xi yi − ∑ xi ⋅ ∑ yi
 ∆ n∑ xi2 − ( ∑ xi )
2

Sau
 n
 n 
 ∑ yi − b  ∑ xi 
 i =1 
a = y − bx = i =1
 n

( )( )
n

 ∑ xi − x yi − y
 ∑i xi yi − nxy i =1
n s
b = = = xy2
∑
2 2
sx
( )
n
 xi2 − nx
 i ∑ i =1
xi − x

 n
■ Rămâne de verificat dacă este îndeplinită condiţia de ordin 2, adică soluţia găsită este un punct
de minim. Matricea derivatelor parţiale de ordin doi trebuie să fie pozitiv definită:
 ∂2 (S ) ∂ 2 (S )  
 ∂ 2 a2 2n 2∑ xi 
 2 ∂a∂ b   
= i
∂ 2 ( S )   2∑ xi
2
 ∂ (S ) 2∑ xi
 ∂b∂a  i 
∂ 2b 2 
i
20
2n > 0

4n x 2 − 4( x )2 = 4n ( x − x)2 > 0


∑i i ∑i i ∑i i
Deci matricea este pozitiv definită.

Coeficientul a (intercepţia) poate lua valori negative sau pozitive. Coeficientul b (panta liniei
drepte) numit şi coeficient de regresie are întotdeauna semnul indicatorului , numit şi covarianţa între
sxy
X şi Y. Aşadar, în cazul unei legături directe rezultă (figura 8.7.a), iar în cazul unei legături inverse,
b>0
(figura 8.7.b). dacă , acest lucru semnifică lipsa legăturii liniare între X la Y, iar linia de
b<0 b=0
regresie este paralelă cu axa absciselor (figura 8.7.c)
=a+bx
xoy=a+bxa) b) c)
b>0
b<0
b=0 Figura 8.7. Linii de regresie cu:
a) pantă pozitivă; b) pantă negativă; c) pantă egală cu zero
În urma determinării coeficienţilor a şi b ai ecuaţiei de regresie, se calculează valorile ajustate

date de . Vom obţine astfel:
$
y i = a + bxi
.
n n
∑ y = ∑ $y
i =1
i
i =1
i
Este de remarcat faptul că, dacă datele au fost sistematizate utilizând metoda grupării, iar valorile
şi se întâlnesc cu frecvenţele , atunci sistemul de ecuaţii normale, pentru determinarea
xi yi ni
coeficienţilor a şi b, devine:
;
 r r r
 a ∑ ni + b∑ xi ni = ∑ yi ni
 i =1 i =1 i =1
 r r r
a x n + b x2 n = x y n
 ∑i =1
i i ∑i =1
i i ∑i =1
i i i
În urma ajustării vom obţine:
21
.
r r
∑ y n = ∑ y$ n
i =1
i i
i =1
i i
În cazul în care datele au fost sistematizate într-un tabel cu dublă intrare, iar valorile şi se
xi yi
întâlnesc cu frecvenţele , sistemul devine:
nij
;
 r m r m
a ∑∑ nij + b∑ xi ni = ∑ y j n j
 i =1 j =1 i =1 j =1
 r r r m
a x n + b x2 n =
 ∑ ∑ ∑∑
i i. i i. xi yi nij
i =1 i =1 i =1 j =1
Determinarea coeficienţilor aşi b pe baza acestor sisteme de ecuaţii se adaptează corespunzător.

În urma ajustării vom obţine:
.
m m
∑ y j n j = ∑ $y j n j
j =1 j =1
Reamintim că, în cazul legăturii simple liniare, o măsură relativă a dependenţei dintre două
variabile o constituie coeficientul de corelaţie. Acest indicator al corelaţiei standardizează media
produselor abaterilor, semnul lui indicând direcţia legăturii, iar valoarea – intensitatea legăturii.
∑( x − x) ( y − y)
n
cov( x, y ) s i i
rxy = = xy = i =1
sx s y sx ⋅ sy  n 2
 n 2

(
 ∑ xi − x
 i =1
) (
  ∑ yi − y
  i =1
) 

sau, prin transformări elementare:
,
n n n
n∑ xi yi − ∑ xi ∑ yi
∆b
rxy = i =1 i =1 i =1
=
 n 2  n 2   n 2  n  
2
∆ ⋅ ∆∗
 n∑ xi −  ∑ xi    n∑ yi −  ∑ yi  
 i =1  i =1    i =1  i =1  
unde
2
 n n
∆ = n∑ y −  ∑ yi 
∗ 2
i
i =1  i =1 
22
Valoarea coeficientului de corelaţie ( sau simplu, r) este situată între -1 şi 1. O valoare 1 indică
rxy
o corelaţie liniară directă şi perfectă (funcţională), iar o valoare -1 indică o corelaţie liniară inversă
perfectă. O valoare zero arată (de obicei) lipsă legăturii între variabile. Totuşi, această interpretare trebuie
făcută cu precauţie, deoarece o legătură neliniară, valorile extreme sau aberante pot distorsiona
interpretarea coeficientului de corelaţie. Diagrama de împrăştiere ne va ajuta, în plus, la interpretarea lui r.
Aşadar, coeficientul de corelaţie, r, este un indicator ce caracterizează direcţia şi intensitatea
legăturii liniare. De altfel, se observă că , iar b, coeficientul de regresie (panta liniei drepte),
sx y
rxy =
sx s y
este . Aşadar .
sx y sx
b= r =b
s 2
x
sy
Coeficientul de corelaţie (r) are, deci, acelaşi semn cu coeficientul de regresie (b) şi anume
semnul dat de direcţia legăturii dintre variabile, deoarece şi sunt întotdeauna pozitive.
sx sy
MODELAREA ECONOMETRICĂ A SERIILOR CRONOLOGICE
Componentele unei serii cronologice. Ştim că dacă datele statistice sunt transversale (sau dinamice),
adică dacă variabila este măsurată în timp, în ordine secvenţială, atunci, în urma sistematizării, se obţine o
serie cronologică de tipul:
,
1 2 ... t ... n  t  t = 1, n
 =  
 y1 y2 ... yt ... yn  yt 
unde reprezintă unităţile de timp (perioade sau momente), iar yt reprezintă nivelurile variabilei
t = 1, n
studiate, Y. Aşadar, într-o serie cronologică, ordinea datelor oferă informaţii importante. O serie
cronologică poate fi formată din patru componente diferite şi anume: 1. Componenta de lungă durată –
trend (YT); 2. Componenta sezonieră (YS); 3. Componenta ciclică (YC); 4. Componenta reziduală (YR).
1. Tendinţa de lungă durată (numită şi trend, tendinţă seculară sau tendinţă pe termen lung) se
manifestă sub influenţa unor factori sistematici cu acţiune îndelungată şi conferă o formă aproximativ
netedă şi o direcţie aproximativ stabilă de evoluţie a fenomenului. Tendinţa de lungă durată se manifestă şi
se pune în evidenţă pe un număr mare de termeni, peste 10-15 termeni. Spre exemplu, populaţia României
(indicator de interes pentru multe din activităţile sectorului terţiar), a cunoscut următoarea evoluţie în
perioada 1980-2005 (număr mediu de locuitori la 1 iulie):
Figura 11.1. Populaţia României în perioada 1980-2005

Sursa: Anuarul Statistic al României, 2006
23
După cum se observă (figura 11.1), tendinţa de lungă durată nu trebuie întotdeauna să fie liniară. În acest
exemplu, numărul populaţiei a crescut până în 1990, după care se constată o tendinţă descrescătoare, în
perioada 1990-2005. Cu toate acestea, multe variabile social-economice de interes pot avea o tendinţă
liniară pe termen lung, crescătoare ori descrescătoare.
2. Componenta sezonieră are tot o influenţă sistematică, sub forma unor valuri (cicluri) repetitive,
care apar la perioade calendaristice scurte şi, prin definiţie, au o durată mai mică de un an de zile.
Termenul de „variaţii sezoniere” se poate referi, în mod tradiţional, la cele patru anotimpuri (sau
trimestre), ori la fluctuaţiile ce apar în timpul unei luni, unei zile sau chiar în cursul unei zile. Cererea de
produse turistice, producţia şi preţul de vânzare al unor produse agroalimentare, tarifele unor servicii etc.
Pot prezenta astfel de variaţii sezoniere. În general, industria turismului este afectată de sezonalitate. În
funcţie de momentul de re-ferinţă anchetele statistice pot oferi date şi informaţii privind fie trimestrele
calendaristice, fie trimestrele sezoniere. Anchetele bazate pe trimestre sezoniere oferă date decalate cu o
lună faţă de cele calendaristice (Sursa: CANSTAT, Statistical Bulletin, Bucharest, 2002, pg. 96).
Exemplu
Hotelul „CREASTA” dintr-o zonă montană, cu o capacitate de cazare existentă de 140 locuri a înregistrat,
în perioada 2003-2006, următorii indici trimestriali de utilizare netă a capacităţii în funcţiunee (%) (tabelul
11.1.):
Tabelul 11.1. Indici de utilizare netă a capacităţii în funcţiune (%)

Trimestrul
Anul
I II III IV
2003 30,0 21,2 62,8 44,2
2004 30,8 22,4 64,4 46,0
2005 32,2 22,8 66,2 48,0
2006 32,8 23,0 68,0 48,4
Din reprezentarea grafică (figura 11.2.) se observă cu uşurinţă că, în trimestrul III, indicii de utilizare netă
a capacităţii în funcţiune sunt mai ridicaţi decât în celelalte trimestre.
Figura 11.2. Indici de utilizare netă a capacităţii în

funcţiune la hotelul „CREASTA”, în perioada 2003-2006
3. Componenta ciclică are, de asemenea, o influenţă sistematică sub forma unor valuri, dar care
apar la un număr mai mare de ani (2-10 ani). Prin definiţie, ciclurile au o durată mai mare de un an de zile
şi sunt determinate de interacţiunea unor factori ce influenţează economia ori planul social (figura 11.3.).
Exemple de astfel de cicluri includ bine-cunoscutele cicluri de afaceri ce includ perioade de recesiune şi
expansiune, ciclurile pe termen lung privind cererea unor mărfuri, ciclurile în sectorul monetar şi
financiar. În practică, ciclurile apar rareori cu regularitate şi adesea se manifestă în combinaţie cu alte
componente. În industria turismului, întâlnim cicluri de viaţă ale destinaţiilor turistice (vezi Stănciulescu,
Gabriela – coord. – Lexicon de termeni turistici, Editura Oscar Print, Bucureşti, 2002).
Figura 11.3. Variaţie ciclică într-o serie cronologică
4. Componenta reziduală determină variaţii întâmplătoare, manifestate ca devieri neregulate într-

o serie cronologică şi care nu sunt cauzate de nicio altă componentă. Uneori această componentă poate
ascunde existenţa altora, mai predictibile, dar trebuie să subliniem că variaţiile aleatoare apar în aproape
toate seriile cronologice, ceea ce face necesară identificarea lor, în scopul efectuării – cu acurateţe – a
previzionărilor. Dacă examinăm figurile anterioare, vom observa astfel de variaţii reziduale şi, tocmai de
24
aceea, chiar dacă vom caracteriza precis şi exact celelalte componente, nu vom putea previziona la fel de
exact evoluţia viitoare a unei variabile.
Componentele unei serii cronologice pot fi prezentate, pe scurt, astfel (tabelul 11.2.):
Tabelul 11.2. Componentele unei serii cronologice

Componenta de Componenta Componenta Componenta
Denumire
lungă durată sezonieră ciclică reziduală
Tip Sistematică Sistematică Sistematică Nesistematică
Fluctuaţii regulate Fluctuaţii
Fluctuaţii reziduale
ce apar în aproximativ
Tendinţa de (întâmplătoare),
interiorul unei regulate ce apar la
Definiţie modificare pe care rămân după
perioade de 12 luni intervale de timp
termen lung evidenţa celorlalte
şi se repetă an de mari de 1 an de
componente
an zile
Evenimente
Schimbări în
Condiţii climatice, Interacţiunea unor neprevăzute
populaţie,
Factori de obiceiuri factori ce (greve, inundaţii,
tehnologie,
influenţa religioase, sociale influenţează războaie etc.) sau
educaţie, nivel de
etc. economia variaţii aleatoare
trai etc.
ale datelor
Un număr mare de Mai mică sau egală Durată scurtă şi
Durată De obicei 2-10 ani
termeni cu 12 luni care nu se repetă
Modelul general al unei serii cronologice poate fi exprimat ca un model aditiv, unde valoarea variabilei la
momentul (în perioada) t poate fi descrisă ca: , sau ca un model multiplicativ,
yt = yTt + ySt + yCt + yRt
dacă valoarea variabilei este descrisă ca: . Ambele modele sunt acceptabile. În
yt = yTt × ySt × yCt × yRt
general, modelul multiplicativ se utilizează atunci când fluctuaţiile (regulate şi neregulate) se amplifică ori
se diminuează faţă de tendinţa seculară, iar modelul aditiv se utilizează atunci când fluctuaţiile rămân
constante în amplitudine, faţă de trend.
11.1.1. Estimarea componentei trend
Dacă putem determina şi caracteriza componentele care există într-o serie cronologică, vom putea,
apoi, să efectuăm o previzionare validă a evoluţiei viitoare. Caracterizarea şi descrierea tendinţei de lungă
durată se poate face folosind metode statistice (simple) sau analitice. În alegerea uneia sau alteia dintre
metode un rol important îl joacă graficul statistic şi modul în care reuşim să descoperim existenţa şi forma
diferitelor componente din reprezentarea seriei cronologice. Metodele mecanice de descriere a trendului
unei serii cronologice cuprind: metoda modificării medii absolute, metoda indicelui mediu de modificare
şi metoda mediilor mobile. Metodele analitice presupun utilizarea unei funcţii analitice de tendinţă.
Tehnicile de netezire (sau ajustare) a seriei cronologice urmăresc, aşadar, eliminarea sau atenuarea
oscilaţiilor (fluctuaţiilor) sistematice şi nesistematice. Prezentăm, în continuare, modul de estimare a
tendinţei de lungă durată a unei serii cronologice prin metoda mediilor mobile. Metoda mediilor mobile
este utilizată cu deosebire atunci când seria cronologică prezintă fluctuaţii regulate (sezoniere sau ciclice),
pentru a netezi evoluţia fenomenului. Tendinţa pe termen lung se determină sub forma unor medii,
calculate din atâţia termeni (m), la câţi se manifestă o oscilaţie completă. Mediile se numesc mobile,
glisante, deoarece, în permanenţă, în calculul unei astfel de medii se lasă în afară primul termen al mediei
anterioare şi se introduce următorul termen. Astfel, dacă mediile mobile sunt calculate, spre exemplu, din
cinci termeni, fiecare valoare ajustată va cuprinde termenul din perioada respectivă, cei doi termeni
anteriori şi cei doi termeni următori.
25
, .
yt − 2 + yt −1 + yt + yt +1 + yt t = 3, n − 2
ytTMM = +2
5
În general, dacă mediile sunt calculate din m termeni (m, număr impar) se vor pierde, prin calculul
mediilor, (m – 1) termeni şi fiecare valoare ajustată va fi situată în dreptul unei valori înregistrate. Dacă,
însă, mediile mobile se calculează din m termeni (m număr par), atunci valorile medii se situează între
termenii reali şi vom centra nivelurile, astfel ajustate, prin calculul unor medii de medii (medii parţiale).
Spre exemplu, dacă o oscilaţie completă are loc la 6 termeni, atunci calculăm medii mobile centrate:
, .
yt −3 y t = 4, n − 3
+ yt − 2 + yt −1 + yt + yt +1 + yt + 2 + t +3
ytTMM = 2 2
6
În acest caz se vor pierde, prin calculul mediilor centrate, m termeni. Prin calculul mediilor mobile,
abaterile sezoniere se compensează.
Exemplu. Să considerăm seria cronologică privind sosirile trimestriale de turişti la hotelul „Creasta”
dintr-o zonă montană (tabelul 11.3.):
Tabelul 11.3. Sosiri trimestriale de turişti la hotelul „Creasta”

Trimestre
Anii
I II III IV
2003 940 650 1934 1360
2004 952 706 2072 1406
2005 992 734 2088 1478
2006 1026 740 2190 1492
Pentru calcularea tendinţei pe termen lung, folosind metoda mediilor mobile din 4 termeni (la câţi
se manifestă o oscilaţie completă), putem sistematiza datele astfel (tabelul 11.4.):
Tabelul 11.4. Calculul mediilor mobile
Anul Trimestrul Perioada(t) yt ytT(MM)
0 1 2 3 4
I 1 940 −
II 2 650 −
2003 1222
III 3 1934
IV 4 1360 1231
I 5 952 1255
II 6 706 1278
2004
III 7 2072 1289
IV 8 1406 1297
I 9 992 1303
II 10 734 1314
2005
III 11 2088 1327
IV 12 1478 1332
I 13 1026 1346
II 14 740 1360
2006
III 15 2190 −
IV 16 1492 −
26
Prima medie mobilă centrată este:

y1 y
+ y2 + y3 + y4 + 5
y3TMM = 2 2
4
persoane.
940 952
+ 650 + 1934 + 1360 +
y3TMM = 2 2 ≈ 1222
4
Cea de-a doua medie mobilă centrată este:
persoane. ş.a.m.d.
650 706
+ 1934 + 1360 + 952 +
y4TMM = 2 2 = 1231
4
Reprezentarea grafică în figura 8.4. ilustrează modul în care mediile mobile permit determinarea
tendinţei de lungă durată, prin eliminarea oscilaţiilor sezoniere. Să mai notăm că mediile mobile pot fi
calculate şi acolo unde nu există devieri periodice, în scopul de a înlătura variaţiile reziduale. Cu cât
mediile mobile se vor calcula, dintr-un număr mai mare de termeni, cu atât netezirea va fi mai accentuată;
pe de altă parte, calculul mediilor mobile dintr-un număr prea mic de termeni poate face ca variaţiile
reziduale să nu se elimine din valorile reale.
Figura 11.4. Determinarea tendinţei seculare folosind mediile mobile
11.1.2. Estimarea componentei sezoniere
Variaţiile sezoniere pot să apară în interiorul unui an sau chiar al unui interval mai scurt de timp, cum ar fi
luna, săptămâna sau ziua. Rezultă deci că, pentru studiul statistic al componentei sezoniere, este necesar să
avem la dispoziţie date sistematizate pe intervale de timp mai mici de un an de zile. Pentru a măsura
efectul sezonier, putem determina devieri sezoniere sau indici de sezonalitate. Devierile sezoniere
măsoară, în medie, abaterile fiecărui sezon de trend, iau valori pozitive şi negative, astfel încât suma
devierilor sezoniere, pentru toate sezoanele, este egală cu zero. Indicii de sezonalitate măsoară, în medie,
de câte ori se abate variabila, în fiecare sezon, de la trend, iau valori supraunitare sau subunitare, astfel
încât produsul lor este egal cu 1.
1. Determinarea devierilor sezoniere
Pentru determinarea devierilor sezoniere se parcurg următorii paşi: 1. Se înlătură din valorile
seriei cronologice (yt) componenta de trend (ytT) determinată prin metoda mediilor mobile sau printr-o
metodă analitică (vom considera o serie fără componenta ciclică, Ct). Atunci: .
yt − ytT = ytS + ytR
2. Pentru fiecare sezon în parte, calculăm media rezultatelor obţinute la pasul 1. În felul acesta
(prin calculul mediei) se înlătură cea mai mare parte din variaţiile reziduale (deşi foarte rar le putem
înlătura în întregime). Aceste medii, calculate pentru m sezoane, măsoară diferenţele faţă de linia de
tendinţă, date de componenta sezonieră.
27
3. Devierile sezoniere se vor calcula din valorile obţinute la pasul al doilea, ajustate astfel încât
suma lor să fie egală cu zero .
 m 
 ∑ ySk = 0 
 k =1 
Exemplu. După cum se ştie, industria turistică este subiectul unor serioase variaţii sezoniere. Folosind
datele din tabelul 11.3., vom urmări să determinăm devierile sezoniere ale variabilei, „sosiri de turişti”.
Pentru aceasta, vom înlătura mai întâi componenta de trend (col. 3 – col. 4, tabelul 8.4), iar rezultatele (
) le vom sistematiza în tabelul 11.5.
ytS + ytR
Tabelul 11.5. Determinarea devierilor sezoniere

Trimestrul
Anii Suma
I II III IV
0 1 2 3 4 5
2003 − − 712 129
2004 −303 −572 −
783 109 −
2005 −311 −580 761 746 −
2006 320 −620 − −
Media 311,3 590,7 752 128 −22
Deviere sezonieră 306 585 758 133 0
Pentru fiecare sezon vom determina media abaterilor:

 pentru trim. I: ; pentru trim. II: ;
−303 + ( −311) + ( −320) −572 + ( −580) + ( −620)
= −311,3 = −590, 7
3 3
 pentru trim. III: ; pentru trim. IV: .
712 + 783 + 761 129 + 109 + 146
= 752 = 128
3 3
Cum suma acestor medii ale abaterilor este diferită de zero
, vom ajusta mediile calculate cu valoarea ,
4 −22
∑y k =1
Sk = (−311,3) + (− 590, 7) + 752 + 128 = − 22
4
= −5,5
obţinând devieri sezoniere, astfel: persoane

yS1 = −311,3 − (−5,5) = −305,8 ≈ −306
persoane, persoane
yS 2 = −590, 7 − (− 5,5) = − 585, 2 ≈ − 585 yS 3 = 752 − ( −5, 5) = 757,5 ≈ 758
persoane
yS 4 = 128 − (− 5, 5) = 133, 5 ≈ 134
Devierile sezoniere în trimestrele I şi II sunt negative (niveluri sub trend), iar trimestrele III şi IV
sunt pozitive (vârfuri de activitate). Rezultatele ne arată că factorul sezonier deviază numărul sosirilor de
28
turişti în trimestrul I cu 306 persoane sub linia de trend, în trimestrul II cu 585 persoane sub trend, iar în
trimestrele III şi IV cu 758, respectiv, cu 133 persoane peste tendinţa de lungă durată.
Determinarea indicilor sezonieri. Pentru determinarea indicilor de sezonalitate, metodologia este
similară, parcurgându-se următorii paşi:
1. Se înlătură componenta de trend:
.
yt
= ytS ⋅ ytR
ytT
2. Se calculează, pentru fiecare sezon, media rezultatelor obţinute la punctul 1, eliminând
astfel variaţiile reziduale. 3. Indicii de sezonalitate se determină din mediile obţinute la pasul 2,
ajustate astfel încât indicele mediu să fie egal cu 1. Cele mai exacte rezultate se obţin dacă vom folosi
în calcule media geometrică. Cu toate acestea, pentru uşurinţa calculelor, deseori se foloseşte media
aritmetică.
Exemplu. Pe baza datelor din tabelul 8.3., vom înlătura componenta de trend (col. 3: col. 4) şi
yt : ytT
vom obţine , valori sistematizate în tabelul 11.6.
ytS ⋅ ytR
Tabelul 11.6. Determinarea indicilor de sezonalitate

Trimestrul
Anii Produsul
I II III IV
0 1 2 3 4 5
1998 − − 1,583 1,105 −
1999 0,759 0,552 1,607 1,084 −
2000 0,761 0,559 1,573 1,112 −
2001 0,762 0,554 − − −
Media 0,761 0,555 1,588 1,099 0,737
Indice de sezonalitate 0,821 0,599 1,714 1,186 0,000
Pentru fiecare sezon determinăm media valorilor astfel obţinute:

 pentru trim I: ; pentru trim II: ;
3
0, 759 ⋅ 0, 761⋅ 0, 762 = 0, 761 3
0,552 ⋅ 0,559 ⋅ 0,554 = 0,555
 pentru trim III: ; pentru trim IV: .

3
1,583 ⋅1, 607 ⋅ 1,573 = 1,588 3
1,105 ⋅1, 084 ⋅1,112 = 1, 099
Cum produsul acestor medii (geometrice) este diferit de 1:

, vom ajusta mediile calculate cu media indicilor
4
∏y
k =1
Sk = 0, 761⋅ 0, 555 ⋅1,588 ⋅1, 099 = 0, 737
sezonieri, obţinând indici de sezonalitate, astfel:

Media indicilor sezonieri este calculată ca o medie geometrică:
.
yS = 4 yS 1⋅ yS 2⋅ yS 3⋅ yS 4 = 0,9265
Indicii de sezonalitate vor fi subunitari în trimestrele I şi II şi supraunitari în trimestrele III şi IV.
29
yS 1 = 0, 761: 0, 9265= 0,821 yS 2 = 0,555 : 0,9265 = 0,599 yS 3 = 1,588 : 0,9265 = 1, 714
yS 4 = 1, 099 : 0,9265 = 1,186

Acum .
4
∏y
k =1
Sk =1
Indicii de sezonalitate astfel obţinuţi ne arată că, în medie, sosirile de turişti în trimestrele III şi IV
se află peste tendinţa de lungă durată cu 71,4%, respectiv cu 18,6%, iar în trimestrele I şi II, sosirile de
turişti se situează sub linia de trend cu 17,9%, respectiv cu 40,1%. În previzionarea sosirilor de turişti va
trebui să ţinem cont, pentru fiecare trimestru, de influenţa factorului sezonier, influenţă determinată sub
forma devierilor sezoniere sau a indicilor de sezonalitate. După ce am determinat devierile sezoniere ori
indicii de sezonalitate, vom desezonaliza seria cronologică ( ) pentru devieri şi pentru
yt − y Sk yt ySk
indici. Rezultatele astfel obţinute vor conţine doar componenta de tendinţă seculară (ytT) şi componenta
reziduală (ytR). Putem acum să determinăm tendinţa de lungă durată, aplicând o metodă mecanică ori
analitică. Să subliniem însă că, atunci când vom ajunge la etapa de previzionare, va trebui să ţinem cont şi
de devierile sezoniere, ori de indicii de sezonalitate.
A. TC. EXEMPLU
Obiectivul Econometriei
A fost formulată de către statisticianul Ragnar Frisch, în chiar primul număr al revistei Econometrica,
astfel: „experienţa a arătat că fiecare din următoarele trei puncte de vedere, al statisticii, a teoriei
economice şi al matematicii, este o condiţie necesară, dar nu şi suficientă pentru o înţelegere efectivă
a relaţiilor cantitative din economia modernă; unificarea lor este aceea care asigură eficienţa.
Econometria este tocmai această unificare.” Altfel spus, econometria reprezintă studierea
fenomenelor economice pe baza datelor statistice cu ajutorul modelelor matematice.
Definiţia restrictivă: A fost propusă de Cowles Comission for Research in Economics (Chicago,
1940-1950); în această viziune se consideră că econometria presupune investigarea fenomenelor
economice numai cu ajutorul modelelor aleatoare (stochastice, probabilistice); ea include doar
cercetările economice ce utilizează metodele inducţiei matematice la verificarea relaţiilor cantitative
formulate în teoria economică cu privire la fenomenele sau procesele studiate.
Definiţia extinsă: Aparţine economiştilor anglo-saxoni şi consideră că econometria în sens larg
înseamnă econometria în sens restrâns, la care se adaugă metodele cercetării operaţionale.
În prezent, econometria cuprinde şi tehnicile moderne de analiză a datelor (analiza marilor tabele, de
exemplu). Econometria poate fi folosită în două moduri, care nu sunt mutual exclusive: Ca
instrument de previziune (date fiind valori ipotetice ale anumitor variabile, putem previziona valoarea
variabilei de interes). Ca metodă explicativă (poate fi folosită pentru a confirma sau infirma o teorie
economică).
Modelul econometric este instrumentul de cercetare ştiinţifică ce stă la baza econometriei. Modelul
econometric, prin definiţie, este un model economic formulat astfel încât parametrii să poată fi
estimaţi dacă se face presupunerea că modelul este corect. Un model econometric poate fi format din
una sau mai multe relaţii statistice.
30
Specificul disciplinei
Deşi în domeniul economic există o mare diversitate de modele, modelarea acestora la orice nivel micro
sau macro economic se poate interpreta ca sistem intrare/ieşire unde Y = (yi) – volumul ieşirilor din
sistem, i=1,...,n, X = (xj) – factorii cantitativi şi calitativi care influenţează ieşirile yi, j=1,...,m, S –
structura sistemului prin intermediul căreia factorii xj determină ieşirile yi
Modelele pot fi:
➢ Modele deterministe: y= f(x) se utilizează frecvent în practica economică în
analiza pe factori a variaţiei, în timp sau spaţiu, a fenomenelor social economice (de
exemplu: Q = wL, unde Q este producţia, w este productivitatea muncii iar L este forţa de
muncă).
➢ Modele nedeterministe (econometrice) descriu legătura statistică sau stochastică
dintre intrările sistemului – factorii de influenţă X – şi ieşirile acestuia , variabilele
rezultative Y, după o relaţie de forma: Y = f(x)+ε, unde:
─ X sunt factorii de influenţă
─ Y este variabila rezultativă
─ f este legea de manifestare a unui fenomen sau proces economic
─ ε este variabila aleatoare
Modelul econometric este instrumentul de cercetare ştiinţifică ce stă la baza econometriei. Modelul
econometric, prin definiţie, este un model economic formulat astfel încât parametrii să poată fi estimaţi
dacă se face presupunerea că modelul este corect.
Un model econometric poate fi format din una sau mai multe relaţii statistice. Aceste relaţii pot fi:
─ relaţii de identitate sau deterministe: sunt formulări logice cu privire la procesul economic descris
(exemplu: VND=C + I, unde VND reprezintă Venitul Naţional Disponibil, C reprezintă consumul total, iar
I reprezintă investiţiile publice şi private);
─ relaţii de comportament: au în vedere modificările tradiţiilor, atitudinilor, înclinaţiilor (sub
raportul satisfacţie/efort) (exemplu: C = a + bV, unde C este consumul, iar V este venitul);
─ relaţii tehnologice: restricţiile impuse output-urilor în raport cu input-urile (exemplu: funcţia
Cobb Douglas: Q=ρI∝L1-α,0<α<1);
─ relaţii instituţionale: sunt relaţii de apar în conformitate cu unele reglementări impuse de lege
(exemplu: amortizarea, impozitul pe venit etc.).
Structura modelului econometric este determinată de variabilele economice. Acestea pot fi:
─ endogene: variabile determinate în cadrul sistemului;
─ exogene: variabile determinate în afara sistemului, despre care modelul econometric nu are nimic
de spus.
Din punct de vedere cronologic, observarea fenomenelor şi proceselor se poate realiza static şi dinamic,
datele primare putând fi:
─ fie o imagine de tip static a populaţiei statistice (datele fiind legate de starea populaţiei la un
moment dat);
─ fie o imagine de tip dinamic, evolutiv – în care datele oferă informaţii despre evoluţia în timp a
uneia din unităţi sau a întregii populaţii.
Aceste două modalităţi de observare a unităţilor unei populaţii conduc la gruparea datelor în trei categorii:
a) date de tip profil – reprezintă rezultatul unor măsurători efectuate la un anumit moment dat asupra
uneia sau mai multor variabile, pe mulţimea unităţilor populaţiei.
Aceste date de profil se mai numesc date de tip secvenţă sau date de tip secţiune şi reprezintă „tăieturi
informaţionale” efectuate într-o populaţie la un moment dat, „tăieturi” care sunt de tip transversal, în
raport cu axa timpului.
Se remarcă următoarele:
─ o observaţie în contextul datelor de tip profil este reprezentată de valoarea sau valorile unei
singure entităţi, ale unei singure unităţi din populaţie; numărul observaţiilor coincide, în cazul datelor de
tip profil, cu numărul unităţilor observate şi investigate;
─ acest tip de date nu încorporează, prin semnificaţia pe care o poartă, influenţa timpului asupra
formării caracteristicilor (semnul scurgerii timpului) nici în mod explicit şi nici în mod implicit;
31
─ ele se referă la starea pe care o au la un moment dat unităţile populaţiei statistice.
a) date de tip serii de timp – numite şi serii cronologice – reprezintă rezultate ale unor măsurători
efectuate asupra caracteristicilor, unităţilor populaţiei studiate, de-a lungul timpului, la momente succesive
sau la anumite intervale de timp.
Acestea sunt date de tip stoc sau de tip flux şi reprezintă „secţiuni informaţionale” de-a lungul axei
timpului, de-a lungul evoluţiei; adică sunt secţiuni longitudinale în raport cu axa timpului.
b) date de tip panel sunt combinaţii, mixturi ale datelor de tip profil şi ale datelor de tipul seriilor de
timp.
Ele sunt rezultate ale măsurătorilor efectuate asupra caracteristicilor unor unităţi individuale, atât de-a
lungul unităţilor individuale, cât şi de-a lungul timplui, sunt „tăieturi informaţionale mixte” transversale şi
longitudinale, în raport cu axa timpului. Caracteristica esenţială a acestor date este, deci, simultaneitatea.
Deşi tipologia modelelor econometrice este foarte variată, ele se pot încadra în câteva tipuri sau clase
principale:
1. După numărul factorilor luaţi în considerare:
─ modelele unifactoriale: y = f(x)+ ε se fundamentează pe ipoteza că, în rândul factorilor de
influenţă ai variabilei rezultative Y, există un factor determinant X, ceilalţi factori, cu excepţia acestuia
având o influenţă întâmplătoare (exprimată prin intermediul variabilei reziduale ε) sau fiind invariabili în
perioada analizată;
─ modele multifuncţionale: y = f(x1,x2,…,xp)+ε elimină deficienţa modelului unifactorial, însă
trebuie ca numărul factorilor luaţi în considerare să nu fie foarte mare pentru a nu fi mult prea complex,
dificil de estimat etc.
1. După forma legăturii dintre variabila rezultativă şi variabilele cauză:
─ modele liniare: dacă legătura este liniară;
─ modele neliniare: dacă legătura este neliniară.
1. După includerea factorului timp în model:
─ modele statice: dependenţa variabilei endogene Y faţă de valorile variabilei exogene Xj se
realizează în aceeaşi perioadă de timp:
y = f(x1t,…,xjt,…,xkt)+εt
─ modele dinamice:
─ introducerea variabilei timp ca o variabilă explicativă
y = f(xt,t)+εt;
─ autoregresive: variabila rezultativă cu valori decalate este una din variabilele explicative
y = f(xt,yt-k)+εt
─ model cu decalaj: variabila explicativă X îşi exercită influenţa asupra variaţiei variabilei
rezultative pe mai multe perioade de timp:
y = f(xt,xt-1,…,xt-k)+εt
1. Modele cu o ecuaţie sau cu ecuaţii multiple:
─ modele cu o singură ecuaţie: toate modelele prezentate anterior
─ modele cu ecuaţii multiple: sunt formate dintr-un sistem de ecuaţii
Y1+b12+…+b1nYn+c11X1+c12X2+…+c1mXm=ε1b21Y2+Y2+…
+b2nYn+c21X1+c22X2+…+c2mXm=ε2⋮bn1Y2+bn2Y2+…+Yn+cn1X1+cn2X2+…
+cnmXm=εn
Yi,i=1,n – variabile rezultative sau endogene
Xj,j=1,m – variabile explicative sau exogene
Procesul de luare a deciziilor presupune analiza, judecarea si interpretarea evidenţelor oferite de datele pe
care le avem la dispoziţie. Managerii trebuie să fie pregătiţi să ia decizii privind acţiunile viitoare pe baza
informaţiilor disponibile. Astfel, ei emit ipoteze pe care le pot testa ştiinţific utilizând metodele si tehnicile
statistice.
32
Testarea ipotezelor statistice reprezintă o altă modalitate, alături de estimaţia pe interval de încredere, de
a realiza inferenţă statistică. Scopul acestui tip de inferenţă statistică este să determinăm dacă există
suficiente dovezi statistice care să ne permită să concluzionăm că o afirmaţie (sau o ipoteză) dspre un
parametru este adevărată. În urma prelevării unui eşantion dintr-o populaţie statistica, prin prelucrarea
datelor provenite din sondaj se obţine un estimator al parametrului urmărit în populaţia de origine. Se pune
atunci problema în ce măsură parametrul estimat pe baza rezultatelor sondajului asigură „credibilitatea”
aprecierilor făcute asupra întregii colectivităţi. Estimatorul este, aşadar, o „presupunere” asupra
parametrului, deci o ipoteză statistică. Nu este nevoie să testăm ipoteze statistice atunci când ştim totul
despre un fenomen, ci doar când există incertitudine.
Ipoteza statistică este ipoteza care se face cu privire la parametrul unei repartiţii sau la legea de repartiţie
pe care o urmează anumite variabile aleatoare. O ipoeză statistică nu este neapărat adevărată. Ea poate fi
corectă sau greşită. În statistică, ipotezele apar întotdeauna în perechi: ipoteza nulă si ipoteza alternativă.
Ipoteza statistică ce urmează a fi testată se numeşte ipoteză nulă şi este notată, uzual, H0. Ea constă
întotdeauna în admiterea caracterului întâmplător al deosebirilor, adică în presupunerea că nu există
deosebiri esenţiale. Respingerea ipotezei nule care este testată implică acceptarea unei alte ipoteze.
Această altă ipoteză este numită ipoteză alternativă, notată H1. Cele două ipoteze reprezintă teorii,
mutual exclusive si exhaustive, asupra valorii parametrului populaţiei sau legii de repartiţie. Spunem că
ele sunt mutual exclusive deoarece este imposibil ca ambele ipoteze să fie adevărate. Spunem că ele sunt
exhaustive deoarece acoperă toate posibilităţile, adică ori ipoteza nulă, ori ipoteza alternativă trebuie să
fie adevărată. Procedeul de verificare a unei ipoteze statistice se numeşte test sau criteriu de
semnificaţie. O secvenţă generală de paşi se aplică la toate situaţiile de testare a ipotezelor statistice.
Există patru componente principale ale unui test privind o ipoteză: ipoteza nulă; ipoteza alternativă; testul
statistic; regiunea critică (de respingere). Ipotezele se vor schimba, tehnicile statistice aplicate se vor
schimba, dar procesul rămâne acelaşi, parcurgându-se următorii paşi:
1) Se identifică ipoteza statistică specială despre parametrul populaţiei sau legea de repartiţie (H0).
Ipoteza statistică – numită şi ipoteză nulă – specifică întotdeauna o singură valoare a parametrului
populaţiei şi reprezintă status-quo-ul, ceea ce este acceptat până se dovedeşte a fi fals.
2) Întotdeauna, ipoteza nulă este însoţită de ipoteza alternativă (de cercetat), H1, ce reprezintă o teorie care
contrazice ipoteza nulă. Ea va fi acceptată doar când există suficiente dovezi, evidenţe, pentru a se
stabili că este adevărată.
Ipoteza alternativă este cea mai importantă, deoarece este ipoteza care ne răspunde la întrebare. Ipoteza
alternativă poate căpăta trei forme, care răspund la trei tipuri de întrebări referitoare la parametrul studiat:
─ dacă parametrul este diferit (mai mare sau mai mic) decât valoarea specificată în ipoteza nulă;
─ dacă parametrul este mai mare decât valoarea specificată în ipoteza nulă;
─ dacă parametrul este mai mic decât valoarea specificată în ipoteza nulă.
3) Se calculează indicatorii statistici în eşantion, utilizaţi pentru a accepta sau a respinge ipoteza nulă şi se
determină testul statistic ce va fi utilizat drept criteriu de acceptare sau de respingere a ipotezei nule.
Pentru cele mai multe testări statistice ale ipotezelor, testul statistic este derivat din estimatorul punctual al
parametrului ce va fi testat. Spre exemplu, deoarece media eşantionului este un estimator punctual al
mediei din colectivitatea generală, ea va fi utilizată în testarea ipotezelor privind parametrul media
colectivităţii generale.
4) Se stabileşte regiunea critică, Rc. Regiunea critică reprezintă valorile numerice ale testului statistic
pentru care ipoteza nulă va fi respinsă. Regiunea critică este astfel aleasă încât probabilitatea ca ea să
conţină testul statistic, când ipoteza nulă este adevărată, să fie α, cu α mic (α = 0.01 etc). Verificarea
ipotezei nule se face pe baza unui eşantion de volum n, extras din populaţia X, care este o variabilă
aleatoare. Dacă punctul definit de vectorul de sondaj x1, x2, ..., xn cade în regiunea critică Rc, ipoteza H0 se
respinge, iar dacă punctul cade în afara regiunii critice Rc, ipoteza H0 se acceptă. Regiunea critică este
delimitată de valoarea critică, C – punctul de tăietură în stabilirea acesteia. În baza legii numerelor mari,
numai într-un număr foarte mic de cazuri punctul rezultat din sondaj va cădea în Rc, majoritatea vor cădea
în afara regiunii critice. Nu este însă exclus ca punctul din sondaj să cadă în regiunea critică, cu toate că
ipoteza nulă despre parametrul populaţiei este adevarată. Cu alte cuvinte, atunci când respingem ipoteza
nulă, trebuie să ne gândim de două ori, deoarece există două posibilităţi: ea este falsă într-adevăr şi ea este
totuşi adevărată, deşi pe baza datelor din sondaj o respingem.
33
La fel şi pentru situaţia în care acceptăm ipoteza nulă H0. Când ipoteza nulă nu poate fi respinsă (nu există
suficiente dovezi pentru a fi respinsă), sunt două posibilităţi: ipoteza nulă este adevărată si ipoteza nulă
este totuşi falsă, greşită, deşi nu am respins-o. De aceea, este mai corect să spunem că, pe baza datelor
din eşantionul studiat,nu putem respinge ipoteza nulă, decât să spunem că ipoteza nulă este adevărată.
Eroarea pe care o facem eliminând o ipoteză nulă, deşi este adevărată, se numeşte eroare de genul întâi.
Probabilitatea comiterii unei astfel de erori reprezintă riscul de genul întâi (α) şi se numeşte nivel sau
prag de semnificaţie.
Nivelul de încredere al unui test statistic este (1 – α), iar în expresie procentuală, (1 – α)100 reprezintă
probabilitatea de garantare a rezultatelor. Eroarea pe care o facem acceptând o ipoteză nulă, deşi este falsă,
se numeşte eroare de genul al doilea, iar probabilitatea (riscul) comiterii unei astfel de erori se notează cu
β. Puterea testului statistic este (1 – β).
OBSERVAŢIE. Se poate opta şi pentru alte aspecte specifice econometriei.

Studiu de caz (variante)
1. Un cercetător face un studiu asupra unor firme, privind şansele pe care acestea le oferă tinerilor
angajaţi de a promova repede şi de a avansa în carieră. Pentru aceasta el a cuprins în studiu un număr de
20 de companii producătoare de tehnologie de vârf şi a înregistrat timpul scurs de la angajarea iniţială a
unui salariat în firmă până la prima promovare a acestuia. Firmele au fost grupate după mărime, iar datele
înregistrate sunt:
Mărimea firmelor Număr de săptămâni de la angajare până la prima promovare
Mici 30; 26; 30; 32; 38; 24; 32; 28;
Medii 34; 32; 25; 36; 33;
Mari 47; 41; 43; 48; 40; 49; 40.
Se cere să se determine, folosind testul F de analiză dispersională, dacă variaţia timpului scurs până la
prima promovare este influenţată semnificativ de mărimea firmei.
Rezolvare:
Notăm cu X – caracteristica „mărimea firmelor” – factorul de grupare şi cu Y – caracteristica „număr de
săptămâni de la angajare până la prima promovare”. Se formulează următoarele ipoteze:
H 0 : µ1 = µ2 = µ3
H1 : µi ≠ µ j , i ≠ j
Unde  i reprezintă timpul mediu de promovare pentru firma din grupa „i”, la nivelul colectivităţii
generale. Calculăm, la nivelul eşantionului, mediile pentru fiecare grupă i ( ), cu , unde i
yi i = 1,3
reprezintă grupa (mărimea firmei):
săptămâni;
3
∑y
j =1
1j
30 + 26 + 30 + 38 + 32 + 24 + 32 + 28
y1 = = = 30, 00
n1 8
săptămâni;
5
∑y
j =1
2j
34 + 32 + 25 + 36 + 33
y2 = = = 32
n2 5
34
săptămâni.
7
∑y
j =1
3j
47 + 41 + 43 + 48 + 40 + 49 + 40
y3 = = = 44
n3 7
Numărul mediu de săptămâni pentru întreaga colectivitate de 20 de firme poate fi calculat ca medie a
mediilor parţiale:
săptămâni.
y=
∑yn i i
=
30 ⋅ 8 + 32 ⋅ 5 + 44 ⋅ 7
=35, 4
∑n i 20
Determinăm dispersia fiecărei grupe i ( ):
si2
∑( y )
8 2
1j − y1
j =1 (26 − 30)2 + (32 − 30)2 + (38 − 30) 2
s =
2
1 = +
n1 8
(24 − 30)2 + (32 − 30) 2 + (28 − 30) 2 128
+ = =16
8 8
∑( y )
5 2
2j − y2
j =1 (34 − 32) 2 + (25 − 32)2 + (36 − 32)2 + (33 − 32)2
s22 = = =
n2 5
70
= = 14
5
∑( y )
7 2
3j − y3
j =1 (47 − 44)2 + (41 − 44) 2 + (43 − 44) 2
s32 = = +
n3 7
(48 − 44) 2 + 2(40 − 44) 2 + (49 − 44) 2 92
= = = 13,14
7 7
Varianţa sistematică va fi:
( )
r 2
S1 = ∑ yi − y ⋅ ni =(30 −35, 4)2 ⋅8 +(32 −35, 4)2 ⋅5 +
i =1
+ (44 − 35, 4)2 ⋅ 7 = 808,8

Varianţa reziduală este:
( )
r ni 2 r
S 2 = ∑∑ yij − y i = ∑ si2 ⋅ ni = 128 + 70 + 92 = 290
i =1 j =1 i =1
Dispersia corectată sistematică este:
35
S1 808,8
s12 = = = 404, 4
r −1 2
Dispersia corectată reziduală este:
S2 290
s22 = = =17, 06
n − r 17
Testul F:
s12 404, 4
F= = = 23, 7
s22 17, 06
Ftabelar = Fcritic = Fα ,r −1,n −r = F0,05;2;17 = 3,59

Cum , rezultă că se respinge ipoteza nulă, acceptându-se ca adevărată ipoteza alternativă.
Fcalculat > Fcritic
Timpul mediu de promovare pe fiecare tip de firmă diferă semnificativ, în consecinţă se poate afirma, cu o
probabilitate de 95%, că mărimea firmei influenţează semnificativ variaţia timpului de promovare a
tinerilor.
2. În vederea fundamentării deciziei de înlocuire a unor utilaje din dotarea unei fabrici, managerul
acesteia solicită o analiză a vechimii utilajelor şi a costului de întreţinere anual al acestora. Astfel, cele 110
utilaje din dotarea fabricii sunt grupate după vechime (ani) şi după costul de întreţinere (mii lei):
Costul de întreţinere (mii lei)
Vechime(ani) Total
5–7 7–9 9–11 11–13
Mică (< 5 ani) 10 8 5 − 23
Medie (5–10 ani) − 15 20 7 42
Mare (> 10 ani) − 2 25 18 45
Total 10 25 50 52 110
Se cere să se determine dacă influenţa vechimii asupra variaţiei costului de întreţinere este semnificativă,
utilizând testul F de analiză dispersională.
Rezolvare: Notăm cu X – caracteristica „vechime” – factorul de grupare şi cu Y – caracteristica „costul de
întreţinere”. În vederea calculării indicatorilor necesari determinării statisticii F datele vor fi sistematizate
pentru fiecare categorie de vechime conform tabelelor de mai jos.
i = 1 (grupa „vechime mică”)

Cost de întreţinere (mii
(y )
2
n1j yj yjn1j y j − y1 − y1 n1j
RON) j
5–7 10 6 60 -1,56 24,336

7–9 8 8 64 0,44 1,549
9–11 5 10 50 2,44 29,768
11–13 12
Total 23 − 174 − 55,653
36
; .
y1 =
∑y n j 1j
=
174
= 7,56 mii RON 2 ∑( y − y )
j 1
2
n1 j 55, 653
s1 = = = 2, 42
∑n 1j 23
∑n 1j 23
i = 2 (grupa „vechime medie”)

(y )
2
n2j yj yjn2j yj − y2 − y 2 n 2j
RON) j
5–7 − 6 −
7–9 15 8 120 -1,62 39,366
9–11 20 10 200 0,38 2,888
11–13 7 12 84 2,38 39,6508
Total 42 − 404 − 81,9048
; .
y2 =
∑y n j 2j
=
404
= 9, 62 mii RON 2 ∑( y − y )j 2
2
n2 j 81,9048
s2 = = =1,95
∑n 2j 42
∑n 2j 42
i = 3 (grupa „vechime mare”)

(y )
2
n3j yj yjn3j yj − y3 − y 3 n3j
RON) j
5–7 − 6
7–9 2 8 16 -2,7 14,58
9–11 25 10 250 -0,7 12,25
11–13 18 12 216 1,3 30,42
Total 45 − 482 − 57,25
; .
y3 =
∑y n j 3j
=
485
= 10, 7 mii RON 2 ∑( y − y )j 3
2
n3 j 57, 25
s3 = = = 1, 27
∑n 3j 45
∑n 3j 45
Media dispersiilor grupelor va fi:

Varianţa reziduală este:
( ) = ∑s
r ni 2 r
S 2 = ∑∑ yij − y i i
2
⋅ ni = 2, 42 ⋅ 23 + 1,95 ⋅ 42 + 1, 27 ⋅ 45 = 194, 7
i =1 j =1 i =1
Costul mediu de întreţinere pentru întreaga colectivitate de 110 utilaje poate fi calculată ca medie a
mediilor parţiale:
.
y=
∑yn i i
=
7,56 ⋅ 23 + 9, 62 ⋅ 42 + 10, 7 ⋅ 45
=9, 64 mii RON
∑n i 110
37
Varianţa sistematică va fi:
( )
r 2
S1 = ∑ yi − y ⋅ ni =(7,56 −9, 64)2 ⋅23 +(9, 62 −9, 64) 2 ⋅42 +
i =1
+ (10, 7 − 9, 64)2 ⋅ 45 = 150,15

Dispersia corectată sistematică este:
S1 150,15
s12 = = = 75, 075
r −1 2
Dispersia corectată reziduală este:
S2 194, 7
s22 = = =1,82
n − r 107
Testul F:
s12 75, 075
F= = = 41, 25
s22 1,82
Ftabelar = Fcritic = Fα ,r −1,n −r = F0,05;2;107 = 3, 07

Cum , rezultă că se respinge ipoteza nulă, acceptându-se ca adevărată ipoteza alternativă.
Fcalculat > Fcritic
În consecinţă se poate afirma, cu o probabilitate de 95%, că vechimea utilajelor influenţează semnificativ
variaţia costului de întreţinere.
1. Pentru un magazin de mobilă s-au cules date privind numărul de spoturi publicitare difuzate şi
numărul vizitatorilor (mii pers.) timp de 14 zile:
Nr. spoturi Nr. vizitatori

Ziua
publicitare (mii pers.)
1 7 41
2 5 32
3 1 10
4 8 40
5 10 61
6 2 8
7 6 35
8 7 34
9 9 45
10 3 11
11 12 64
12 8 37
13 4 30
14 11 55
Se cere:
a) Reprezentaţi grafic datele. Comentaţi graficul.
b) Pe baza datelor de la nivelul eşantionului, determinaţi ecuaţia de regresie care modelează
legătura dintre cele două variabile şi calculaţi numărul zilnic previzionat de vizitatori.
38
c) Verificaţi dacă modelul de regresie identificat este valid statistic.

d) Testaţi semnificaţia statistică a parametrilor modelului, determinând şi intervalele de încredere
pentru aceştia.
e) Măsuraţi intensitatea legăturii dintre cele două variabile cu ajutorul coeficientului şi a raportului
de corelaţie; testaţi semnificaţia indicatorilor utilizaţi.
f) În ce măsură variaţia numărului de vizitatori este determinată de numărul spoturilor publicitare,
pe baza modelului de regresie determinat?
g) Previzionaţi numărul vizitatorilor aşteptaţi într-o zi, în ipoteza că se vor difuza 15 spoturi în
acea zi.
h) Previzionaţi numărul mediu zilnic de vizitatori, în ipoteza că se vor difuza 8 spoturi publicitare
în medie pe zi.
Rezolvare:
a) Notăm cu X variabila factorială, independentă „nr. spoturi publicitare” şi cu Y variabila
dependentă „nr. vizitatori”.
Pentru a identifica existenţa, forma şi sensul legăturii dintre variabilele analizate, construim
corelograma (figura 4.10.).
Figura 4.10. Corelograma (diagrama de împrăştiere)
Se observă că legătura dintre variabile este directă şi liniară (întrucât dreapta de regresie are pantă
pozitivă), iar ecuaţia de regresie va avea forma:
yˆ i = a + bxi
b) Pentru a determina estimatorii a şi b, rezolvăm sistemul de ecuaţii normale, folosind datele din
tabelul de lucru 4.5.:
na + b∑ xi = ∑ yi

a ∑ xi + b∑ xi = ∑ xi yi
2
(numărul observaţiilor).
n = 14
yˆ i = 2, 2858
( yi − yî ) ( yî − y ) ( xi − x )
2 2 2
xi yi xi2 xi yi yi2
+5, 0753xi
7 42 49 294 1764 37,81 17,53 3,29 0,13
5 32 25 160 1024 27,66 18,82 69,52 2,70
1 10 1 10 100 7,36 6,96 820,19 31,84
8 40 64 320 1600 42,89 8,34 47,44 1,84
10 61 100 610 3721 53,04 63,39 290,31 11,27
2 8 4 16 64 12,44 19,68 555,25 21,56
6 35 36 210 1225 32,74 5,12 10,64 0,41
7 34 49 238 1156 37,81 14,54 3,29 0,13
9 45 81 405 2025 47,96 8,78 143,12 5,56
3 11 9 33 121 17,51 42,40 341,82 13,27
12 64 144 768 4096 63,19 0,66 739,24 28,70
8 37 64 296 1369 42,89 34,67 47,44 1,84
4 30 16 120 900 22,59 54,96 179,91 6,98
39
11 55 121 605 3025 58,11 9,69 489,01 18,98


Σ yi Σ 
 y2i 3740,4
xi = = x2i = xiyi = 504 305,53 145,21
= 763 7
93 50 763 504
4
14a + 93b = 504


93a + 763b = 4085
∆ a 504 ⋅ 763 − 93 ⋅ 4085 4647

a= = = = 2, 2858
∆ 14 ⋅ 763 − (93) 2 2033
∆ b 14 ⋅ 4085 − 93 ⋅ 504 10318

b= = = = 5, 0753
∆ 14 ⋅ 763 − (93) 2 2033
Ecuaţia de regresie este:

yî = 2, 2858 + 5, 0753 xi
c) Testarea validităţii modelului de regresie determinat.
Pentru testarea validităţii modelului se formulează cele două ipoteze: H0: model nevalid statistic,
cu alternativa H1: model valid statistic. Se completează tabelul:
Grade de Media
Suma pătratelor
Sursa libertate (df- pătratelor (MS-
(SS-Sum of Testul Fisher (testul F)
variaţiei degree of Mean of
Squares)
freedom) Squares)
Datorată ∆ 2y x = 3740, 465 s y2 x = 3740, 465 3740, 465
regresiei
k =1 Fcalc = = 146,908
25, 461
Rezidual ∆ e2 = 305,535 n − k −1 = se2 = 25, 461

ă = 14 − 2 = 12
∆ 2y = 4046, 000 n −1 =
Totală
= 14 − 1 = 13
Valoarea teoretică pentru un prag de semnificaţie  = 0,005 şi 1, respectiv 12 grade de libertate,
preluată din tabelul repartiţiei Fisher, este .
Fα ;k ;n − k −1 = 4, 75
Întrucât se respinge H0, adică se concluzionează că modelul este valid.
Fcalc > Fα ;k ;n −k −1
Calculele intermediare se găsesc în tabelul 4.5.
d) Ecuaţia de regresie liniară la nivelul colectivităţii generale se scrie:
40
,
yi = α + β xi + ε i
iar la nivelul eşantionului:
yi = a + bxi + ei
Pentru testarea semnificaţiei parametrilor modelului de regresie liniară şi estimarea lor pe
intervalele de încredere se procedează astfel:
1) pentru parametrul β
Ipotezele testate sunt:
,
H 0 : β = 0( µb = β = 0)
.
H1 : β ≠ 0
Deoarece volumul eşantionului este mic ( ), vom utiliza testul t:
n < 30
, statistică ce urmează o distribuţie t cu ( ) grade de libertate.
b − µb b − 0 n−2
tcalc = =
sb sb
Unde
se 5, 046
sb = = = 0, 4187
n
145, 21
∑ (x − x )
i =1
i
2
Iar
n
∆ e2 ∑ ( y − yˆ )
i i
2
305,53
se = = i=1
= = 5, 046
n−2 n−2 12
Se obţine
tcalc = 12,1206
Pentru un prag de semnificaţie de 5%, valoarea teoretică a testului este . Deoarece
tα 2;13 = 2,179
vom concluziona că este foarte improbabil ca estimatorul b să provină dintr-o populaţie cu
tcalc > tα 2;13
(adică β este semnificativ diferit de zero), deci parametru β este semnificativ statistic.
β =0
Intervalul de încredere pentru parametrul β, coeficientul de regresie din colectivitatea generală,
este:
41
, adică .
b − tα 2, n −2 ⋅ sb ≤ β ≤ b + tα 2, n −2 ⋅ sb 4,1629 ≤ β ≤ 5, 9876
2) pentru parametrul a
,
H0 : α = 0
.
H1 : α ≠ 0
Statistica t este:
.
a − µa a − 0
tcalc = =
sa sa
Unde
n
∑x 2
i
763
sa = se i =1
= 5, 046 ⋅ = 3, 0912
n
14 ⋅145, 21
n∑ ( xi − x ) 2
i =1
tcalc = 0, 7394
Pentru un prag de semnificaţie de 5%, valoarea teoretică a testului este . Deoarece
tα 2;13 = 2,179
vom concluziona că este foarte probabil ca estimatorul a să provină dintr-o populaţie cu
tcalc < tα 2;13
(adică α nu este semnificativ diferit de zero).
α =0
Intervalul de încredere pentru parametrul α este dat de:
, adică .
a − tα 2,n −2 ⋅ sa ≤ α ≤ a + tα 2, n − 2 ⋅ sa −4, 4495 ≤ α ≤ 9, 0210
Un argument suplimentar pentru concluzia că parametrul α este nesemnificativ statistic este acela
că intervalul de încredere include şi valoarea zero.
e) Pentru a măsura intensitatea legăturii dintre cele două variabile, se va calcula mai întâi
coeficientul de corelaţie liniară:
42
n∑ xi yi − ∑ xi ∑ yi ∆b
r= = =
n x 2 − ( x )  n y2 − (
 ∑ i ∑ i   ∑ i ∑ yi )  ∆  n∑ yi2 − ( ∑ yi ) 
2 2 2
 
10318 10318
= = = 0, 9615
2033(14 ⋅ 22190 − 504 ) 10731
2
Acest indicator ne arată o legătură directă şi foarte puternică (r este pozitiv şi apropiat de valoarea
unitară).
Pentru testarea semnificaţiei coeficientului de corelaţie liniară simplă, se procedează astfel:
(ρ nu este semnificativ statistic)
H0 : ρ = 0
(ρ este semnificativ statistic).
H1 : ρ ≠ 0
Statistic t este:
.
r r n − 2 0,9615 ⋅ 12
tcalc = = = =12,12
sr 1− r2 1 − 0,96152
Cum valoarea tabelară a testului t, pentru un prag de semnificaţie de 5% şi 12 grade de libertate
este 2,179 rezultă ,deci coeficientul de corelaţie este semnificativ statistic.
tcalc > tα ;n − 2
Un alt indicator utilizat atât în cazul legăturilor liniare, cât şi al celor neliniare este raportul de
corelaţie R:
R = Ry / x = 1 −
∑ ( y − yˆ )
i i
2
= 1−
305, 53
= 0, 9615
∑ ( y − y)i
2
4046
Calculele necesare determinării raportului de corelaţie sunt redate în 4.5.

mii pers.
y=
∑y i
=
504
= 36
n 14
, deci există o legătură liniară, puternică şi directă între cele două variabile.
Ry / x = ry / x = 0,9615
Testarea semnificaţiei raportului de corelaţie se face cu testul F:
n − k −1 R2
F= ⋅ = 146,9
k 1− R2
Valoarea teoretică pentru un prag de semnificaţie α = 0,05 şi 1, respectiv 12 grade de libertate,
preluată din tabelul repartiţiei Fisher, este .
Fα ;k ;n −k −1 = 4,75
43
Întrucât se respinge H0, adică se concluzionează că R este semnificativ statistic.

Fcalc > Fα ;k ;n −k −1
f) Pentru a determina în ce măsură variaţia numărului de vizitatori este explicată de influenţa
numărului de spoturi publicitare difuzate zilnic, se calculează coeficientul de determinaţie:
sau 92,45% arată că aproximativ 92% din variaţia variabilei Y este
Ry2 x = 0,96152 = 0,9245
explicată de variabila X.
g) Dacă numărul spoturilor publicitare difuzate va fi de 15, atunci numărul previzionat al
vizitatorilor pe baza acestei ecuaţii de regresie este:
mii pers. (estimare punctuală)
yˆ / x =15 = 2, 2858 + 5, 0753 ⋅15 ≅ 78
Pentru estimarea pe interval de încredere, trebuie să determinăm dispersia diferenţei ,
$
y n +1 − yn +1,i
adică dispersia erorii de previzionare. Dispersia în eşantion este:
 2 
 1
s(2yˆ ) = s 2$y − y = s2e 1+ + n
x n +1 − x  (
 = 25, 461⋅
) 
+
1 (15 − 6,64) 2 
+
( n+1 n+1,i )  1 = 39, 534
 n 2  14 145, 21 
∑
n+1,i
 ( xi − x ) 
 i =1 
Intervalul de încredere este:
, adică (64,71; 92,11) mii persoane.
( )
2
1 xn +1 − x
$
y n +1,i ± tα /2, n −2 se 1 + + n
n
∑ ( xi − x)2
i =1
h) Suntem în cazul determinării intervalului de încredere pentru media de răspuns, când .

xn +1 ≠ x
Pentru aceasta se determină:
$
( )
y n+1 = y + b xn +1 − x =36 +5, 0753 ⋅(8 −6, 64) =42,9
iar estimatorul dispersiei pentru este:

$
y n +1
 2 
1
= se2  + n
x n(+1 − x  )  1 (8 − 6, 64) 2 
 = 25, 461⋅  +
s(2yˆ n+1 ) = 2,14
n 2  14 145, 21 


∑i =1
( xi − x) 

Intervalul de încredere pentru media de răspuns este:
44
, adică (39,71; 46,08) mii persoane.
( )
2
1 xn +1 − x
$
y n +1 ± tα /2,n − 2 se + n
n
∑ ( xi − x)2
i =1
2. Vânzările trimestriale realizate de o fabrică de jucării electronice în perioada 2002-2005 se

prezintă astfel: (tabelul 8.11.) (mii bucăţi):
Tabelul 8.11.
Vânzările trimestriale în anul
Trimestrul
2002 2003 2004 2005
0 1 2 3 4
I 10 11 14 13
II 14 16 18 16
III 11 10 13 9
IV 21 22 22 25
Se cere:
a) Să se determine mediile mobile din câte 4 termeni consecutivi.
b) Să se determine abaterile sezoniere şi coeficienţii (indicii) sezonieri.
c) Să se determine trendul pentru seria desezonalizată.
d) Să se extrapoleze seria de date privind volumul vânzărilor de jucării electronice pentru
trimestrul III, anul 2006, folosindu-se cea mai bună metodă de ajustare.
Rezolvare:
a) Datele fiind trimestriale, se vor calcula medii mobile din număr par de termeni (p = 4).
Mecanismul de calcul şi mediile mobile parţiale şi finale sunt prezentate în tabelul 8.12., coloanele 2 şi 3.
Tabelul 8.12.
Anul şi trimestrul Termenii seriei Medii mobile parţiale Medii mobile centrate
0 1 2 3
I 10 −
II 14 −
2002 III 11 14 14,125
IV 21 14,25 14,5
I 11 14,75 14,625
II 16 14,5 14,625
2003 III 10 14,75 15,125
IV 22 15,5 15,75
I 14 16 16,375
2004 II 18 16,75 16,75
III 13 16,75 16,625
IV 22 16,5 16,25
I 13 16 15,5
2005 II 16 15 15,375
III 9 15,75 −
IV 25 −
Prima medie mobilă:
45
10 11
+ 14 + 11 + 21 +
MM 1 = 2 2 = 14,125
4
A doua medie mobilă va fi:
14 16
+ 11 + 21 + 11 +
MM 2 = 2 2 = 14,5
4
Etc.
Ultima medie mobilă va fi:
22 25
+ 13 + 16 + 9 +
MM 12 = 2 2 = 15,375
4
Figura 8.11. Vânzările trimestriale de jucării electronice în perioada 2002-2005
b) Se vor folosi datele din tabelul 8.11., pentru care s-au calculat mediile mobile din tabelul 8.12.
Pentru analiza sezonalităţii vom aplica, pe rând, modelul aditiv şi cel multiplicativ.
I) Modelul aditiv
• Se elimină din termenii reali yt valorile de trend ( ), determinate prin metoda mediilor mobile.
yˆt
Rezultaele se găsesc în coloana 3 a tabelului 8.13., începând cu trimestrul III/2002:
( yt − yˆ t ) III /'02 = 11 − 14,125 = −3,125 mii buc.
( yt − yˆ t ) IV /'02 = 21 −14,5 = 6,5 mii buc.

etc.
• Aceste diferenţe se trec în tabelul 8.14., în care se calculează devierile sezoniere brute ( )–
'
S j
coloana 5 – şi corectate (sj) coloana 6.

Devierile sezoniere brute:
−3,125 − 2,375 − 2,5
S I' = = −2, 667 mii buc.
3
1,375 + 1, 25 + 0, 625
S II' = =1, 083 mii buc.
3
−3,125 − 5,125 − 3, 625

S III' = = −3,958 mii buc.
3
46
6, 5 + 6, 25 + 5, 75
S IV' = = 6,167 mii buc.
3
Media devierilor sezoniere brute:
S I' + S II' + S III
'
+ S IV' −2, 667 + 1, 083 − 3,958 + 6,167
S =
'
= = 0,15625
4 4
Devierile sezoniere corectate:
S I = S I' − S ' = − 2, 667− 0,15625= − 2,823≅ − 3 mii buc .
S II = SII' − S ' = 1, 083− 0,15625= 0,927≅ 1 mii buc .
S III = S III' − S ' = − 3,958− 0,15625= − 4,114≅ − 4 mii buc .
S IV = SIV' − S ' = 6,167− 0,15625= 6, 011

≅ 6 mii buc .
• Se calculează termenii seriei cronologice corectate, eliminându-se din valorile termenilor reali
devierile sezoniere corectate (coloana 5/tabelul 8.13.):
( yt − S I ) I /'02 = 10 − ( −3) = 13 mii buc.
( yt − S II ) II /'02 = 14 − 1 = 13 mii buc.

etc.
• Se determină componenta aleatoare, scăzând din valorile termenilor reali trendul şi sezonalitatea
(coloana 6/tabelul 8.13.):
(ε t ) III /'02 = 11 − 14,125 + 4 = 0,989
(ε t ) IV / '02 = 21 − 14,5 − 6 = 0, 489

etc.
În trimestrul I al fiecărui an, factorul sezonier a determinat o scădere a valorii producţiei vândute
cu aproximativ 3 mii bucăţi faţă de linia de trend; în trimestrul II al fiecărui an, factorul sezonier a
determinat o creştere a valorii producţiei vândute cu circa 1 mii bucăţi faţă de linia de trend; în trimestrul
III al fiecărui an, factorul sezonier a dus la o scădere a valorii producţiei vândute cu 4 mii bucăţi faţă de
linia de trend, iar în trimestrul IV al fiecărui an, factorul sezonier a determinat o creştere a valorii
producţiei cu circa 6 mii bucăţi faţă de linia de trend.
Tabelul 8.13.
Trendul (medii
mobile) SCR
yt − yˆ t Componenta
Anul şi trimestrul yt corectată yt
yˆ t aleatoare ε t
- sj
0 1 2 3 4 5 6
I 10 − − 13 −
II 14 − − 13 −
2002
III 11 14,125 -3,125 15 0,989
IV 21 14,5 6,5 15 0,489
47
I 11 14,625 -3,125 14 -0,802

II 16 14,625 1,375 15 0,448
2003
III 10 15,125 -5,125 14 -1,011
IV 22 15,75 6,25 16 0,239
I 14 16,375 -2,375 17 0,448
II 18 16,75 1,25 17 0,323
2004
III 13 16,625 -3,625 17 0,489
IV 22 16,25 5,75 16 -0,261
I 13 15,5 -2,5 16 0,323
2005
II 16 15,375 0,625 15 -0,302
III 9 − − 13 −
IV 25 − − 19 −
Tabelul 8.14.
Diferenţe sezoniere Devieri
sezoniere Devieri
brute sezoniere
Trim.
2002 2003 2004 2005 corectate
S 'j (Sj)
0 1 2 3 4 5 6
I − -3,125 -2,375 -2,5 -2,667 -2,823 ~ -3
II − 1,375 1,25 0,625 1,083 0,927 ~ 1
III -3,125 -5,125 -3,625 − -3,958 -4,144 ~ -4
IV 6,5 6,25 5,75 − 6,167 6,011 ~ 6
Total S ' = 0,15625
II) Modelul multiplicativ

• Se împarte termenii reali (yt) la trend ( ) (coloana 4/tabelul 8.15)
yˆt
( yt / yˆ t ) III /'02 = 11:14,125 = 0, 779
( yt / yˆ t ) IV /'02 = 21:14,5 = 1, 448

etc.
 Rapoartele rezultate la pasul anterior se trec în tabelul 8.16., în care se calculează indicii de
sezonalitate bruţi (coloana 5) şi cei corelaţi (coloana 6).
Indicii de sezonalitate bruţi:
'
S I* = 3 0, 779 ⋅0,885 ⋅0,839 = 0,824
'
S II* = 3 1, 094 ⋅1, 075 ⋅1, 041 =1, 07
*'
S III = 3 0, 779 ⋅0, 661 ⋅0, 792 = 0, 741
48
'
S IV* = 3 1, 448 ⋅1,397 ⋅1,354 =1, 400
Media indicilor de sezonalitate bruţi:
' 4 '
S * = S I* ⋅ SII* ⋅ SIII
*
⋅ SIV
*
= 4 0,824 '⋅1, 07 ⋅ 0, 741⋅1, 400 = 1, 00875
Indicii de sezonalitate corectaţi:
' '
S I* 0,824 S II* 1, 07
S = *
I = = 0,817 S = *
II = = 1, 061
*' 1, 00875 *' 1, 00875
S S
*' *'
S III 0, 741 S IV 1, 4
S *
III = = = 0, 734 S *
IV = = = 1,388
*' 1, 00875 *' 1, 00875
S S
• Se calculează termenii seriei cronologice corectate, împărţindu-se termenii reali la indicii de
sezonalitate bruţi (coloana 5/tabelul 8.15.).
• Se determină componenta aleatoare, împărţindu-se termenii reali la produsul dintre trend şi
indicii de sezonalitate (coloana 6/tabelul 8.15.).
Tabelul 8.15.
Trendul (medii Componenta
mobile) SCR aleatoare
Anul şi trim. yt yt / yˆ t corectată
yˆ t yt / sj* ε t*
0 1 2 3 4 5 6
I 10 − − 12,240 ~ 12 −
II 14 − − 13,195 ~ 13 −
2002
III 11 14,125 0,779 14,986 ~ 15 1,061
IV 21 14,5 1,448 15,130 ~ 15 1,043
I 11 14,625 0,779 13,464 ~ 13 0,921
II 16 14,625 1,094 15,080 ~ 15 1,031
2003
III 10 15,125 0,661 13,624 ~ 14 0,901
IV 22 15,75 1,397 15,850 ~ 16 1,006
I 14 16,375 0,855 17,136 ~ 17 1,046
II 18 16,75 1,075 16,965 ~ 17 1,013
2004
III 13 16,625 0,782 17,711 ~ 18 1,065
IV 22 16,25 1,354 15,850 ~ 16 0,975
I 13 15,5 0,839 15,912 ~ 16 1,026
II 16 15,375 1,041 15,080 ~ 15 0,981
2005
III 9 − − 12,261 ~ 12 −
IV 25 − − 18,011 ~ 18 −
Tabelul 8.16.
Trim. Indici de sezonalitate Indici de Indici de
sezonalitate sezonalitat
2002 2003 2004 2005 e corectaţi
49
bruţi ( )
' S*
0 1 2 3 4 5 S *j 6j
I − 0,799 0,855 0,839 0,824 0,817
II − 1,094 1,075 1,041 1,07 1,061
III 0,779 0,661 0,782 − 0,741 0,734
IV 1,448 1,397 1,354 − 1,400 1,388
Total 1,00875
În trimestrul I al fiecărui an, factorul sezonier a determinat o scădere a valorii producţiei vândute
cu aproximativ 81,7 – 100 = –18,3%; în trimestrul II al fiecărui an, factorul sezonier a determinat o
creştere a valorii producţiei vândute cu 106,1 – 100 = 6,1% faţă de linia de trend; în trimestrul III al
fiecărui an, factorul sezonier a dus la o scădere a valorii producţiei cu 73,4 – 100 = –26,6% faţă de linia de
trend, iar în trimestrul IV al fiecărui an, factorul sezonier a determinat o creştere a valorii producţiei cu
138,8 – 100 = 38,8% faţă de linia de trend.
c) Pentru seria corectată de sezonalitate cu ajutorul indicilor de sezonalitate (tabelul 8.15., coloana
5), determinarea trendului se poate face prin metode mecanice sau analitice.
Tabelul 8.17.
Anul şi trim. yt yˆt ( ∆ ) yˆt ( I ) t t2 ty yˆ t lin
0 1 2 3 4 5 6 7 8
I 12 12,0 12,00 -15 225 -180 13,67
2002 II 13 12,4 12,32 -13 169 -169 13,86
III 15 12,8 12,66 -11 121 -165 14,06
IV 15 13,2 13,00 -9 81 -135 14,25
I 13 13,6 13,35 -7 49 -91 14,45
II 15 14,0 13,71 -5 25 -75 14,64
2003
III 14 14,4 14,08 -3 9 -42 14,83
IV 16 14,8 14,46 -1 1 -16 15,03
I 17 15,2 14,85 1 1 +17 15,22
II 17 15,6 15,25 3 9 +51 15,42
2004
III 18 16,0 15,66 5 25 +90 15,61
IV 16 16,4 16,09 7 49 +112 15,80
I 16 16,8 16,52 9 81 +144 16,00
2005 II 15 17,2 16,97 11 121 +165 16,19
III 12 17,6 17,42 13 169 +156 16,39
IV 18 18,0 18,00 15 225 +270 16,58
Total 242 0 1360 132
I. Metoda modificării medii absolute
50
;
n
∑∆ t / t −1
∆ n /1 y n − y1 18 − 12
∆= t =2
= = = = 0, 4 mii.buc.
n −1 n −1 n −1 15
yˆt ( ∆ ) = y1 + ( t −1) ⋅ ∆
; (tabelul 8.17. coloana 3)
yˆt ( ∆ ) = 12 + (t − 1) ⋅ 0, 4; t = 1,16
II. Metoda indicelui mediu de modificare

;
18
I = n −1 ∏ I t / t −1 = n −1 In /1 = 15 = 1, 027
12
( )
t −1
yˆt ( I ) = y1 ⋅ I
(tabelul 8.17. coloana 4)

yˆt ( I ) = 12 ⋅ ( 1.027 )
t −1
; t = 1,16
III. Metoda trendului liniar

yˆt = a + b ⋅ t
;

a =
∑ y = y = 15,125
na + b ∑ t = ∑ y  n
 ⇒
a ∑ t + b∑ t = ∑ ty b = ∑ ty = 132 = 0, 097
2

 ∑ t 2 1360
(tabelul 8.17. coloana 8)
yˆt = 15,125 + 0, 097 ⋅ t
d) Alegem cea mai bună metodă de ajustare a seriei cronologice, ca fiind cea pentru care se obţine
minimul expresiei: . Conform tabelului 8.18. valoarea minimă a expresiei se obţine pentru
∑ ( y − yˆ )
2
t t
metoda trendului liniar (42,958).

Tabelul 8.18.
( yt − yˆt ) ( yt − yˆ t )
2 2
( yt − yˆ t )
2
Anul şi trim. yt yˆt ( ∆ ) yˆt ( I ) yˆ t lin

( ∆) ( I) ( liniar )
0 1 2 3 4 8 9 10 11
51
I 12 12,0 12,00 13,67 0 0 2,7889

2002 II 13 12,4 12,32 13,86 0,36 0,4624 0,7396
III 15 12,8 12,66 14,06 4,84 5,4756 0,8836
IV 15 13,2 13,00 14,25 3,24 4,0000 0,5625
I 13 13,6 13,35 14,45 0,36 0,1225 2,1025
II 15 14,0 13,71 14,64 1,00 1,6641 0,1296
2003
III 14 14,4 14,08 14,83 0,16 0,0064 0,6889
IV 16 14,8 14,46 15,03 1,44 2,3716 0,9409
I 17 15,2 14,85 15,22 3,24 4,6225 3,1684
II 17 15,6 15,25 15,42 1,96 3,0625 2,4964
2004
III 18 16,0 15,66 15,61 4,00 5,4756 5,7121
IV 16 16,4 16,09 15,80 0,16 0,0081 0,0400
2005 I 16 16,8 16,52 16,00 0,64 0,2704 0
II 15 17,2 16,97 16,19 4,84 3,8809 1,4161
III 12 17,6 17,42 16,39 31,36 29,3764 19,2721
IV 18 18,0 18,00 16,58 0 0 2,0164
Total 242 57,60 60,7990 42,9580
Determinăm întâi valoarea de trend pentru trimestrul III 2006, pe baza metodei trendului liniar.
mii buc.
yˆ III 2006 = 15,125 + 0, 097 ⋅ 21 = 17,162
Se calculează apoi volumul previzionat al vânzărilor pentru trimestrul III 2006, ţinându-se cont şi de
influenţa factorului sezonier: pe baza modelului aditiv: mii buc.; pe
yIIIp 2006 = 17,162 − 4,114 = 13, 048
baza modelului multiplicativ: mii buc.
yIIIp 2006 = 17,162 ⋅ 0, 734 = 12,597
OBSERVAŢII FINALE
1. Se va alege un singur exemplu pentru aplicaţia din TC (punctul 3) din cele de mai sus.
2. TC se va utiliza în timpul lucrării de verificare.
3. Întrebările la Verificare (lucrarea scrisă) vor fi din TC, astfel:
a. Definiţi ob. de studiu al econometriei (1 punct)
b. Precizaţi şi exemplificaţi noţiunea de model econometric (2 puncte)
c. Specificul econometriei (2puncte)
d. Daţi un exemplu cu elementele definitorii (nu cu tot cu calcule). (4 puncte).
e. 1 punct din oficiu.Total 10puncte. Timp de lucru 60 minute. Rezultatele se dau după
o oră de la finalul lucrări (adică la ora 19,30).
Verificarea va avea loc pe data de 19 iunie ora 17,30.

Data: 23.05.2009
52

GhidECO2009 AAI

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

GhidECO2009 AAI

Încărcat de

Drepturi de autor:

Formate disponibile

Econometrie 2009 – AAI / Ghid practic (teorie, probleme, TC)

MATERIAL UTIL PENTRU ACOPERIREA TUTUROR ELEMENTELOR

Modelele pot fi:

Modelul econometric este instrumentul de cercetare ştiinţifică ce stă la baza econometriei.

Transformarea datelor primare

3.1.1 Variabile aleatoare discrete

este o funcţie de probabilitate.

1. Repartiţia geometrică (Pascal):

seria geometrică de raţie 0<q<1, convergentă, cu suma .

Evenimentul care constă în faptul că:

Variabilele aleatoare X şi Y se numesc independente dacă evenimentele ( ) şi ( ),

Funcţia de repartiţie a unei variabile aleatoare:

Concepte generale in testarea ipotezelor statistice

Figura 6.1. Legătura dintre probabilităţile α şi 

Figura 6.2.  şi β când volumul eşantionului n’>n

Modelul de analiză dispersională unifactorială

y1n1 y2n2 ..... yrnr

Raţionamentul analizei dispersionale se bazează pe partiţionarea sumei pătratelor abaterilor:

cu gradele de libertate ( ) la numărător şi ( ) la numitor. Testul statistic F se realizează

grade de libertate şi probabilitatea aleasă de grantare a rezultatelor. Rezultatul este

Modelul unifactorial de regresie. Regresia liniară

intersecţie (α ) şi ai pantei liniei de regresie (β ), obţinuţi pe eşantion, iar , estimatorul componentei

condiţionat de ionat de X, , adică nu există variabile omise asiciate cu regresia

Figura 8.3. Distribuţia de probabilitate pentru εi

3. Ipoteza de homoscedasticitate: constantă

Variabilele aleatoare au dispersia constantă, , adică dispersia reziduurilor în populaţie este

5. Variabila aleatoare εi este normal distribuită (figura 8.3.)

6. Necorelarea între regresor şi erori: i şi j

8.1.3. Estimarea parametrilor modelului de regresie

Regresia simplă liniară

Figura 8.6. Abaterea ei de la linia de regresie

Procedeul de determinare a liniei de regresie în eşantion urmăreşte să găsească valorile lui a şi b,

cunoscută ca metoda celor mai mici pătrate, înseamnă minimizarea relaţiei:

S ( a, b) = min ∑ ei2 = min ∑ ( yi − a − bxi )

Condiţiile de ordin 1 de minimizare a funcţiei sunt:

Deci matricea este pozitiv definită.

În urma determinării coeficienţilor a şi b ai ecuaţiei de regresie, se calculează valorile ajustate

În urma ajustării vom obţine:

Determinarea coeficienţilor aşi b pe baza acestor sisteme de ecuaţii se adaptează corespunzător.

MODELAREA ECONOMETRICĂ A SERIILOR CRONOLOGICE

Figura 11.1. Populaţia României în perioada 1980-2005

Tabelul 11.1. Indici de utilizare netă a capacităţii în funcţiune (%)

Figura 11.2. Indici de utilizare netă a capacităţii în

Figura 11.3. Variaţie ciclică într-o serie cronologică

4. Componenta reziduală determină variaţii întâmplătoare, manifestate ca devieri neregulate într-

Tabelul 11.2. Componentele unei serii cronologice

11.1.1. Estimarea componentei trend

Tabelul 11.3. Sosiri trimestriale de turişti la hotelul „Creasta”

Prima medie mobilă centrată este:

Figura 11.4. Determinarea tendinţei seculare folosind mediile mobile

11.1.2. Estimarea componentei sezoniere

Tabelul 11.5. Determinarea devierilor sezoniere

Pentru fiecare sezon vom determina media abaterilor:

obţinând devieri sezoniere, astfel: persoane

Tabelul 11.6. Determinarea indicilor de sezonalitate

Pentru fiecare sezon determinăm media valorilor astfel obţinute:

 pentru trim III: ; pentru trim IV: .

Cum produsul acestor medii (geometrice) este diferit de 1:

sezonieri, obţinând indici de sezonalitate, astfel:

yS 1 = 0, 761: 0, 9265= 0,821 yS 2 = 0,555 : 0,9265 = 0,599 yS 3 = 1,588 : 0,9265 = 1, 714

yS 4 = 1, 099 : 0,9265 = 1,186

─ ele se referă la starea pe care o au la un moment dat unităţile populaţiei statistice.

OBSERVAŢIE. Se poate opta şi pentru alte aspecte specifice econometriei.