Documente Academic
Documente Profesional
Documente Cultură
Introducere
Analiza evoluţiei unei variabile în timp este întotdeauna precedată de reprezentarea sa grafică.
Graficul permite descrierea intuitivă a principalelor caracteristici ale seriei, detectarea unor:
- regularităţi, precum tendinţa sau sezonalitatea
- valori extreme, discontinuităţi
- schimbări bruşte în evoluţie, sau puncte de inflexiune.
Graficul este util pentru formularea adecvată a unui model ce descrie mecanismul de generare
al datelor, şi facilitează elaborarea de previziuni.
Cronograma
Cronograma, graficul specific seriilor de timp, se trasează într-un sistem de axe ortogonale,
coordonate carteziene uzuale (scară aritmetică, liniară) sau semilogaritmice (scară
semilogaritmică), respectiv în sistem de coordonate polare (pentru date cu sezonalitate). În
sistemul de axe ortogonale, pe axa OX se reprezintă timpul t iar pe OY valoarea
corespunzătoare a variabilei yt , rezultând cuplurile de valori (t , yt ) t 1, T . Cronograma se
obţine prin unirea punctelor corespunzătoare pentru două observaţii succesive.
În coordonate semilogaritmice, pe axa OY sunt reprezentate valorile logaritmate ale
variabilei: logaritm natural ln(Y) sau logaritm zecimal lg(Y). Se recurge la această
reprezentare de regulă atunci când variaţia datelor este mare, variabila are o tendinţă
exponenţială (prin logaritmare tendinţa devine liniară), sau prezintă interes modificarea
variabilei în cifre relative (cu câte procente %) mai degrabă decât în cifre absolute (cu câte
unităţi de măsură).
Atunci când lungimea seriei este scurtă, pentru redarea grafică a evoluţiei se
utilizează şi diagrama prin benzi sau coloane (prezentate în capitolul 1).
Graficului poate deforma însă, vizual, caracteristicile seriei.
Exemplu
Evoluţia lunară a câştigului salarial mediu net (lei) în România, perioada ianuarie 2008-iulie
2018 este redată în Figura 5.1.
Se cere: Indicaţi ce regularităţi sunt vizibile în grafic.
Figura 5.1. Evoluţia lunară a câştigului salarial mediu net
2,800
2,400
2,000
1,600
1,200
800
2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018
Graficul sugerează fluctuaţii ale câştigului salarial în jurul unei tendinţe de creştere; observăm
o creşteră mai lentă ȋn prima parte a perioadei, iar începând cu anul 2015 ritmul de creştere
este mai rapid. O analiză mai atentă a graficului indică un punct de maxim local
corespunzător lunii decembrie, pentru majoritatea anilor. Fluctuaţiile câştigului salarial din
cursul anului, de la o lună la alta, au fost determinate, în principal, de acordarea unor premii,
alocări din profit sau prime acordate cu diverse ocazii, sărbători, de regulă în lunile decembrie
respectiv martie/aprilie.
Exemplu
Evoluţia zilnică a indicelui bursier BET, perioada 2.01.2002-29.01.2010, din figura 5.2, este
reprezentată grafic, atât în coordonate uzuale (aritmetice), cât şi în coordonte semilogaritmice
(pe axa OY fiind considerate valorile logaritmate ale indicelui ln(BET)).
Se cere: Analizaţi comparativ cele două grafice.
Intervalul de variaţie al indicelui este foarte larg, aproximativ între 750-10800 de puncte, ceea
ce face slab vizibilă evoluţia acestuia în perioada 2002-2004, unde indicele a crescut de la
aproximativ 750 la 4800 de puncte, (prin urmare de peste 6 ori); după cum se poate observa,
în coordonate semilogaritmice acest neajuns se elimină.
10,000 9.0
8,000 8.5
6,000 8.0
4,000 7.5
2,000 7.0
0 6.5
2002 2003 2004 2005 2006 2007 2008 2009 2002 2003 2004 2005 2006 2007 2008 2009
În plus, pentru investitorii de pe piaţa de capital prezintă interes mai degrabă cu câte procente
a crescut/scăzut indicele bursier (modificarea în cifre relative) decât cu câte puncte
(modificarea în cifre absolute); pe o scară logaritmică, pe axa OY, o dublare a valorii indicelui
se reprezintă la fel, indiferent dacă este de la 50 la 100, sau de la 1000 la 2000 (deoarece
ln(2000)-ln(1000)=ln(100)-ln(50)).
40,000
36,000
32,000
28,000
24,000
20,000
2010 2011 2012 2013 2014 2015 2016 2017 2018
In figura 5.4 este redată evoluţia anuală a ratei daunei ȋn asigurările generale, ȋn SUA,
perioada 1951-2011. Variabila prezintă o tendinţă neliniară.
.85
.80
.75
.70
.65
.60
.55
1960 1970 1980 1990 2000
Când datele fluctuează în jurul unei valori constante, variabila nu are tendinţă, şi
spunem că este staţionară relativ la medie (Figura 5.5).
Figura 5.5. Evoluţia lunară a ratei inflaţiei, în Zona Euro EU15
3.0
2.8
2.6
2.4
2.2
2.0
1.8
1.6
1.4
2000 2001 2002 2003 2004 2005 2006 2007
36,000
32,000
28,000
24,000
20,000
16,000
2000 2002 2004 2006 2008 2010 2012 2014 2016 2018
In Figura 5.7 redăm componenta ciclică separată din seria anterioară. Observam următoarele
cicluri mari din economia României: 2000-2005 (5 ani; recesiunea ȋncepe ȋn 2002 trim I),
2006-2010 (4 ani; recesiunea ȋncepe ȋn 2008 trim II), 2011-2016 (5 ani; recesiunea ȋncepe ȋn
2013 trim III).
1,500
1,000
500
-500
-1,000
-1,500
2000 2002 2004 2006 2008 2010 2012 2014 2016 2018
300,000
250,000
200,000
150,000
100,000
50,000
2004 2006 2008 2010 2012 2014 2016 2018
Printre multe alte exemple de variabile cu sezonalitate, amintim cifra de afaceri a unei
societăţi din construcţii, sau vânzările de îngheţată; acestea prezintă regularităţi, repetabile de
la un an la altul (sunt de regulă mai mari în lunile de vară respectiv mai mici în cele de iarnă).
Consumul de electricitate, vânzările de articole sportive specifice sezonului de iarnă sunt mai
mari în lunile de iarnă. Vânzările pentru majoritatea produselor alimentare sau nealimentare
(ex. jucării, îmbracăminte) sunt sistematic mai mari în preajma sărbătorilor. Magazinele de
papetărie au vânzări semnificativ mai mari odată cu începerea anului şcolar.
Spre deosebire de componenta ciclică, unde un ciclu acoperă o perioadă de câţiva ani,
în cazul componentei sezoniere un ciclu acoperă un an (ȋn cazul datelor lunare sau
trimestriale), sau o perioadă mai scurtă (spre exemplu o săptămână, dacă datele sunt zilnice).
Prezenţa acestei componente este vizibilă în graficul seriei, prin oscilaţii repetabile (graficul
are alura unei funcţii periodice). Sezonalitatea nu poate fi observată pe date cu frecvenţă
anuală.
Tehnicile de desezonalizare facilitează izolarea şi eliminarea componentei sezoniere
din serie.
Exemplu
Componentele seriei nu sunt întotdeauna vizibile în corelogramă. Tehnicile statistice discutate
în paragrafele următoare facilitează descompunerea variaţiei din date pe cele trei componente:
componenta pe termen lung tendinţa-ciclu TC, S, I. Pentru seria ce redă evoluţia numărului de
sosiri în unităţile de cazare turistică, din Figura 5.8, cele trei componente TC, S, I sunt redate
în Figura 5.9; tendinţa şi componenta ciclică sunt considerate aici ca fiind o singură
componentă, numită componenta pe termen lung.
Se observă o relativă stagnare până ȋn 2008, urmată de o tendinţă locală de scădere pe
fondul crizei economice, respectiv o tendinţa de creştere ȋncepând cu anul 2010. Componenta
sezonieră măsoară deviaţiile de la trend (tendinţă) aferente fiecărei luni; spre exemplu în luna
august numărul turiştilor este peste trend cu aproximativ 50% (indicele ce măsoară abaterea
de la trend este 1.5), iar în ianuarie numărul turiştilor este sub trend cu 40% (indicele ce
măsoară abaterea de la trend este 0.6).
300,000
200,000
250,000
200,000 160,000
150,000
120,000
100,000
50,000 80,000
2004 2006 2008 2010 2012 2014 2016 2018 2004 2006 2008 2010 2012 2014 2016 2018
160
100
140
120 95
100 90
80
85
60
40 80
2004 2006 2008 2010 2012 2014 2016 2018 2004 2006 2008 2010 2012 2014 2016 2018
Evidenţierea componentelor sistematice T, C, S este dependentă de perioada supusă
observării, respectiv de frecvenţa observaţiilor. De regulă în cronograma seriei sunt vizibile
tendinţa şi sezonalitatea. Componenta ciclică nu este vizibilă atunci când seria este dominată
de tendinţă, fiind necesară separarea acesteia utilizând metode statistice specifice (de tip
filtre).
Pentru analiza preliminară a evoluţiei unei variabile, se calculează variaţiile acesteia în timp.
Pot prezenta interes, spre exemplu, variaţiile faţă de o perioadă de referinţă sau faţă de
perioada anterioară. De asemenea, se determină variaţia medie de la perioadă la alta.
In cele ce urmează, pentru a se evita utilizarea unor expresii ca şi indice, y t se va nota uneori
cu y(t ).
yt
respectiv I Yt / j (%) .100 dacă indicele se exprimă în procente
yj
se calculează ca raport dintre nivelul variabilei în perioada t şi cel din perioada de referinţă j.
Indicele indică de câte ori, respectiv în ce proporţie se modifică Y, în perioada t faţa de j;
dacă indicele este supraunitar I 1 atunci s-a înregistrat o creştere, iar I 1 indică o scădere,
în perioada t faţa de perioada de referinţă j.
yt y j ty/ j
Diferenţa relativă (ritm): RYt / j I Yt / j 1
yj yj
yt y j
sau RYt / j (%) .100 ( I Yt / j 1) 100 când aceasta se exprimă
yj
în procente. O valoare pentru R 0 indică o creştere, în timp ce R 0 o scădere. De regulă se
interpretează diferenţa relativă în forma procentuală RYt / j (%) , şi indică cu câte procente s-a
modificat Y în perioada t faţă de perioada de comparaţie j.
Variaţiile lui Y pot fi organizate sub forma unor serii de timp derivate, numite serii cu
bază fixă respectiv cu bază în lanţ:
- serii cu bază fixă când baza de comparaţie rămâne aceeaşi ( „1”):
1 2 ... t ... T
ty/ 1 :
0 2y/ 1 ... ty/ 1 ... Ty/ 1
1 2 ... t ... T
I ty/ 1 :
1 I y2 / 1 ... I ty/ 1 ... I Ty / 1
1 2 ... t ... T
R ty/ 1 :
0 R y2 / 1 ... R ty/ 1 ... R Ty / 1
- serii cu bază în lanţ, atunci când baza de comparaţie constă în perioada
precedentă:
1 2 ... t ... T
ty/ t 1 :
2y/ 1 ... ty/ t 1 ... Ty/ T 1
1 2 ... t ... T
I ty/ t 1 :
I y2 / 1 ... I ty/ t 1 ... I Ty / T 1
1 2 ... t ... T
R ty/ t 1 :
R y2 / 1 ... R ty/ t 1 ... R Ty / T 1
Între cele două tipuri de diferenţe absolute, cu baza fixă respectiv în lanţ, există relaţii
de legătură, ce ne permit exprimarea unora în funcţie de celelalte. Astfel, însumând
diferenţele absolute cu baza în lanţ se obţin diferenţele absolute cu baza fixă:
2y/ 1 3y/1 ... ty/ t 1 ty/ 1
2y/1 2y/1 ... ty/ t 1 y(2) y(1) y(3) y(2) ... y(t ) y(t 1) ty/1
respectiv scăzând diferenţele succesive cu bază fixă obţinem diferenţele cu bază în lanţ:
ty/1 ty1/1 ty/ t 1
respectiv prin raportul a doi indici succesivi cu bază fixă se obţine un indice cu bază în lanţ:
I ty/1 : I ty1/1 I ty/ t 1
y(t ) y (t 1) y (t )
I ty/ 1 : I ty1/ 1 : I ty/ t 1
y(1) y (1) y(t 1) .
Exemplu
Fie seria de timp ce redă evoluţia anuală a numărului de locuinţe noi date în folosinţă (mii
locuinţe), în perioada 2005-2013:
2005 2006 2007 2008 2009 2010 2011 2012 2013
Y :
32.9 39.6 47.3 67.3 62.5 48.9 45.4 44.0 43.6
Sursa datelor: Institutul Naţional de Statistică
Se cere: Calculaţi şi interpretaţi: a) indicatorii absoluţi şi relativi, cu bază fixă, b) indicatorii
absoluţi şi relativi cu bază în lanţ
a) Indicatorii cu bază fixă măsoară variaţia faţă de nivelul înregistrat în anul 2005.
2008
y
/ 2005
y(2008) y(2005) 67.3- 32.9 34.4
2013
y
/ 2005
y(2013) y(2005) 43.6 - 32.9 10.7
În anul 2008 comparativ cu 2005 numărul de locuinţe date în folosinţă este mai mare
cu 34.4 mii locuinţe, în timp ce în 2013 s-au construit mai mult cu 10.7 mii locuinţe decât în
2005.
y(t )
Indicele cu bază fixă: I Yt / 2005
y(2005)
În 2008 faţa de 2005 numărul locuinţelor terminate este cu 104% mai mare, iar în
2013 cu 32% mai mare decât în 2005.
Numărul locuinţelor noi este în fiecare an mai mare decât în 2005, dar ritmul de
creştere a încetinit semnificativ începând cu anul 2009.
t / t 1
Diferenţele absolute cu bază în lanţ: y y(t ) y(t 1)
2008
y
/ 2007
y(2008) y(2007) 67.3- 47.3 20.0
2010
y
/ 2009
y(2010) y(2009) 48.9 - 62.5 13.6
În anul 2008 comparativ cu 2007 numărul de locuinţe terminate este mai mare cu 20
mii locuinţe, în timp ce în 2010 s-au construit mai puţine cu 13.6 mii locuinţe decât în 2009.
Numărul locuinţelor date în folosinţă este mai mare de 1.42 ori în 2008 comparativ cu
2007. În 2010 faţă de 2009 numărul locuinţelor a scăzut la 78% .
În 2008 faţă de 2007 numărul locuinţelor terminate este cu 42% mai mare, iar în 2010
comparativ cu 2009 numărul locuinţelor este mai mic cu 22%.
Începand cu anul 2009 numărul locuinţelor noi este mai mic decât în anul anterior.
Indicele mediu
Indicele mediu indică de câte ori ( I y ) sau proporţia în care ( I y x100), s-a modificat în
medie variabila Y de la o perioadă de timp la alta.
Pentru calculul indicelui mediu se pot utiliza metoda autoregresivă sau metoda
exponenţială. De asemenea, menţionăm că baza exponentului din tendinţa exponenţială,
studiată în paragraful 5.4, poate fi interpretată ca o estimaţie a indicelui mediu.
a) Metoda autoregresivă
Presupunem a termenii seriei se obţin din valoarea precedentă, prin adăugarea unei
valori nepredictibile t : yt a yt 1 t , t 2, 3,..., T . Indicele mediu, notat cu I y , este
coeficientul a din ecuaţia anterioară:
yt I y yt 1 t , t 2, 3,..., T .
Utilizând metoda celor mai mici pătrate pentru estimarea coficientului I y , din condiţia:
S
S ( I y ) min 0
I y
unde
T T
S ( I y ) t2 ( yt I y yt 1 ) 2
t 2 t 2
se obţine următoarea expresie de calcul a indicelui mediu:
T
yt 1 yt
t 2
Iy T
.
yt21
t 2
b) Metoda exponenţială
Presupunem că indicii cu bază în lanţ sunt aproximativ egali:
I y2 /1 I 3y / 2 ... I Ty / T 1 I y , valoarea comună acestora fiind indicele mediu. Având în
vedere că I yk / k 1 y k / y k 1 se obţin următoarele relaţii:
y 2 y1 I y
y3 y 2 I y y1 ( I y ) 2
………………………
yT yT 1 I y y1 ( I y )T 1
Din ultima relaţie rezultă următoarea relaţie de calcul a indicelui mediu:
yT
I y T 1 .
y1
Indicii cu bază în lanţ sunt aproximativ egali atunci cănd seria are o tendinţă exponenţială,
prin urmare această relaţie de calcul este adecvată dacă seria are o tendinţă exponenţială.
T
Metoda celor mai mici pătrate, respectiv condiţia t2 min, sau
t 1
T T S
S ( y ) t2 ( yt yt 1 y ) 2 min conduce, din condiţia 0 la calcul
t 2 t 2 y
diferenţei medii absolute ca o medie a diferenţelor cu bază în lanţ:
T T
yt yt 1 ty/ t 1
t 2 t 2
y
T 1 T 1
sau echivalent:
yT y1
y .
T 1
Diferenţa medie absolută este o noţiune ce implică o evoluţie, a variabilei Y, aproximativ
liniară, pe parcursul perioadei considerate. Menţionăm căci panta dreptei de tendinţă,
discutată în paragraful următor, poate fi interpretată ca şi diferenţă medie absolută.
Exemplu
Se cunoaşte populaţia judeţului Cluj la ultimele două recensăminte:
Ritmul mediu:
Exemplu
Numărulul locuinţelor noi date în folosinţă (mii locuinţe), în perioada 2000-2008 a înregistrat
o tendinţă de creştere rapidă:
Se cere: a) Cu câte mii (locuinţe) a crescut în medie anual numărul locuinţelor noi?
b) Previzionaţi numărul locuinţelor noi pentru anul 2010, utilizând diferenţa medie, dacă se
menţinere evoluţia crescătoare din perioada 2000-2008. Comparaţi cu valoarea reală
înregistrată în acest an, aceasta fiind 48.9 (mii locuinte).
Rezolvare: