Sunteți pe pagina 1din 21

Metode si Tehnici de

Prognoza
Proiect

1/31/2014
AAMM
Serban Pisica

Contents
Capitolul 1: Teorie ......................................................................................................................................... 3
Introducere ............................................................................................................................................... 3
Metode de prognoza................................................................................................................................. 4
Context .................................................................................................................................................. 4
Metoda mediilor mobile ....................................................................................................................... 5
Metoda linear smoothing ..................................................................................................................... 6
Metoda exponential smoothing ........................................................................................................... 6
Erori ........................................................................................................................................................... 8
Capitolul 2: Aplicare pe un exemplu ........................................................................................................... 11
Date ......................................................................................................................................................... 11
Metode de prognoza............................................................................................................................... 14
Metoda mediilor mobile ..................................................................................................................... 14
Linear smoothing ................................................................................................................................ 16
Exponential smoothing ....................................................................................................................... 17
Erori ......................................................................................................................................................... 19
In concluzie ................................................................................................................................................. 21

Capitolul 1: Teorie
Introducere
Capacitatea de a prezice viitorul ar fi extrem de utila. Unii ar spune ca daca am stii tot, tot
ce a fost si ce va fi, si totul ar avea un curs bine stabilit, viata nu ar mai fi interesanta. Totul ar
urma unui curs pe care il stim foarte bine si, deci, totul ar fi plictisitor. Unii chiar cauta sa
mareasca gradul de incertitudine pe care trebuie sa il infrunte, si chiar si sa mareasca miza
rezultatului incert, simtind ca asa viata lor va fi mai interesanta. De aceea exista jucatorii de
noroc sau cei cu simt de aventura etc. Newton a zis ca daca am stii pozitia si impulsul fiecarei
particule din univers la un moment dat, am stii tot ce a fost si ce va fi crezand cu fermitate intrun univers determinist, fizica dezvoltata de el demonstrand acest model. De atunci fizica a
evoluat, inclusiv in sensul dezvoltarii a intregi noi domenii total diferite de ce si-ar fi putut
imagina Newton. In prezent, fizica cuantica este avangarda stiintei, iar aceasta demonstreaza un
univers probabilistic, chiar indeterminabil. Conform fizicii cuantice, toate evenimentele au o
probabilitate atasata. Nimic nu e sigur, exista doar sansa ca ceva sa se intample intr-un fel sau in
alt fel, iar aceasta este o proprietate a insasi stofei realitatii. Unele fenomene au probabilitate 5050, fiind total imprevizibile precum descompunerea nucleara intr-o anumita unitate de timp (a se
vedea celebrul experiment mental Pisica lui Shrodinger). Alte fenomene sunt probabilistice,
dar nu chiar atat de indeterminabile. Conform mecanicii cuantice, daca o particula este prinsa
intr-un recipient energetic la un anumit nivel energetic, conform fizicii cuantice nu putem sti
exact unde e, dar putem sa calculam distributia probabilitatii pozitiei acesteia. Daca, de exemplu,
sunt 80% sanse sa se afle in centrul recipientului, acela este un exemplu de fenomen
probabilistic, dar determinabil nu stim sigur unde e, dar stim ca sansele sa se afle in centru sunt
80%. Desigur, fizica cuantica are o influenta infima la nivel macroscopic, toate legile sale
aproximand la acel nivel pe cele newtoniene. Numai rareori au fenomenele cuantice efecte
macroscopice. Traim, in concluzie intr-un univers probabilistic, dar totusi determinist. Newton
nu a avut perfecta dreptate, nu putem spune cu precizie ce se va intampla in viitor, dar a fost pe
aproape. Se pot face presupuneri care, daca sunt realizate suficient de inteligent, pot fi foarte
probabil a se realiza. Nu putem face preziceri precise despre viitor, spre bucuria celor care isi
doresc viitorul sa ramane incert, nu exista crystal ball, dar exista prognoze.
Indiferent de dezbaterile filozofice privind gradul de determinism al universului si de cele
poetice privind ce e mai frumos, un viitor incert sau cert, exista o nevoie foarte mare de prognoze
pentru scopuri practice. Multe domenii au nevoie mare, sau chiar se bazeaza pe, a stii ce urmeaza
sa se intample. Nu se stie sigur niciodata, asadar orice prognoza poarta cu sine un risc. Nu se
poate stii niciodata exact ce se intampla in viitor, insa datorita acestor nevoie practice uriase, s-a
dezvoltat o intreaga stiinta in jurul realizarii de prognoze, o stiinta care realizeaza presupuneri
despre viitor si care gestioneaza riscurile asociate acestor presupuneri. Exemple de domenii
includ ingineria, unde este foarte important ca un aparat sau o constructie sa poata opera in
conditiile cele mai probabil sa se abata asupra sa. Meteorologia este un alt exemplu, oferindu-ne
prognoza meteo, de care depinde totul de la micile pregatiri din viata personala, de exemplu daca
sa ne imbracam mai gros sau mai subtire, si pana la masurile de securitate nationale in caz de
dezastre naturale. Alte domenii includ cele economice. Un guvern are nevoie de prognoze
privind evolutia PIB-ului, productivitatii, surselor de impozite, pentru a pregati bugetul pe anul

urmator. Sistemul financiar-bancar este in totalitate construit pe riscuri si prognoze. Inclusiv, si


aici este cel mai important pentru masterul AAMM, afacerile individuale depinde de prognoze,
acestea functionand in mare parte in cicluri, si trebuie realizate pregatiri in cadrul unui ciclu
pentru cel urmator, cum este de exemplu, comanda pentru materie prima pentru urmatorul ciclu.
Definitie: Prognozarea este procesul de a face presupuneri despre evenimente ale caror
rezultate reale nu au fost inca observate. Cel mai adesea prognozarea implica estimarea unei
variabile de interes la un anumit moment in viitor. Riscul si incertitudinea sunt centrale
prognozarii (Wikipedia). Punand accentul pe aspectul economic, prognozarea este utilizarea de
date istorice pentru a determina directia tiparelor viitoare. Prognozarea este utilizata de
companii pentru a determina gestionarea bugetelor pentru urmatorul ciclu de business. Aceasta
se bazeaza in general pe cererea de bunuri si servicii in raport cu costul producerii acestora.
Investitorii utilizeaza prognozarea pentru a determina daca factorii care afecteaza firma,
precum asteptarile privind vanzarile, vor rezulta in cresterea sau scadera pretului unei actiuni
(Investopedia).

Metode de prognoza
Context

Daca prognozarea este realizarea acestor presupuneri intr-un mod foarte inteligent pentru
a avea riscuri cat mai reduse, cum anume sunt realizate?

Intuitiv, s-ar putea presupune ca este necesara familiarizarea intensa cu respectiva


variabila: cum a evoluat, ce factori o afecteaza, despre ce domeniu e vorba, ce mecanisme
actioneaza in cadrul acelui domeniu etc.

Intuitia ar fi insa gresita. Orice factor care influenteaza acea variabila este la randul sau o
variabila, a carei evolutie in viitor nu este cunoscuta. Evident, nu se poate repeta aceasta analiza
la infinit, luand in calcul factorii factorilor factorilor etc. Daca se presupune ca unii factori au o
influenta mai redusa, si se realizeaza un model matematic cu presupuneri pentru acesti factori, se
realizeaza de fapt si de drept o prognoza pe baza de prognoze, ia incertudinile si erorile asociate
fiecarei prognoze se aduna. In consecinta, o prognoza realizata pe mai multe prognoze este si
mai incerta decat o prognoza realizata numai pe o anumita variabila.
Se poate aplica sistemul descris mai sus. Depinde de la caz la caz. Dupa cum e scris mai
sus, Newton a crezut ca intreaga lume poate fi prezisa exact. Intr-advar pentru unele fenomene se
pot obtine rezultate 100% precise, precum traiectoria unei mingi in aer. Problema apare in cazul
in care complexitatea fenomenelor creste. O minge in aer este influentata in mare parte de factori
care sunt constanti sau variaza in timp dupa formule simple. Insa, pe masura ce creste gradul de

complexitate a variatiei unui fenomen sau creste numarul de variabile foarte mult, devine
imposibil sa se realizeaza astfel de calcule simple. Se poate utiliza un calculator care are o putere
mai mare de calcul, dar de la un punct nici acesta nu poate lua totul in calcul. Apare
incertitudinea. Astfel de fenomene sunt studiate in fizica de remura fizicii numita Teoria
Haosului. Haos aici nu se refera la dezordine, ci la lipsa linearitatii. Economia, din pacate, este
un fenomen foarte haotic, si si activitatea economica a unei singure firme este foarte haotica.
Asadar, exista metode strict matematice consacrate acestor probleme. Aceste metode
urmaresc sa realizeze prognoza unui punct de date (datapoint) avand la dispozitie numai punctele
de date din trecut si utilizand metode strict matematice, ignorand cu totul partea fizica a
problemei.

Mentiune:
Exista un concept care inglobeaza si abordarea matematica si si cea fizica, descrise mai sus.
Acest concept se numeste ARMAX. ARMAX este reprezentat printr-o formula
+1 = + 1 + + + 1 + + + + 1 + +

unde este o constanta, si sunt parametrii si 1 + + corespunde partii fizice, xurile fiind factori externi variabilei principale, y, si 1 + + + + 1 + + care
corespunde partii matematice, y fiind valoarea reala observata si fiind eroarea intre
prognoza si valoarea reala.

In aceasta lucrare prezentam 3 astfel de metode utilizate frecvent. Aceste metode sunt
utile numai pentru calcularea unui singur punct de date in viitor.

Metoda mediilor mobile

Toate aceste 3 metode isi propun sa acorde un mai mare impact datelor mai recente si mai
putin celor mai vechi in realizarea prognozei pentru urmatorul punct de date. Metoda mediilor
mobile se bazeaza pur si simplu pe eliminarea datelor vechi. Se alege un numar de date, 5-10100, depinde de caz, si pentru fiecare prognoza se repeta procesul (de unde partea de mobile).
+1

1
=

unde y este prognoza, y este real*, t este intervalul de timp, iar n este numarul ales (5-10-100
etc.). De fapt si de drept, aceasta este formula mediei aritmetice simple.
5

*NOTA: In aceasta lucrare, intotdeauna prognoza va fi scrisa y , iar valoarea reala y.


Metoda linear smoothing

Dupa cum am scris mai sus, toate metodele se bazeaza pe realizarea unei proportionalitati
inverse intre impactul datelor si varsta acestora. Acest lucru se intalneste si la linear smoothing,
care actioneaza ca o normalizare a datelor: fiecarei valori ii este acordata un parametru,
parametrul descrescand cu cresterea timpului, iar suma parametrilor este 1.
+1

=1

1
=
+ +
=
=1
++1
+ + 1 1

Metoda exponential smoothing

Aceasta este cea mai complexa dintre cele 3 metode si ofera cea mai precisa prognoza. In
plus ofera si optiunea realizarii de erori si de intervale de incredere.

Formula

+1 = + (1 ) , unde este un parametru subunitar (intotdeauna 0<<1), iar


y^ si y reprezinta valorile prognozate, respectiv, reale. Faptul ca este in formula pentru +1
nu este neobisnuit. Este pur si simplu o formula recursiva.
Formula aceasta este foarte simpla, desi poate pare ciudata. Aceasta formula de fapt
ascunde posibilitatea unor instrumente suplimentare pentru a oferi o prognoza mai precisa.

Alegerea

Aceasta formula nu poate oferi prognoze utile decat este aplicata si la valorile trecute.
Initial, y^ nu exista, asadar formula nu poate fi aplicata. y^ se alege. Odata ales, avem primul y^
si se poate calcula urmatorul y^. Acest y^ este aplicat pentru a-l calcula pe al treilea si tot asa.
de asemenea poate fi ales la intamplare.

Intrebarea se pune: daca si y^ initial si sunt alesi la intamplare, cum poate aceasta
metoda sa ofere cele mai precise prognoze? Raspunsul este ca se poate alege, dar pentru
prognoza cea mai precisa, acesta se determina matematic.
Dupa cum am scris mai sus, exponential smoothing nu poate fi aplicat decat daca este
aplicat si la valorile trecute. Pornind de la lista de date care trebuie procesata, se realizeaza o a
doua lista de date, aplicand formula de mai sus, alegand un prim y^ aleatoriu, pentru fiecare
punct de date.
Acest inverval realizat de exponential smoothing are niste proprietati inreresante,
dependente de valoarea lui .
In primul rand, se observa cum aceste intervale de date, daca sunt vizualizate sub forma
de grafic, apar ca doua grafice paralele. Pentru valori ale lui apropriate de 1, graficul
prognozelor se aproprie ca forma de cel real, fiind doar un pic defazat. Cu cat se aproprie de 1,
faza scade, iar intervalele tind sa se suprapuna. Daca intervalele se suprapun, formula va realiza
o prognoza pur si simplu egala cu ultimul punct de date. O astfel de prognoza nu este foarte utila.
Graficele sunt asemanatoare vizual, cea ce ar putea parea intuitiv ca fiind un lucru bun. Insa,
daca se analizeaza cu atentie graficele, se observa ca de fapt acest paralelism rezulta in cele doua
grafice neavand nicio interserctie. Asta se traduce in foarte putine prognoze care s-au adeverit.
De aici rezulta o prima proprietate interesanta a lui exponential smoothing. trebuie ales astfel
incat graficul intervalului produs sa aiba numarul maxim de intersectii cu intervalul de valori
reale.
Descrierea de mai sus este o descriere intuitiva, simplificata a problemei. De fapt si de
drept, se foloseste o metoda mai precisa de a determina calitatea intervalului generat prin
aplicarea formulei comparativ cu cel al valorilor reale. Aceasta metoda este calcularea abaterii
medii patrate. Aceasta, dupa cum ii spune si numele este media diferentelor dintre valorile
calculate si cele reale. Insa nu este o medie aritmetica ci o medie patratica: se calculeaza patratul
fiecarei diferente, iar la sfarsit se calculeaza radicalul mediei aritmetice a acestor patrate:
=

=1( )2

Media abaterilor patrate, , variaza in functie de . , practic, masoara cat de mult difera
prognozele de realitate. Daca prognoza pentru +1 este realizata cu pentru care este minim,
atunci, dupa cum ar trebui sa fie din acest punct evident, prognoza va diferi de cu cel mai
putin posibil. Cu alte cuvinte prognoza va fi cea mai exacta.

Exponential smoothing este, de fapt si de drept, un produs al stiintei statistice. Dupa cum
e scris mai sus, aceste prognoze trebuie realizate strict matematic, pornind pur si simplu de la
datele existente. Asadar, formule si principii statistice, precum regresii, corelatii, variatia fata de
medie, stau la baza acestor metode de prognoza. In statistica, de exemplu, o analiza care se
realizeaza frecvent este analiza unei cantitati mari de date cu valori foarte diferite, un nor de
date, in scopul gasirii unui tipar, unui trend, de exemplu pentru a gasi corelatia dintre doua
variabile. Asemanator, exponential smoothing, practic, analizeaza gradul de dispersie al datelor,
adica cat de haotice sunt, cat de sinusoidale, cat de mult variaza in jurul mediei aritmetice a

acestor date, si realizeaza o prognoza pentru urmatorul punct in functie de acest comportament al
datelor. Insa, daca in exemplul din statistica dat mai sus, este de interes in principal tiparul, si se
urmareste eliminarea, atenuarea, dispersiei, exponential smoothing este interesat in principal
tocmai de aceasta dispersie. Asadar, daca o variabila are deja un tipar, un trend, foarte clar,
tinde spre 1 pe masura ce tinde spre valoarea sa minima. Este usor de inteles de ce. Daca un
set de date are deja un tipar foarte clar, nu prea e necesara realizarea de prognoze. Cel mai
probabil caz este pur si simplu cel al mentinerii tiparului. De fapt, e necesara realizarea unei
prognoze: chiar daca exista un tipar de crestere/scadere, cat de mult creste/scade valoarea
variabilei? Problema este imprecizia prognozei, nu inutilitatea ei. Asadar, trebuie realizat un set
de date care sa prezinte un grad ridicat de haos pe baza setului de date dat astfel incat sa se poata
obtine prognoze precise cu exponential smoothing. O metoda des practicata este, pur si simplu,
realizarea de prognoze, nu pe datele in sine, ci pe rata variatiei diferentele dintre valorile
fiecarui punct de date acelor date.
Asadar, etapele in aplicarea exponential smoothing sunt
1)
2)
3)
4)
5)

Calcularea ratelor variatiei


Prognozarea valorilor pentru perioadele de timp in care deja exista valori
Calcularea dintre cele doua intervale, real si de prognoza
Alegerea pentru minim
Realizarea prognozei

Erori

Mai sus e descris procesul necesar pentru a aplica exponential smoothing pentru a obtine
o prognoza. Insa cu exponential smoothing putem calcula nu doar o prognoza ci si un interval de
incredere.
Intervalul de incredere este cea mai importanta parte a prognozei. Este diferenta dintre o
simpla presupunere si un rezultat stiintific. Dupa cum e scris mai sus, fie ca privim universul ca
fiind probalistic datorita fizicii cuantice sau teoriei haosului, orice prognoza este incerta, iar
realizarea oricarui plan de viitor pe baza acestora este riscanta. O componenta esentiala a
realizarii de prognoze este managementul riscului. Un mod de a gestiona riscul este prin
prognozarea nu a unei singure valori, ci prin prognozarea ca valoarea reala va fi inclusa intr-un
interval.
Exista un fenomen care se intalneste in fizica, si de fapt in toate ramurile de stiinta, fiind
un laitmotiv al naturii. Acest fenomen este cel al curbei Gauss. Exista multe tipare si fenomene
care se intalnesc in natura in locuri aparent fara nicio legatura unul cu altul. Un exemplu clasic
este cel al vartejurilor: galaxiile formeaza vartejuri, maelstromurile sunt vartejuri in apa, cochilia
de melc este un vartej, etc. Astfel de tipare se intalnesc in natura datorita universalitatii legilor
fizicii si matematicii. Chiar daca scara, situatia, materia prima etc. difera foarte mult, daca
factorii implicati sunt matematic identici, atunci si rezultatul va fi acelasi. La fel este si
distributia Gaussiana care este utila pentru modelarea a foarte multe lucruri: ciclul de viata al
unei firme, dezvoltarea si decaderea unei populatii de organisme intr-un recipient inchis,
8

distributia energetica a liniilor spectrale, etc. Probabilitatea, de asemenea, este un fenomen care
variaza Gaussian.
2

Variatia Gaussiana este o variatie exponentiala a carui exponent variaza parabolic, .


Graficul sau apare ca o curba, dupa cum apare mai jos.

Forma acestei curbe este dependenta de valoarea lui .

In cazul specific al prognozei: axa orizontala ar fi valoarea variabilei prognozate, iar axa
verticala cea a probabilitatii, sansele ca rezultatul real sa corespunda acestei prognoze.
Rezultatul produs de exponential smoothing propriu-zis este valoarea corespunzatoare
intaltimii curbei, este valoarea pe care curba se centreaza. Este cea mai probabila valoare.
Distributia nu ajunge niciodata la 0. Functia are un un varf, iar din acel punct se aproprie
de 0 in mod asimptotic, iar asimptota intotdeauna doar tinde spre o valoare, fara sa o atinga
vreodata. Integrala acestei distributii este intotdeauna 1. Curba Gaussiana este un instrument
foarte puternic pentru a intelege probabilitati, deoarece reprezinta realitatea foarte bine. Orice
este posibil, variabila poate sa ia orice valoare, motiv pentru care integrala trebuie sa dea 1.
Insa nu orice valoare are aceleasi sanse sa se adevereasca. Orice e posibil, dar numai
unele cazuri sunt probabile. Astfel, dupa cum am scris deja, probabilitatea cea mai ridicata este
rezultatul principal din exponential smoothing. Pe aceasta valoare se centreaza curba, insa dupa
cum reiese din grafic, sunt probabile si valori apropriate de rezultatul prognozei. Cu cat mai
departe de rezultatul principal din exponential smoothing, cu atat mai putin probabil ca acea

prognoza sa se adevereasca, dar orice e posibil. De aceea niciodata nu se pot realiza intervale de
100%. De aceea se numesc intervale de incredere, nu intervale sigure. Mai mult, de fapt si de
drept, natura gaussiana a probabilitatii releva o proprietate importanta pentru prognozare: inversa
proportionalitate dintre siguranta prognozei si utilitatea acesteia. Cu cat intervalul este mai larg,
cu atat mai multe cazuri sunt incluse, si deci probabilitatea ca prognoza sa se adevereasca creste.
Insa, degeaba este foarte sigura o prognoza, daca este prea generala. Probabilitatea 100% este
pentru interval la +, ceea ce nu ofera nicio informatie. Daca intervalul este exagerat de
precis, de exemplu, prin a spune ca valoarea prognozei va fi exact rezultatul de la exponential
smoothing, prognoza este foarte nesigura. De fapt, aproape nicidata nu va corespunde exact
rezultatul real cu prognoza. Un interval cu o singura valoare va avea probabilitate 0. Se
aseamana cu principiul Incertitudinii a lui Heisenberg din fizica cuantica: nu se poate stii cu
precizie pozitia unei particule si impulsul (viteza*masa) acesteia simultan. Precizia mai mare la
una rezulta in imprecizia mai mare la cealalta. Asa si in prognozare: cu cat creste precizia unei
prognoze, cu atat scad sansele ca aceasta sa se adevereasca.
In plus, latimea curbei este influentata de care la randul sau este influetat de , care la
randul sau este influentat de neregulatatea seriei de date. Cu cat seria de date este mai dispersata
cu atat curba Gauss va fi mai plata, si mai putin ascutita. Cu cat curba Gauss este mai
ascutita cu atat se pot alege intervale de incredere mai precise fara a pierde din utilitate. Cu alte
cuvinte, intervalele de incredere ideale difera de la domeniu la domeniu.

In functie de probabilitatea aleasa, un interval de incredere se calculeaz astfel:


= +1 +1 + ,
= 1

1 %
, 0,1 ,
2

,
,

De exemplu pentru un interval de incredere de 95%, adica 95% sanse sa se afle rezultatul
in intervalul ales, se aduna/scade 1,96* la rezultatul de la exponential smoothing.

10

Capitolul 2: Aplicare pe un exemplu

Date

Seria de date pe care vor fi aplicate toate metodele si principiile descrise mai sus este a
pretului actiunilor la Google pe o perioada de aproximativ o luna din 2013. Aceste date au fost
obtinute de la Google Finance. Seria de date in forma bruta este afisata mai jos:
Index
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

Data
11.11.2013 16:00:00
12.11.2013 16:00:00
13.11.2013 16:00:00
14.11.2013 16:00:00
15.11.2013 16:00:00
18.11.2013 16:00:00
19.11.2013 16:00:00
20.11.2013 16:00:00
21.11.2013 16:00:00
22.11.2013 16:00:00
25.11.2013 16:00:00
26.11.2013 16:00:00
27.11.2013 16:00:00
29.11.2013 16:00:00
02.12.2013 16:00:00
03.12.2013 16:00:00
04.12.2013 16:00:00
05.12.2013 16:00:00
06.12.2013 16:00:00
09.12.2013 16:00:00
10.12.2013 16:00:00
11.12.2013 16:00:00
12.12.2013 16:00:00
13.12.2013 16:00:00
16.12.2013 16:00:00
17.12.2013 16:00:00
18.12.2013 16:00:00
19.12.2013 16:00:00
20.12.2013 16:00:00
23.12.2013 16:00:00
24.12.2013 16:00:00

Pret
1010.59
1011.78
1032.47
1035.23
1033.56
1031.55
1025.204
1022.31
1034.07
1031.89
1045.93
1058.41
1063.11
1059.59
1054.48
1053.26
1058.18
1057.34
1069.87
1078.14
1084.66
1077.29
1069.96
1060.79
1072.98
1069.86
1084.75
1086.22
1100.62
1115.1
1111.84

11

31 26.12.2013 16:00:00
32 27.12.2013 16:00:00
33 30.12.2013 16:00:00

1117.46
1118.4
1109.46

34 31.12.2013

Avem 34 de puncte de date si trebuie sa prognozam valoarea pentru ptunctul 35, marcat
aici in rosu, pentru 31 Decembrie 2013. Indexul incepe de la 0, si nu de la 1, si de aceea par sa
fie 33 de puncte, dar de fapt sunt 34. Motivul pentru care indexul este defazat va deveni clar mai
jos.
In forma grafica aceste date arata asa:
1140
1120
1100
1080
1060
1040
1020
1000
980
960
940
1

9 11 13 15 17 19 21 23 25 27 29 31 33

Se observa ca exista un trend crescator. Acest lucru nu este deloc suprinzator, avand in
vedere ca Google este o firma de succes care continua sa se mentina un exemplu de firma
invatoare. Asadar, firma continua sa fie foarte valoroasa, iar pretul actiunilor reflecta acest lucru.
Dupa cum e scris mai sus, este mai indicat sa fie aplicate metodele si tehnicile de
prognoza pe rata variatiei unei serii de date cu trend, nu pe date in sine. Asadar, datele pe care
vom lucra propriu-zis sunt cele din coloana Rata Pret de mai jos:
Index
0
1
2
3
4
5
6
7
8
9
10

Data
11.11.2013 16:00:00
12.11.2013 16:00:00
13.11.2013 16:00:00
14.11.2013 16:00:00
15.11.2013 16:00:00
18.11.2013 16:00:00
19.11.2013 16:00:00
20.11.2013 16:00:00
21.11.2013 16:00:00
22.11.2013 16:00:00
25.11.2013 16:00:00

Pret
Rata Pret
1010.59
1011.78 0.117752996
1032.47 2.044910949
1035.23 0.267320116
1033.56 -0.161316809
1031.55
-0.19447347
1025.204 -0.615190732
1022.31 -0.282285282
1034.07 1.150336004
1031.89 -0.210817449
1045.93 1.360610143

12

11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33

26.11.2013 16:00:00
27.11.2013 16:00:00
29.11.2013 16:00:00
02.12.2013 16:00:00
03.12.2013 16:00:00
04.12.2013 16:00:00
05.12.2013 16:00:00
06.12.2013 16:00:00
09.12.2013 16:00:00
10.12.2013 16:00:00
11.12.2013 16:00:00
12.12.2013 16:00:00
13.12.2013 16:00:00
16.12.2013 16:00:00
17.12.2013 16:00:00
18.12.2013 16:00:00
19.12.2013 16:00:00
20.12.2013 16:00:00
23.12.2013 16:00:00
24.12.2013 16:00:00
26.12.2013 16:00:00
27.12.2013 16:00:00
30.12.2013 16:00:00

1058.41
1063.11
1059.59
1054.48
1053.26
1058.18
1057.34
1069.87
1078.14
1084.66
1077.29
1069.96
1060.79
1072.98
1069.86
1084.75
1086.22
1100.62
1115.1
1111.84
1117.46
1118.4
1109.46

1.193196485
0.44406232
-0.331104025
-0.482262007
-0.115696836
0.467121129
-0.07938158
1.185049275
0.772991111
0.604745209
-0.679475596
-0.680411031
-0.857041385
1.149143563
-0.290778952
1.391770886
0.135515096
1.325698293
1.315622104
-0.292350462
0.505468413
0.084119342
-0.799356223

34 31.12.2013

A se observa cum primul punct de date de la rata este indexat incepand de la 1.


Prognozele vor fi realizate pentru rata pentru punctul 34. A se observa cum rata variatiei pretului
este mult mai aleatorie decat pretul in sine:
2.5
2
1.5
1
0.5
0
-0.5

11 13 15 17 19 21 23 25 27 29 31 33

-1
-1.5

13

Metode de prognoza

Metoda mediilor mobile

In aceasta lucrare am ales 6 puncte de date. Astfel prognoza pentru punctul 34 este media
ultimelor 6 date.
1.325698293
1.315622104
-0.292350462
0.505468413
0.084119342
-0.799356223
0.356533578

Deci prognoza este pur si simplu o crestere cu ~0,356%.


Prognoza a fost realizata, dar acest exercitiu nu ofera foarte multe informatii despre
acuratetea acestei metode. Asadar, pentru a face subiectul mai interesant, se afiseaza mai jos
aplicarea acestei metode pe datele din trecut (incepand cu punctul 7) si se compara prin grafic cu
rezultatele reale.
Medii
mobile(6):
7
8
9
10
11
12
13
14
15
16
17
18
19
20

20.11.2013 16:00:00
21.11.2013 16:00:00
22.11.2013 16:00:00
25.11.2013 16:00:00
26.11.2013 16:00:00
27.11.2013 16:00:00
29.11.2013 16:00:00
02.12.2013 16:00:00
03.12.2013 16:00:00
04.12.2013 16:00:00
05.12.2013 16:00:00
06.12.2013 16:00:00
09.12.2013 16:00:00
10.12.2013 16:00:00

1022.31
1034.07
1031.89
1045.93
1058.41
1063.11
1059.59
1054.48
1053.26
1058.18
1057.34
1069.87
1078.14
1084.66

-0.282285282
1.150336004
-0.210817449
1.360610143
1.193196485
0.44406232
-0.331104025
-0.482262007
-0.115696836
0.467121129
-0.07938158
1.185049275
0.772991111
0.604745209

14

0.243167175
0.176494129
0.027398304
-0.05229129
0.201363202
0.432641528
0.609183703
0.601047246
0.328947578
0.344801013
0.195886178
-0.016210167
0.107287659
0.291303515

21
22
23
24
25
26
27
28
29
30
31
32
33

11.12.2013 16:00:00
12.12.2013 16:00:00
13.12.2013 16:00:00
16.12.2013 16:00:00
17.12.2013 16:00:00
18.12.2013 16:00:00
19.12.2013 16:00:00
20.12.2013 16:00:00
23.12.2013 16:00:00
24.12.2013 16:00:00
26.12.2013 16:00:00
27.12.2013 16:00:00
30.12.2013 16:00:00

1077.29
1069.96
1060.79
1072.98
1069.86
1084.75
1086.22
1100.62
1115.1
1111.84
1117.46
1118.4
1109.46

-0.679475596
-0.680411031
-0.857041385
1.149143563
-0.290778952
1.391770886
0.135515096
1.325698293
1.315622104
-0.292350462
0.505468413
0.084119342
-0.799356223

34 31.12.2013

0.472471385
0.378508258
0.187252898
0.05764293
0.051658645
-0.125636365
0.005534581
0.141366363
0.475717917
0.837828498
0.597579494
0.730287388
0.512345464
0.356533578

1.5

0.5

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
-0.5

-1

Linia rosie este prognoza pe baza mediilor mobile. A se observa cum cele doua grafice se
intersecteaza relativ frecvent, semn al unei prognoze relativ acceptabile.

15

Linear smoothing

Pe baza formulei de mai sus, suma produselor dintre index si valoarea ratei si impartind
la suma indexilor, prognoza pentru 34 este o crestere cu ~0.264%.
Din nou, pentru a intelege eficienta acestei metode de prognoza realizam prognoze
pentru toate punctele de la 1 la 33 si reprezentam graphic.
index
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32

Data
11.11.2013 16:00:00
12.11.2013 16:00:00
13.11.2013 16:00:00
14.11.2013 16:00:00
15.11.2013 16:00:00
18.11.2013 16:00:00
19.11.2013 16:00:00
20.11.2013 16:00:00
21.11.2013 16:00:00
22.11.2013 16:00:00
25.11.2013 16:00:00
26.11.2013 16:00:00
27.11.2013 16:00:00
29.11.2013 16:00:00
02.12.2013 16:00:00
03.12.2013 16:00:00
04.12.2013 16:00:00
05.12.2013 16:00:00
06.12.2013 16:00:00
09.12.2013 16:00:00
10.12.2013 16:00:00
11.12.2013 16:00:00
12.12.2013 16:00:00
13.12.2013 16:00:00
16.12.2013 16:00:00
17.12.2013 16:00:00
18.12.2013 16:00:00
19.12.2013 16:00:00
20.12.2013 16:00:00
23.12.2013 16:00:00
24.12.2013 16:00:00
26.12.2013 16:00:00
27.12.2013 16:00:00

Linear
Pret
Rata Pret
smoothing
1010.59
1011.78 0.117752996
1032.47 2.044910949
0.117752996
1035.23 0.267320116
1.402524965
1033.56 -0.161316809
0.83492254
1031.55
-0.19447347
0.436426801
1025.204 -0.615190732
0.22612671
1022.31 -0.282285282
-0.014249702
1034.07 1.150336004
-0.081258597
1031.89 -0.210817449
0.192429092
1045.93 1.360610143
0.111779784
1058.41 1.193196485
0.338839849
1063.11
0.44406232
0.481232622
1059.59 -0.331104025
0.475514114
1054.48 -0.482262007
0.360282951
1053.26 -0.115696836
0.247943623
1058.18 0.467121129
0.202488566
1057.34
-0.07938158
0.233621809
1069.87 1.185049275
0.198843654
1078.14 0.772991111
0.302654772
1084.66 0.604745209
0.349688406
1077.29 -0.679475596
0.37397953
1069.96 -0.680411031
0.278210882
1060.79 -0.857041385
0.194852455
1072.98 1.149143563
0.107194635
1069.86 -0.290778952
0.190550549
1084.75 1.391770886
0.153525203
1086.22 0.135515096
0.245247106
1100.62 1.325698293
0.237409105
1115.1 1.315622104
0.312463532
1111.84 -0.292350462
0.37934077
1117.46 0.505468413
0.336005852
1118.4 0.084119342
0.346597262

16

33 30.12.2013 16:00:00

1109.46

-0.799356223

34 31.12.2013

0.330689509
0.264216231

2.5
2
1.5
1
0.5
0
1 2 3 4 5 6 7 8 9 101112131415161718192021222324252627282930313233
-0.5
-1
-1.5

Exponential smoothing

Pentru exponential smoothing, s-a preocedat in felul urmator:


1)
2)
3)
4)
5)
6)
7)

S-a ales aleatoriu


S-a ales un punct initial aleatoriu (mai precis 0)
S-a aplicat formula
S-au calculat separat abaterile patrate
S-a calculat abaterea patrata medie,
S-a modificat si s-a urmarit schimbarea
Pentru suficient de mic, s-a ales

Aplicand aceste metode, in final = 0.0346, iar prognoza pentru 34 este o creste cu ~0.19%.

17

Aceste calcule sunt afisate mai jos:


0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33

11.11.2013 16:00:00
12.11.2013 16:00:00
13.11.2013 16:00:00
14.11.2013 16:00:00
15.11.2013 16:00:00
18.11.2013 16:00:00
19.11.2013 16:00:00
20.11.2013 16:00:00
21.11.2013 16:00:00
22.11.2013 16:00:00
25.11.2013 16:00:00
26.11.2013 16:00:00
27.11.2013 16:00:00
29.11.2013 16:00:00
02.12.2013 16:00:00
03.12.2013 16:00:00
04.12.2013 16:00:00
05.12.2013 16:00:00
06.12.2013 16:00:00
09.12.2013 16:00:00
10.12.2013 16:00:00
11.12.2013 16:00:00
12.12.2013 16:00:00
13.12.2013 16:00:00
16.12.2013 16:00:00
17.12.2013 16:00:00
18.12.2013 16:00:00
19.12.2013 16:00:00
20.12.2013 16:00:00
23.12.2013 16:00:00
24.12.2013 16:00:00
26.12.2013 16:00:00
27.12.2013 16:00:00
30.12.2013 16:00:00

1010.59
1011.78
1032.47
1035.23
1033.56
1031.55
1025.204
1022.31
1034.07
1031.89
1045.93
1058.41
1063.11
1059.59
1054.48
1053.26
1058.18
1057.34
1069.87
1078.14
1084.66
1077.29
1069.96
1060.79
1072.98
1069.86
1084.75
1086.22
1100.62
1115.1
1111.84
1117.46
1118.4
1109.46

0.117752996
2.044910949
0.267320116
-0.161316809
-0.19447347
-0.615190732
-0.282285282
1.150336004
-0.210817449
1.360610143
1.193196485
0.44406232
-0.331104025
-0.482262007
-0.115696836
0.467121129
-0.07938158
1.185049275
0.772991111
0.604745209
-0.679475596
-0.680411031
-0.857041385
1.149143563
-0.290778952
1.391770886
0.135515096
1.325698293
1.315622104
-0.292350462
0.505468413
0.084119342
-0.799356223

34 31.12.2013

18

0
0.004074254
0.074687203
0.081352302
0.072955951
0.063702893
0.040213173
0.029054727
0.067851059
0.058209129
0.103272204
0.140983584
0.151470108
0.134773043
0.11342363
0.105496062
0.11800829
0.1111786
0.148334525
0.169947643
0.184991639
0.155081073
0.126173046
0.092153827
0.128725672
0.114210812
0.15841439
0.157622075
0.198037512
0.236705939
0.218400587
0.228333134
0.223343337

Abaterea
0.0346 patratica
0.013865768
4.165014417
0.037107439
0.058888297
0.071518495
0.460896554
0.104005254
1.257271702
0.077656138
1.696248401
1.18793494
0.09185672
0.232877794
0.380732253
0.052496188
0.130772689
0.03896276
1.153198226
0.39019585
0.189048923
0.747303601
0.698047056
0.966710617
1.117227302
0.175984129
1.632159744
0.000524378
1.364402053
1.248995321
0.279900675
0.082407936
0.020797618
1.04591439

Abaterea
patratica medie
0.187957932 ()

0.800963882

In continuare, apare afisarea grafica a acestei prognoze:

2.5
2
1.5
1
0.5
0
1 2 3 4 5 6 7 8 9 10111213141516171819202122232425262728293031323334
-0.5
-1
-1.5

Erori
Plecand de la rezultatele de mai sus de la exponential smoothing, urmeaza calcularea
intervalelor de incredere.
S-a decis alegerea a trei probabilitati si compararea intre ele pentru a alege cea mai buna
prognoza: 50%, 66% si 95%. Pentru fiecare probabilitate s-a calculat un capat inferior si un capat
superior, utilizand valoarea lui de mai sus si formula NORMINV.
Iata rezultatele:
50%
Capatul
Capatul
Inferior
Superior
-0.465554725
0.614929132
-0.458889627
0.621594231
-0.467285978
0.61319788
-0.476539036
0.603944822
-0.500028755
0.580455102

Intervale de incredere
66%
95%
Capatul
Capatul
Capatul
Capatul
Inferior
Superior
Inferior
Superior
-0.689564702
0.838939109
-1.495173158
1.644547565
-0.682899603
0.845604207
-1.488508059
1.651212664
-0.691295954
0.837207856
-1.496904411
1.642816312
-0.700549012
0.827954798
-1.506157469
1.633563254
-0.724038732
0.804465079
-1.529647188
1.610073535

19

-0.511187202
-0.47239087
-0.4820328
-0.436969725
-0.399258345
-0.38877182
-0.405468886
-0.426818298
-0.434745866
-0.422233639
-0.429063329
-0.391907403
-0.370294285
-0.35525029
-0.385160856
-0.414068883
-0.448088102
-0.411516257
-0.426031117
-0.381827539
-0.382619854
-0.342204417
-0.30353599
-0.321841342
-0.311908795
-0.316898592

0.569296656
0.608092988
0.598451057
0.643514132
0.681225513
0.691712037
0.675014972
0.653665559
0.645737991
0.658250218
0.651420529
0.688576454
0.710189572
0.725233568
0.695323001
0.666414975
0.632395755
0.6689676
0.65445274
0.698656319
0.697864003
0.73827944
0.776947867
0.758642516
0.768575063
0.763585265

-0.735197178
-0.696400846
-0.706042777
-0.660979701
-0.623268321
-0.612781797
-0.629478862
-0.650828275
-0.658755843
-0.646243616
-0.653073305
-0.61591738
-0.594304262
-0.579260266
-0.609170832
-0.638078859
-0.672098079
-0.635526234
-0.650041094
-0.605837515
-0.606629831
-0.566214394
-0.527545967
-0.545851318
-0.535918771
-0.540908569

0.793306632
0.832102964
0.822461034
0.867524109
0.905235489
0.915722013
0.899024948
0.877675536
0.869747967
0.882260195
0.875430505
0.912586431
0.934199548
0.949243544
0.919332978
0.890424951
0.856405732
0.892977577
0.878462717
0.922666295
0.92187398
0.962289417
1.000957844
0.982652492
0.992585039
0.987595242

-1.540805635
-1.502009303
-1.511651233
-1.466588158
-1.428876778
-1.418390253
-1.435087318
-1.456436731
-1.464364299
-1.451852072
-1.458681761
-1.421525836
-1.399912718
-1.384868722
-1.414779289
-1.443687316
-1.477706535
-1.44113469
-1.45564955
-1.411445971
-1.412238287
-1.37182285
-1.333154423
-1.351459774
-1.341527228
-1.346517025

1.598915088
1.637711421
1.62806949
1.673132565
1.710843945
1.72133047
1.704633405
1.683283992
1.675356424
1.687868651
1.681038962
1.718194887
1.739808005
1.754852001
1.724941434
1.696033408
1.662014188
1.698586033
1.684071173
1.728274752
1.727482436
1.767897873
1.8065663
1.788260949
1.798193495
1.793203698

-0.352283997

0.728199861

-0.576293973

0.952209837

-1.38190243

1.757818293

Trebuie ales un echilibru intre o latime a intervalului care sa nu fie prea mare, si deci
inutila, dar nici probabilitatea ca valoarea reala sa se afle in interval sa fie prea mica. De
exemplu, daca s-ar putea utiliza intervalul corespunzator probabilitatii de 95% ar fi cazul ideal,
am avea o prognoza foarte precisa si foarte utila. Intervalul 50%, prin definitie, nu e corect decat
jumatate din cazuri, ceea ce nu este tocmai o prognoza cu adevarat, mai mult un joc de noroc.
Afisarea grafica a acestor rezultat ajuta foarte mult in a determina care interval este cel
mai util.

20

2
1.5
1
0.5
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
-0.5
-1
-1.5
-2

Se observa cum graficele tuturor capetelor de interval au aceiasi forma ca graficul


prognozei. Cel rosu din mojloc este prognoza si este flacata sus si jos de 3 capete de interval
corepsunzatoare fiecarei probabilitati. Cu cat mai mare probabilitatea cu atat mai larga diferenta
dintre capete, asemeni unui navod care prinde mai multi pesti. Se constata ca gradul de dispersie
al acestor date este enorm. Este atat de mare incat intervalul corespunzator probabilitatii de 95%
depaseste toate valorile reale. Este absolut inutil pentru prognoze. Ramane de ales intre 50% si
66%. Asa cum e de asteptat, navodul de 50% prinde cam jumatate din toate varfurile si
fracturile graficului albastru, care reprezinta puncte de date reale. Este prea imprecis. Cel de 66%
este un pic mai acceptabil. Este mai larg decat cel de 50% si prinde mai multe varfuri si
fracturi. Este tot imprecis, dar dintre toate 3 este cel mai acceptabil. Acesta va fi ales.

In concluzie: prognoza pentru variatia pretului actiunii la Google pentru 31


Decembrie 2013 este ~+0.19%, cu 66% probabilitate sa fie intre o scadere de nu mai mult de
aproximativ -0.58% si o crestere de 0.95%.
Convertind in pret propriu zis asta inseamna:
Pret (EXP)
cap inf
Prognoza
Cap sup
1103.066
1111.545318 1120.024387,

adica sunt 66% sanse ca pretul sa fie intre 1103.066 si 1120.024 dolari. Aceasta este
prognoza.

21