Sunteți pe pagina 1din 18

Proiect Business Intelligence

Victor Răzvan-Constantin
Informatică economică
Grupa I

Contents
1. Descriere Problema de Business pentru care s-a realizat proiectul ......................................................... 1
2. Pregatirea datelor ..................................................................................................................................... 1
3. Data Visualization & Analysis .................................................................................................................... 9
4. Creare Dashboard cu date legate ........................................................................................................... 17
5. Crearea unei povești (Story) ................................................................................................................... 18

1. Descriere Problema de Business pentru care s-a realizat proiectul

Dorim agregarea situaţiilor financiare din Constanţa atât la nivel de judeţ, cât şi
referitor la localităţile individuale, cu scopul vizualizării:

• Evoluţiei activelor şi a capitalurilor din judeţ


• Situaţiei activelor circulante şi imobilizare la nivel de localitate
• Informaţiilor privitoare la profitul net
• Cifrei de afaceri a fiecărei localităţi
• Tuturor parametrilor financiari ai municipiului de reşedinţă

2. Pregatirea datelor

Dataset-uri utilizate:
Firme înregistrate la Registrul Comerțului
Situaţii financiare (2015-2018)
Date de identificare plătitori (Constanţa)

Coloanele din situaţiile financiare sunt explicate în csv-ul ce acompaniază fişierul


text ce conţine informaţiile propriu zise. Cu un cleaning step acestea pot fi înlocuite.
Exemplu de coloane neclare şi explicaţiile din csv:

Exemplu redenumire şi rezultat final:

Pentru fiecare an am lucrat cu fişierele webblbsslan<an> şi webuuan<an>, tip csv


şi txt. Văzând că uneori termenii i1,i2..in nu corespund mereu aceleiaşi explicaţii,
am realizat un cleaning step pentru fiecare şi un union pentru fiecare an, ulterior
reunite în situaţia totala a anilor 2015-2018.

La realizarea union rezulta o coloană Table names în care apărea numele fişierului
din care provine informaţia respectivă. Prin operaţii de curăţare am reuşit să captez
anul corespunzător fiecărei situaţii:
Exemplu: webuuan2015.txt -> webuuan2015txt -> 2015

Exemplu pentru union-ul final al situaţiilor financiare:

Ulterior am extras numele şi denumirea firmelor din dataset-ul celor inregistrate la


registrul comerţului
Union pentru toate firmele şi rezultatul acestuia:
Următorul pas a presupus extragerea firmelor cu CUI comun în dataset-ul referitor
la firmele din Constanţa. Pentru asta a fost nevoie de acelaşi procedeu de încărcare
şi redenumire a coloanelor conform explicaţiilor din csv-ul găsit pe site-ul data.gov.
Am efectuat join între union-ul ce conţinea toate firmele şi informaţiile proaspăt
extrase despre firmele din Constanţa, obţinând următorul rezultat:
Finalmente, am realizat join între situaţiile financiare din anii 2015-2018 şi firmele
din Constanţa pentru a reuni informaţiile (CUI – Localitate – Adresa – etc) + (CUI
– Situaţie financiară).

Exemplu clean final:

Am realizat apoi un output step pentru a extrage informaţiile în format .tde.


3. Data Visualization & Analysis
3.1. Vizualizarea profitului net în funcţie de codul CAEN

Pentru asta am folosit tabelele Profit net şi Caen cu reprezentare prin packed
bubbles.

Profit mai mare => bulă de dimensiune mai mare.

Codul CAEN controlează nuanţa culorii şi, desigur, label-ul corespunzător fiecărei
bule.
3.2. Vizualizarea profitului net din judeţ pe an

Am formatat felul în care este afişat anul (la conversia spre tipul date se adăuga luna
1 şi ziua 1 a anului respectiv) astfel:

Apoi, folosind variabilele An şi Profit net, am realizat un bar chart:


3.3. Vizualizarea informaţiilor vis-a-vis de activele localităţilor

Următoarele calcule au asigurat afişarea activelor circulante, activelor immobilizate


respectiv totalul acestora:

Folosind acestea pe post de coloane iar localităţile pe post de linii, am afişat în


format tabelar, astfel:
3.4. Afişarea cifrei nete de afaceri a fiecărei localităţi pe hartă

Nu am reuşit să preiau automat coordonatele fiecărei localităţi, aşa că am apelat la


servicii online precum google maps/latlong.net.

Am folosit următoarele pentru a genera harta:

(Mărimea punctelor să depindă de cifra de afaceri)


Deoarece discrepanţa dintre rezultatele obţinute în municipiul de reşedinţă şi restul
localităţilor era prea mare, am hotărât să efectuez o transformare.

Mărimea cerculeţelor creşte proporţional cu valoarea de sub radical a cifrei de


afaceri. Rezultatul este următorul:
3.5. Afişarea situaţiei financiare a municipiului Constanţa

Folosind An, Localitate + câmpurile cu caracter financiar (Stocuri, Creanţe,


Provizioane, etc.), am alcătuit un tabel cu gantt bars pentru a vizualiza informaţiile
de la an la an.
3.6. Determinarea unor evoluţii

Pentru a obţine trend line-ul corespunzător activelor imobilizate, activelor


circulante şi a capitalurilor, am folosit variabilele corespunzătoare împreună cu anii
+ modelul exponenţial, exponenţial respectiv polinomial.
Rezultate:
4. Creare Dashboard cu date legate
5. Crearea unei povești (Story)

S-ar putea să vă placă și