Sunteți pe pagina 1din 15

Universitatea Babeș-Bolyai din Cluj Napoca

Facultatea de Științe Economice și Gestiunea Afacerilor

Proiect la disciplina

BUSINESS INTELLIGENCE

Analiza restaurantelor și hotelurilor din județul


Harghita

Profesor coordonator:
Conf. Dr. Liana Stanca Studenti: CIOBOTĂ OVIDIU CONSTANTIN
MIRON ALINA LIANA
GÂSCAN MARIUS ȘTEFAN
Specializare: Informatica Economica
Forma de învățământ: ID
Anul 3, Sem. 2

CLUJ NAPOCA

2023
1. Descriere Problemă de Business

Conform definiției, domeniul larg, Business intelligence presupune informații disponibile


pentru întreprindere, necesare în construirea deciziilor. Astfel, obiectivul prezentului proiect este
de a forma opinii predictive și de a îmbunătăți procesul decizional cu privire la activitatea unor
firme. Firmele pentru care facem studiul au sediul în județul Harghita în cele mai mari localități:
Miercurea-Ciuc, Odorheiul Secuiesc, Cristurul Secuiesc, Izvorul Mureșului, Gheorgheni și
Toplița. Fiind un județ de dimensiuni reduse, nu înregistrează succese mari pe partea de business,
însă predomină activitățile legate de Restaurante și Hoteluri, 5610, 5510, conform CAEN
(Clasificarea Activităților din Economia Națională ). Pe baza acestor date, formulăm obiective în
sensul furnizării de răspunsuri pentru problemele de business. Propunem următoarele întrebări:

 Pentru care domeniu de activitate veniturile au fost mai mari în perioada 2012-2015?
 În care oraș s-au înregistrat cele mai mari profituri ?
 În care oraș și în care domeniu s-au înregistrat cele mai multe pierderi?
 Cum au evoluat profiturile nete în cei 4 ani?
 Care este media profiturilor în fiecare oraș?
 Care firmă a înregistrat cel mai mare profit?
 Există legătură între totalul capitalurilor și profit? Dar între numărul mediu de salariați și
cheltuieli?
 Care sunt firmele de top?
 Care sunt exemplele negative de firme?
 Per total, care domeniu a fost de succes?
 Pe total, care oraș a avut cele mai bune rezultate?
Cu ajutorul instrumentelor oferite de Tableau, ne propunem să găsim răspunsuri la aceste întrebări,
realizând diferite analize și extrăgând concluzii. La final, vom descoperi, care domeniu a avut un
succes mai mare, pe baza mai multor indicatori și care oraș a avut rezultate mai bune, tot pe baza
a diferite criterii. Astfel, în urma furnizării de răspunsuri la aceste întrebări, se pot descoperi
anumite direcții: fuziunea cu firmele de succes din localitățile învecinate sau focusarea pe alt
domeniu de activitate în cazul celor ce înregistrează pierderi, extinderea activității pentru cele ce
înregistrează profit sau alte strategii precum restructurarea proceselor de afaceri, regândirea
posturilor, analiza tuturor proceselor, monitorizarea problemelor importantele. Așadar, Business
Intelligence facilitează o comunicare mai eficientă a descoperirilor.

2. Pregătirea datelor

Având în vedere faptul că o soluție de Business Intelligence integrează datele afacerii din
mai multe surse și le consolidează într-o singură bază de date optimizată pentru regăsirea și analiza
informației, am selectat situațiile financiare pe 4 ani consecutivi(2012-2015), din cadrul Instituției
Ministerului Finanțelor, unde sunt prezente informații despre o serie largă de firme, unde avem
mai multe date de identificare. Județul pentru care facem analiza este Harghita.

https://data.gov.ro/dataset/informatii_fiscale_mai_2020 https://data.gov.ro/dataset/informatii_fiscale_mai_2020
2.1. Conectarea la setul de date
Conectarea s-a realizat accesând Add Connection, unde am introdus fișierele :Harghita.csv,
webblbsslan2012.txt webblbsslan2013.txt webblbsslan2014.txt webblbsslan2015.txt

2.2. Descriere tipuri de date și modificări făcute

Harghita.csv

Coloane: Cod_fiscal, Nume, Localitate, Stradă, Număr, Data înregistrării ultimei declarații, Data
ultimei prelucrări, Sector, Telefon, Număr înmatriculare Registrul Comerțului, Act autorizare,
TVA, Cod poștal și diferite Impozite.
Dintre aceste date ne interesează doar Cod_fiscal, pe care îl redenumim CUI, Nume pe care îl
schimbăm în Denumire și Localitate.
Schimbăm tipul de date pentru CUI din număr întreg în String, pentru a putea vizualiza codul în
mod corect, iar pentru Denumire și Localitate lăsăm String
Situații Financiare

Coloane:CUI, CAEN, Active imobilizate, Active Circulante, Stocuri, Creanțe, Casa și conturi la
bănci, Cheltuieli în avans, Datorii, Provizioane, Capitaluri total, Capital subscris vărsat,
Patrimoniul regirei, Patrimoniul public, Cifra de afaceri netă, Venituri totale, Cheltuieli totale,
Profit brut, Pierdere brută, Profit net, Pierdere netă, Număr mediu de salariați

Schimbăm tipul de date pentru CUI și CAEN în String pentru o vizualizare corectă, iar restul le
lăsăm număr întreg.

În Tableau Desktop avem două categorii de variabile: categorice și numerice. Acestea nu au fost
selectate corespunzător de program întrucât s-au strecurat variabile categorice printre cele
numerice. Așadar mutăm CUI, CAEN, YEAR, Localitate și Denumire la Measures, deoarece ele
sunt variabile categorice ajutându-ne să facem o categorizare fără a indica o anumita ordine ori
cantitate.

La variabilele numerice intră restul, având valori numerice, pe anumite intervale, având un caracter
cantitativ.
2.3. Curățare
Dat fiind că setul de date este mare, valorile acestora nu sunt unitare, nu sunt uniform
așezate, ceea ce duce la zgomote. Astfel, este nevoie de procesul de curățare a datelor. În primul
rând , header-ul, capul de tabel, este lipsit de o valoare pentru toate coloanele, în cazul seturilor de
date. Astfel, le completăm cu denumirea potrivită.

Harghita.csv
Dat fiindcă în acest județ nu toate tipurile de activități au o pondere mare și nu aduc
rezultate vizibil benefice pentru comunități, am selectat o arie de interes, ce predomină în acest
județ, mai exact activitatea hotelieră și restaurante. Astfel, am făcut o filtrare după codul CAEN,
alegând doar aceste două activități: 5510, reprezentând hotelurile și alte facilități de cazare
similare, respectiv 5610, reprezentând restaurantele. Tot dimensiunea redusă a județului certifică
faptul că nu în toate orașele se poate studia efectul celor două tipuri de activități. În acest sens, am
selectat cele mai mari și cele mai dezvoltate localități (Miercurea-Ciuc, Izvorul Mureș, Cristurul
Secuiesc, Toplița, Gheorgheni, Odorheiul Secuiesc). Nu avem nevoie de toate coloanele prezente,
întrucât ne interesează strict datele de identificare a firmelor, dintre care reținem: CUI(cod unic de
identificare), Denumire și Localitate. După cum am mai menționat, vom menține doar orașele
mari, astfel încât vom crea un filtru care să caute doar anumite localități. Apoi, deoarece acestea
apar scrise sub forme diferite, dar reprezintă același lucru cu ajutorul comenzii Group and Replace,
grupăm înregistrările sub forma unui singur nume.
Situații financiare.csv

Redenumim antetele, după mai realizăm câteva curățări de date. Observăm că sunt numite
coloane unde toate înregistrările sunt null, așa că le ștergem. Apoi, păstrăm doar coloanele care
ne interesează. De asemenea, dorim să restrângem analiza, așa că alegem doar două domenii de
activitate, cum am menționat anterior, 5510 Hoteluri și 5610 Restaurante. Acest lucru l-am
realizat cu ajutorul uni filtru.

2.4. Descriere Union și Join pentru seturile de date utilizate

Union
Union este o metodă pentru a combina date prin adăugarea rândurilor unui tabel la celălalt tabel și
necesită același număr de câmpuri în ambele tabele, aceleași nume ale câmpurilor și același tip de
dată. Așadar, putem realizăm un Union, deoarece toate cele 4 fișiere au aceeași structură a
câmpurilor și înregistrărilor. Astfel, avem o reuniune a lor și observăm că nu avem nici un câmp
care să nu se potrivească(0 mismatched fields). Cu ajutorul union adăugăm datele dintr-un an la
celălalt an, rezultând un singur fișier cu date despre toți cei 4 ani.
Join
Datele pe care le analizăm sunt alcătuite din colecții de tabele care au legătură între ele pe baza
anumitor câmpuri. Join este o metodă pentru a combina aceste date de legătură la câmpurile
specifice. Rezultatul este un tabel extins pe orizontală prin adăugarea altor câmpuri. Astfel, aici
Câmpul de legătură este CUI, prezent în ambele tabele. Pe baza acestuia, aducem înregistrările
curățate rezultate din uniunea celor 4 situații financiare și facem join cu înregistrările curățate din
dreptul Județului. Rezultatul este obținerea situațiilor financiare pe 4 ani pentru firmele Din
județul Harghita, orașele Miercurea-Ciuc, Izvorul Mureș, Cristurul Secuiesc, Toplița,
Gheorgheni, Odorheiul Secuiesc, ce își desfășoară activitatea în domeniul hotelier și cel al
restaurantelor.
3. Data Visualization & Analysis

a) Camp calculat, Filtre, Marcatori personalizati

Câmp calculat

Am creat două câmpuri noi active totale pentru că nu ne interesează separate activele imobilizate sau
circulante. Astfel, formula a fost Active Totale= Active Imobilizate+ Active Circulante
Capital subscris nevărsat rezultat în urma deducerii capitalului subscris vărsat din totalul de capitaluri.

Filtre
Am creat filtre precum: selectarea unei localități sau a mai multor localități dintr-o listă(checkbox),
alegerea unui an/CAEN dintr-o listă derulantă
Marcatori personalizați
Am combinat diferite culori, detalii și etichete în toate graficele utilizate.
Cel putin 3 tipuri de grafice din meniul ShowMe :
1. Bar chart, Pie Chart, Column Chart Scatter Plot, Area Chart, Line Chart

2. Crearea diagramelor cu datecategorice si numerice


Toate s-au realizat prin îmbinarea valorilor categorie și numerice. La Columns am folosit cele
categorice, iar la rows cele numerice.
Exemplu:
d) Analza trendului
Se descoperă tendința achitării datoriilor de-a lungul celor 4 ani și evoluții diferite ale profitului
pentru fiecare localitate în parte.
4. Creare Dashbord cu date legate
Am unit foile care conțineau date asemănătoare, adică aveau același subiect al analizei.
Prin unirea informațiilor necesare am conceput diferite subiecte de analiză.

Concluzii
Sumarizând, atât cu ajutorul Tableau Prep, prin curățare, filtrare, grupare, union, join, cât și cu
ajutorul Tableau Desktop prin crearea graficelor, diagramelor, dashbordurilor, am reușit să
analizăm activitatea restaurantelor și hotelurilor din județul Harghita, prin ilustrarea anumitor
probleme de afaceri la care am dat și răspunsuri. Mai exact, că domeniul Hoteluri este mai
profitabil decât cel Restaurante pentru județul Harghita, iar zona de centru a județului este
recomandată pentru astfel de investiții.

S-ar putea să vă placă și