Sunteți pe pagina 1din 19

Modul 3

Instrumente de Business
Intelligence si Business Analytics
Cuprins

Business • Infrastructura BI. Data Warehouse si Data Mart


Intelligence

Business • Instrumente de Business Analytics. OnLine Analytical


Analytics Processing (OLAP). Data Mining
Business Intelligence (BI) si Business Analytics (BA) in
organizatie
BI – termen folosit pentru a descrie procesul de colectare, integrare si raportare a datelor de diferite tipuri,
structurate sau non-structurate, prezente in cantitati extrem de mari si care provin din surse variate .

BA – termen utilizat pentru a desemna instrumente si tehnici de analiza a datelor stocate in depozite de
date (Data Warehouse), in scopul optimizarii proceselor si practicilor de business.
Mediul de
business
Depozitare
Big Data BA
Instrumente si
tehnici pentru
Seturi de date nestructurate
/ semistructurate, de volume analiza BI
enorme, provenite din trafic datelor.
Web, continut Social Media, (Big Data)
e-mail, sisteme de
eCommerce, care nu pot fi
procesate si analizate cu Integrare Raportare
baze de date conventionale
pentru management
(DBMS).
Infrastructura Business Intelligence.
Data Warehouse si Data Mart

Data Warehouse ETL: Extract–Transform–Load

Platforme logistice care conecteaza cantitati masive de Extragerea datelor din:


date diferite din cyberspace si creeaza legaturi intre - diferite sisteme (baze de date relationale (SQL),
ele. XML , baze de date non-relationale, alte tipuri de
structuri de date;
Datele sunt originare din sisteme de prelucrare a
tranzactiilor (TPS – vanzari, facturare, fabricatie etc) + - diferite surse (aplicatii vechi – Mainframe, aplicatii
tranzactii de tip Web site + alte sisteme informatice customizate, puncte de contact clienti (ATM, call
(MIS, DSS). centers), ERP, CRM.
Datele sunt stocate intr-o zona temporara (Staging
Concept de functionare DW: bazat pe procese de tip Area), pentru a fi validate inainte de a fi incarcate in
ETL: Extract – Transform – Load DW.
•extrage date din sisteme eterogene dpdv DBMS,
hardware, sisteme de operare, protocoluri de Datele extrase din serverele sursa sunt date brute,
comunicatie; inadecvate analizei  necesita transformarea si
validarea inainte de pasul urmator (filtrari, conversii,
•transforma datele (conversie, concatenari, calcule, eliminare redundante etc).
filtrari, etc);
•incarcare date in sistemul DW pentru a fi utilizate in Incarcarea datelor in DW – volume enorme de date
elaborarea rapoartelor de management si analiza de sunt incarcate in intervale scurte de timp. Necesita
business. mecanisme de Recover in caz de esuare a procesului de
incarcare. Tipuri de incarcare : Initial Load
(popularea cu date a DW); Incremental Load
(incarcare periodica cand este necesar); Full Refresh
(stergerea continutului unor tabele si incarcarea unor
date actualizate).
ETL: Extract – Transform – Load
Initial Load
Incremental Load
Servere SQL Full Refresh

Data
Warehouse
Web site

Staging Area
Validari - faza Loading
Baze de date - cheile de control nu sunt
NoSQL nule sau lipsesc
Validari –faza Transforming - dimensiunea tabelelor este
- filtrare dupa anumite criterii aceeasi ca in sursa lor
Validari – faza Extraction
- standardizare date - verificare valori variabile si
- corelare date cu sursele de date
- conversie unitati de masura, alocare modul de calcul al lor
- verificare spam sau date corupte
dimensiune campuri
- eliminare date duplicate/fragmentate
- marcare campuri obligatorii
- verificare chei de legatura
- transpunere tabele, split/merge
coloane/ linii
NoSQL -
Baze de date non-relationale, impartite pe
diverse servere, pentru aplicatii care sunt
accesate de oriunde de pe glob.
Business Intelligence – componente
1. EXTRAGEREA
DATELOR BRUTE
2. CONSOLIDAREA
Date curente si
DATELOR
istorice din companie
(vanzari, profit,
Integrarea diferitelor
pierderi etc) + date
BD si crearea
externe.
legaturilor dintre ele.
BI
3. ACCES SI ANALIZA
DATE
Interpretarea, 4. RAPOARTE SI
prelucrarea datelor, TABLORI DE BORD
trenduri, tipare de (DASHBOARDS)
evolutie a datelor
Infrastructura Business Intelligence.
Data Warehouse si Data Mart

Data Mart
Un subset al Data Warehouse care sumarizeaza date
dintr-o zona specifica a organizatiei, plasandu-le intr-o Exemplu:
baza de date separata (Data Mart) pentru o anumita O companie dezvolta Data Mart pentru marketing si
categorie de utilizatori. vanzari care include:
Serie de date pentru punctele de vanzare cu amanuntul
Date in magazinele fizice.
operationale Serie de date pentru depozitul central de produse.
Serie de date pentru vanzarile prin magazinul virtual.

Date istorice

ETL Data Mart


Data
Date Web
Warehouse Utilizatori
ocazionali
Data Mart
Date externe

Date Utilizatori
audio/video constanti
Instrumente Business Analytics
OnLine Analytical Processing (OLAP). Data
Mining
OLAP - utilizează bazele de date multidimensionale, construite de regulă din date istorice sau date care provin
din diverse surse, integrand informaţii din surse eterogene, de tipuri şi naturi diferite.
Baza de date multimensionala contine: Date - simboluri care descriu o entitate (ex: numele unui fisier Word) si
Metadate (“date despre date”) – date care definesc provenienta datelor, algoritmii de agregare, termeni
economici, formule de calcul indicatori, status date (sterse, arhivate), etc.
OLAP- instrument pentru analiza multidimensionala a datelor, facilitand:
a) vizualizarea informatiei din perspective (dimensiuni) multiple;
b) access instantaneu;
c) manipulare facila a datelor. Caracteristici ale OLAP:
- Vizualizarea datelor prin mai multe dimensiuni - date din sisteme
multiple (vanzari, productie, stocuri), vizualizate dupa criterii multiple
(pret, regiune, discount, timp, client, canal de distributie).
- Analiza trendului unor indicatori/procese pe intervale de timp.
- Analiza in profunzime a unor indicatori (drill-down).
- Extragerea unor subseturi de date pentru vizualizare.
- Suport pentru calcule analitice complexe, la diferite niveluri de agregare a
datelor.
Exemplu:
O companie de accesorii auto vinde 3 tipuri de produse, in regiunile de est, vest si sud, folosind canale de vanzare
fizice si online. Daca managerul de vanzari doreste sa stie ce cantitate din produsul 1 a fost vanduta in
trimestrul trecut, in zona de est, prin magazinele fizice, va consulta baza de date de vanzari.
Dar daca doreste sa cunoasca ce cantitate din fiecare produs, a fost vanduta in fiecare zona de vanzare, pe fiecare
canal de vanzari, in luna iunie a anului curent, comparativ cu luna iunie a anului trecut si sa evalueze aceste
vanzari in functie de prognozele de care dispune pentru urmatorul semestru – va folosi instrumente de analiza
multidimensionala.
OnLine Analytical Processing - OLAP

Functionalitati OLAP:
Organizarea si vizualizarea datelor in - Rapoarte multidimensionale, cu
depozitul de date (DW) se face intr-o informatii obtinute din surse diferite
structura multidimensionala – (BD relationale, non-relationale etc) –
HIPERCUB, format din: vanzari totale produs X, prin canalul de
- Masuri numerice sau fapte (celule vanzare Y, in perioada Z…).
ale cubului). - Comparatii – abaterea medie a
- Dimensiuni (fatete ale cubului). vanzarilor din iunie 2021, comparativ cu
iunie 2020, pentru produsul x, y si z.
- Agregari date – rezumate ale datelor
Masuri numerice – reprezentari calculate anterior (venituri realizate in
cantitative ale unui proces, fenomen, magazinele din nordul regiunii, pe
activitate, indicator (volum vanzari, cost fiecare judet in parte). Masuri (fapte)
total de productie, buget publicitate, Volum vanzari produs P1, P2, P3.
campanie de promovare). Masurile se - Clasificari, profiluri statistice -
clasifica dupa dimensiunui. volumul vanzarilor pentru clientii din
categoria 20-30 ani si procentul acestora Dimensiuni:
in totalul vanzarilor.
Dimensiuni – caracteristici (atribute) Spatiu (zona de est)
- Analize What-If – care este impactul
ale masurilor numerice; reflecta asupra vanzarilor online, daca se aloca Timp (iunie 2020)
parametrii in care se defasoara procesul cu 15% in plus pentru bugetul Social Canal de vanzare (fizic)
(timp, spatiu, produse, furnizori, client, Media ? Clienti (ce grup tinta)
resurse financiare, resurse umane,
resurse materiale etc). Piata (segmente de piata)
Forta de vanzare (agenti de vanzari)
Data Mining
Ce este Data O colectie de metode, tehnici si algoritmi de explorare si analiza a unor volume imense de date – de regula,
disparate (imprastiate) – pentru a descoperi cunostinte (Knowledge Discovery – KD), utile in optimizarea
Mining proceselor de business si adoptarea deciziei.
Tehnologiile Data Mining – descopera informatii semnificative si predictive din toate datele pe care le
detecteaza (structurate, non-structurate, Web data, etc).
Utilitatea Data Mining – pot fi aplicate in contexte multiple, pentru a detecta si prezice probabilitatea
manifestarii unor fenomene si a unor comportamente, in functie de care se adopta decizii care vor genera
noi oportunitati de piata.
Cautarea la nivelul bazelor de date masive (Data Warehouse), a unor tipare / modele ascunse (patterns), a
unor corelatii intre informatii si tendinte ale acestora, cu scopul de a face predictii asupra
comportamentelor viitoare.
Scop Tehnologia Data Mining extrage cunostinte din datele colectate, pentru:
- Generarea de recomandari - sugerarea de produse, orientarea actiunilor de marketing
- Prezicerea comportamentelor – pentru clienti, organizatii, investigare fraude etc.
- Formularea de predictii – in meteorologie, evolutia pietei, cotatii de actiuni la bursa.
- Identificarea de tipare – in genetica, astronomie, in medicina.

- Metode statistice (analize predictive, descriptive, exploratorii).


Tehnici si
instrumente - Inteligenta artificiala (AI) – sisteme care gandesc (retele neuronale); sisteme care actioneaza
(roboti); sisteme care imita rationamentul uman (sisteme expert).

- Invatare automata (Machine Learning) – algoritmi care utilizează probabilități statistice pentru a
genera computerelor capacitatea de a „învăța”, fără a fi programate în mod explicit.
Data Mining

Functionalitati

Culegerea datelor structurate (din baze de date


Clasificare – identificarea unui grup cu anumite
relationale, foi de calcul) si nestructurate (texte in
reguli (tipare) de comportament (ex: descoperirea
format liber, audio-video, imagini din surse Web: e-
caracteristicilor clientilor care sunt susceptibili sa se
commerce, retele sociale, documente electronice
porteze la alte retele de telefonie).
(arhive digitale) etc.
Preprocesare date – curatare (inlocuire valori lipsa, Crearea de clustere (clusterizare) – formarea de
definirea valorilor extreme), integrare (preluare din sub-clase (clustere) intr-un set de date, dupa un
surse multiple, eliminare redundante), transformare anumit tipar, pentru a intelege cum functioneaza
(sumarizari, concatenari). grupul din care fac parte (ex: identificarea profilului
utilizatorilor de carduri REVOLUT, identificarea de
Asociere – cautarea de relații între variabilele dintr- grupuri de documente cu continut similar).
un set de date, cum ar fi determinarea produselor
care sunt cumpărate de obicei împreună (Cola si
chipsuri).
Previziuni – predictia unei serii de valori numerice,
Secventiere – evenimente legate in timp (ex: daca se pe baza unui anumit set de date (vânzări,
cumpara o casa, atunci probabilitatea de achizitie in 2 temperatura, prețurile acțiunilor, valorile incarcarii
saptamani a unui frigider este de 65%, iar de achizitie retelei de distributie a energiei electrice).
in 5 zile a unui televizor este de 89%.
Situatii de aplicare
Data Mining
Marketing
• Explorarea unor cantitati masive de date (de ordinul terabyte), in timp real pentru a îmbunătăți segmentarea pieței. Pot fi analizate relațiile
dintre criteriile de segmentare a pietei (vârsta clienților, sexul, preferintele, venituri, etc)  prezicerea comportamentului de consum, in functie
de care sunt direcționate campanii de fidelizare personalizate.
• Pentru un lant de restaurante, pot fi explorate clase de informatii despre: produse din meniu (preferinte, interval orar, periodicitate, grupuri
tinta de client); activitatea de delivery; organizarea de evenimente etc,  pot fi determinate modele de comportament ale clientilor, corelatii
intre informatii, identificarea unor trenduri, in functie de care poate fi elaborata stratgia de marketing.

Retail
• Explorarea unor modele de achizitie ale clientilor (bilete la film + popcorns), pentru a identifica asocierile anumitor produse si modalitatea de a
fi oferite la locul de achizitie. Detectarea ofertelor cele mai apreciate de client sau a produselor greu vandabile, pentru a optimiza strategia de
pret si campaniile de promovare.

Companiile aeriene
•Utilizeaza tehnici de explorare a datelor pentru a genera o vizualizare completa a clientilor, prin integrarea datelor acestora provenite din
cautarile de calatorii, rezervari bilete, rezervari Rent a Car, interactiuni Web, Social Media, Call-Center. Companiile folosesc solutii Data Mining
pentru a face previziuni referitoare la preferintele clientilor, detectarea unor anomalii de comportament (cazuri neobisnuite sau specifice),
trenduri referitoare la modele de organizare a calatoriei (ex: clientii din zona orientala, peste 55 ani, cu venituri peste medie opteaza pentru
serviciul Rent a Car, preferand marcile Mercedes, BMW si Audi).

Medicina
• Explorarea datelor despre infrastructura medicala (spitale, echipamente, dispersia teritoriala a unitatilor spitalicesti, etc), resursa umana din
sistemul public de sanatate, identificarea incidentei anumitor boli pe categorii de varsta, prognozarea evolutiei bolilor contagioase  permite
adaptarea politicilor publice de sanatate, cunoasterea unor modele de comportament, personalizarea unor masuri sanitare pentru anumite
categorii de persoane.
OLAP si Data Mining
Tehnologiile Data Mining sunt in
esenta, procese predictive, care
utilizeaza depozite de date pentru a
extrage cunostinte utile identificarii de
modele, trenduri si corelatii.
Inteligenta
Metode artificiala
statistice (AI) Tehnologiile OLAP sunt in esenta
Data procese deductive, care se adreseaza
Mining unui depozit de date (data warehouse),
generand ipoteze si relatii.

Invatare automata
Machine Learning
Business Intelligence si Business Analytics
pentru suport decizional

Infrastructura
Business Intelligence
Date din mediul Instrumente de
de afaceri Business Analytics

Date Web DBMS Metode de gestiune a


Social Media Data Warehouse performantei
Call Centers Proces Data Mart OLAP
E-Commerce ETL Data Mining
Cloud Modele Strategia de business
Date guvernamentale Instrumente de Balanced Scorecard
Date legislative interogare Indicatori de performanta
(KPI)
Interfata utilizatori Prognoze

Tablou de bord
Platforme informatice
Rapoarte
Portaluri Web
Social Media MIS
Desktop DSS
Aplicatii mobile
EIS
Functionalitati Business Intelligence si
Business Analytics
Rapoarte predefinite
Vanzari Prognoze; Performanta fortei de vanzare; Etape ciclu de vanzare.

Call-centers Satisfactie client; Rata de conversie utilizatori site;

Marketing Eficacitate campanii marketing; Fidelizare client; Clienti noi.

Resurse umane Productivitate angajati; Rata de retentie a angajatilor;

Finante-contab Profitabilitate; Cash-flow;

Platforme Rapoarte parametrizate – analiza impactului anumitor parametrii asupra proceselor


Ex: vizualizarea vanzarilor unui produs, intr-o zona, la anumite momente de timp.
BI & BA Tablou de bord / Balanced Scorecard – analiza performantei; suport pentru functiile de urmarire si
control ale managementului.

Generare de rapoarte – permit utilizatorilor definirea propriilor rapoarte bazate pe interogari si


cautari ale bazei de date.
Functia drill-down – analiza informatiei in adancime; navigarea in cadrul ierarhiilor de date, prin
detaliere pe nivelurile inferioare.
Analiza unui set de date format din categorii/subcategorii (vanzarile pe canalul de vanzari online,
pentru produsul x, pe un anumit segment de piata, intr-un interval de timp considerat).

Analize predictive - prognoze, scenarii de tip “what-if”; analize statistice (ex: probabilitatea ca un
client sa raspunda unei oferte a companiei).
Managementul performanței – Modelul BSC (Balanced Scorecard)
Balanced Scorecard

Flux de trezorerie
Performanta livrarilor Randament capital investit
Gradul de satisfactie Rezultate financiare
Rata de fidelizare clienti

Strategia firmei
Obiective

Rotatia personalului Eficacitatea resurselor


Rata promovarilor Termene de executie procese
Rata personalului instruit Timp de nefunctionare echip.

S-ar putea să vă placă și