Sunteți pe pagina 1din 0

Aplicatii informatice corporatiste

Business Intelligence

Mihaela Muntean
2013
Conceptul de Business Intelligence
(BI)
BI este un termen umbrel [Howard Dresner
, Gartner Group, 1989] .
BI implica achizitionarea de date si informatii
dintr-o varietate de surse, organizarea lor intr-un
DW si utilizarea lor pt procesul decizional
[Turban, 2007]

Mihaela Muntean-2013
Business Intelligence
Mihaela Muntean-2013
-BD tranzactionale/OLTP
-Fisiere excel, sisteme
CRM/ERP, etc
Surse de
date
Utilizarea diferitelor
instrumente/aplicatii
BI
Procesul decizional
Obiectivele unui sistem BI
Obiectivul principal al unui sistem BI este de
a oferi suport decidentilor in procesul decizional
in scopul de a lua decizii cat mai bune bazate pe
informatii :
s permit acces rapid i uor la informaiile
firmei pentru un numr mare i variat de
utilizatori
s ofere un mediu de operare deschis i
scalabil
s mbunteasc calitatea informaiilor
s reduc timpul necesar pentru a obine aceste
informaii
Mihaela Muntean-2013
Factorii care au determinat
dezvoltarea sistemelor BI
Depozitele de date
Internet-ul
Creterea substanial a competiiei
Mihaela Muntean-2013
Componentele de baza ale BI
un depozit de date (data warehouse/DW)
aplicatii/instrumente pt analiza de business:
raportare si interogare
OLAP
data, text, Web mining
dashboard, etc.
aplicatii/instrumente pentru monitorizare si analiza
performantelor (Business performance management/ BPM/
corporate performance management /CPM ) [Turban, 2007]
Mihaela Muntean-2013
Mihaela Muntean-2013
Componentele unui sistem BI
aplicatii/instrumente pt analiza de
business
aplicatii/
instrumente
pentru
monitorizare si
analiza
performantelor
Surse de date
Centre de date/data
mart
Instrumente ETL
(Extraction, Transforming and Loading)
Procesul ETL:
faza de extragere date din sistemele
operationale si sursele externe (CRM, ERP,
fisiere Excel, etc)
curatarea datelor -se verifica calitatea
datelor ce vor fi incarcate in DW (accent pe
corectitudinea lor)
transformare datelor (accent pe formatul
datelor)
faza de incarcare in depozitul de date

Mihaela Muntean-2013
Curatarea datelor
Date murdare:
Date duplicate
De ex datele despre un pacient intr-un SI pt managementul pacientilor
Date inconsistente
de ex , asociate cu adrese, coduri postale, abrevierea tarilor (de ex. se
poate utiliza Romania/RO)
Date lipsa
de ex. locul de munca al pacientului
Utilizarea neadecvata a unor atribute
se stocheaza numere de telefon in atributul CNP
Date gresite /imposibile
introduse gresit manual/ multiple surse (2/30/2009 in loc de
30/2/2009, sau strada Mihai Bavu in loc de Mihai Bravu)
Rectificarea /omogenizarea datelor










Mihaela Muntean-2013
Mihaela Muntean-2013
Definitia unui depozit de date
(datawarehouse) [Inmon, 1995)]
o colectie de date :
orientata pe subiecte
integrata
variabila in timp
nevolatila
care ofera suport procesului decizional

Mihaela Muntean-2013
Orientata pe subiect
Sistemele operationale sunt
organizate in jurul aplicatiilor unei
firme.
De exemplu pentru domeniul
asigurarilor , putem avea aplicatii
pentru asigurari auto, asigurari de
viata, de sanatate, etc.
Subiectele importante dintr-o firma
de asigurari ar putea fi clientii,
politele, plangeri, daune.
Fiecare firma are propriul set de
subiecte.
Mihaela Muntean-2013
Colectii de date integrate
Datele din surse diferite sunt
transformate intr-un format
consistent.

Curatarea datelor este un proces
prin care se verifica calitatea
datelor ce vor fi incarcate in
DW.

Se sterg sau se transforma datele
corupte sau incorecte din sistem.

Instrumente ETL
Mihaela Muntean-2013
Colectii de date nevolatile


Datele incarcate in depozit
nu se modifica (update),
nu sunt sterse (decat daca sunt prea vechi
pentru procesul decizional) .

Mihaela Muntean-2013
Timpul este o dimensiune importanta a
DW

Unele inregistrari au o marca
de timp, sau au o data a
tranzactiei .
Pentru sistemele
tranzactionale orizontul de
timp este de 60-90 zile (date
curente) , la un depozit de
date este de 5-10 ani

Datele istorice sunt utilizate
pentru previziuni si raportare.
Mihaela Muntean-2013
De se utilizeaza DW?

Pentru a mbunti calitatea informaiilor din
organizaie
Pentru a integra surse de date eterogene
Mihaela Muntean-2013
Modelul dimensional [Kimball]
Informatiile pot fi clasificate in :
fapte - elementele de date care sunt analizate
un indicator de performan prin care se poate
analiza performana/ neperformana activitii
modelate)
Variabila/ masura (in BDMM)
dimensiuni - furnizeaz informaii descriptive despre
fiecare fapt (cine? ce? unde?, cand? si cum? despre
un fapt)


Mihaela Muntean-2013
Fapte/indicatori
indicatori de baz
volumul vnzrilor
cantitatea vndut
costurile
numrul de clieni
indicatori derivai care se obin prin combinarea
indicatorilor de baz
Profitul
productivitatea

Mihaela Muntean-2013

Tabela de fapte
este tabela central (schem stea) i corespunde unei
colecii de fapte din modelul dimensional
conine un numr foarte mare de tupluri (posibil
milioane). Numrul de tupluri din tabel reprezint de
fapt produsul cartezian al dimensiunilor
conine toi indicatorii de performan importani
cheia primar a tabelei este o cheie compus, format
din cheile primare ale tabelelor de dimensiuni.
este normalizat i realizeaz de fapt o legtur indirect
ntre dimensiuni
poate contine si date agregate
Mihaela Muntean-2013
Granulatia
Granulaia unui indicator/fapt -nivelul de detaliu la care
este stocat n modelul dimensional
Cantitatea vanduta poate fi stocata la nivel de zi/ lun,
produs /categorie de produs.
Granulaia unei variabile este determinat de combinaia
granulaiilor tuturor dimensiunilor asociate
Afecteaza dimensiunea DW, nivelul de analiza,
flexibilitatea DW
Depinde de cerintele analitice ale businessului



Mihaela Muntean-2013
Dimensiunile
Furnizeaz informaii descriptive despre fiecare indicator.
Reprezinta entitati din lumea reala si nu procese de business. De exemplu
pentru tabela de fapte Vanzari, caracteristicile indicatorului cantitatea
vanduta pot fi : Locatia (unde), Timpul (cand), produsul vandut( ce)
Conin n general date statice. Atributele dimensionale nu se modific la fel
de des ca atributele din tabela de fapte.
Sunt eseniale pentru analiz. Un model dimensional ce ofer un numr mare
de atribute dimensionale permite analize ct mai complexe i mai variate.
ntr-o schem stea sunt tabelele care se dispun radial n jurul tabelei de fapte
i se mai numesc tabele de dimensiuni/dimensionale.
Aceste tabele sunt denormalizate, iar cheia lor primar este o cheie simpl.
Sunt tabele mai mici decat tabela de fapte.
Dimensiuni comune afacerilor sunt : Locaia, Produsul, Clientul, Timpul

Mihaela Muntean-2013
Membrii unei dimensiuni
O dimensiune conine mai muli membri.
Un membru este un nume distinct sau un identificator
folosit pentru a determina poziia unui element de dat
(n schema stea apare sub denumirea de atribut
dimensional).
De exemplu toate lunile, trimestrele i anii formeaz dimensiunea
Timp i toate oraele, regiunile i rile dimensiunea Locaie.
Un membru poate aparine la una sau mai multe ierarhii
sau poate s nu fie inclus ntr-o ierarhie (independent).
De exemplu n dimensiunea Produs membru culoare nu este
inclus n nici o ierarhie.

Mihaela Muntean-2013
Ierarhia
membrii unei dimensiuni se pot aranja n una sau mai multe ierarhii
fiecare ierarhie poate avea mai multe nivele ierarhice
Ierarhia calendaristic












saptamana
an
trimestru
luna
zi
Mihaela Muntean-2013











an
L
Trim1
Trim2 Trim3 Trim4
L
L
L L L L L L L L L
Mihaela Muntean-2013
Cheie timp

Ziua din sptmn
Numrul zilei n lun
Numrul total de zile
Numrul sptmnii n an
Numrul total de sptmni
Luna
Trimestru
Perioada fiscal
Tipul zilei
Tipul zilei din sptmn
Sezonul
Evenimente,
etc
Dimensiunea Timp
Mihaela Muntean-2013
Dimensiunea Produs
conine una sau
mai multe
ierarhii, precum
i atribute
dimensionale
independente
Cheie produs
Numr inventar
Descriere produs
Dimensiunea ambalajului
Marca
Subcategorie
Categorie
Raion
Tip ambalaj
Greutate
Unitatea de msur pentru
greutate
Limea raftului de stocare
nlimea raftului
Adncimea raftului,
etc

Mihaela Muntean-2013
Schema stea
Exista o tabela importanta, in centrul schemei, singura tabela cu
multiple jonctiuni tabela de fapte
Celelalte tabele (tabele dimensionale/dimensiuni) au o singura
jonctiune la tabela de fapte

Dim Timp
Timp_id
ziua
ziua_din_sapt
luna
trimestru
an
etc

Dim Produs
item_id
denumire
marca
tip
tipul_distribuitor

Vanzari

item_id
locatie_id
Timp_id
cant_vand
volum_vanz

Dim Locatie
Locatie_id
strada
oras
judet
tara

Mihaela Muntean-2013
Avantajele schemei stea
Usor de construit;
reflect cu exactitate modul cum neleg utilizatorii
activitatea modelat;
furnizeaz o performan ridicat pentru cereri
analitice, prin reducerea numrului de jonciuni;
permite modelarea unor structuri multidimensionale
complexe;
toi indicatorii de performan ai activitii modelate
sunt stocai n tabela de fapte.
Mihaela Muntean-2013
Dezavantajele schemei stea
este o schem inflexibil. Adugarea unei noi
dimensiuni n schem, poate duce la modificarea
granulaiei tabelei de fapte;
conine date redundante ce conduc la creterea riscului
de inconsisten a datelor;
pentru a permite analize complexe, trebuie s includ
multe tabele de agregate;
face dificil jonciunea ntre tabelele de fapte.


Mihaela Muntean-2013
Schema fulg de zapada
Tabelele de dimensiuni sunt normalizate
Se utilizeaza atunci cand dimensiunile sunt mari
Pe langa tabelele de fapte principale, schema fulg de zapada contine tabele
de fapte separate pentru fiecare nivel de agregare.
Se vor executa mult mai multe jonctiuni pentru o cerere si performanta ar
putea fi influentata
Mihaela Muntean-2013
Dim
Distribuitor

distribuitor_id
Tip_distrib

Dim Timp
Timp_id
ziua
Ziua_din_sapt
luna
trimestru
an

Vanzari
Timp_id
Item_id
Locatie_id
Volum_vanz
cantitate

Dim Produs
Item_id
denumire
marca
distribuitor_id

Dim Locatie
Locatie_id
strada
Oras_id

Dim Oras

Oras_id
orad
judet
tara

Mihaela Muntean-2013

Avantajele schemei fulg de zpad:

structura normalizat a dimensiunilor este mai uor de
modificat;
reduce redundana datelor;
Mihaela Muntean-2013
Dezavantajele schemei fulg de zpad
este mai complex dect schema stea;
scade performana la interogare, deoarece sunt folosite
multe jonciuni;
schema este mai dificil de neles de ctre utilizatori,
fiind mai apropiat de modelul entitate-asociere.

Mihaela Muntean-2013
Instrumente BI
Instrumente pentru interogare
Instrumente pentru raportare
Instrumente OLAP
Instrumente DataMining (data, text, Web)
Dashboard, etc


Mihaela Muntean-2013
Instrumente pentru interogare
ad-hoc
accesul la o sursa de date fara sa se scrie cod SQL
Sursa de date: DW/OLTP
Aplicaiile BI construite cu astfel de instrumente:
permit un nivel ridicat de interaciune cu utilizatorul
(tehnici de navigare i selecie a datelor);
utilizeaz de regul baze de date relaionale i limbajul
SQL;
utilizeaz adesea modelul de date dimensional (schema
stea sau fulg de zpad);
ofer unele faciliti analitice:
Care sunt primii 10 clieni?

Mihaela Muntean-2013
Instrumentele de interogare ad-hoc
Power Play/Cognos
IBMs Query Management Facility
Oracle Discoverer
etc

Mihaela Muntean-2013
Instrumente pentru raportare
(Enterprise reporting)

Aplicaiile BI construite cu astfel de instrumente:
furnizeaz rapoarte statice sau parametrizate destinate
unui numr mare de utilizatori din organizaie;
ofer puine faciliti analitice;
utilizeaz de regul baze de date relaionale (depozite
de date/BD-OLTP) i limbajul SQL
dezvoltate de specialisti IT
Mihaela Muntean-2013
Instrumente pentru raportare
BusinessObjects Crystal Reports
Microsoft Reporting Services
Oracle Publisher (Oracle Reports-Reports Builder)
etc

Mihaela Muntean-2013



Online Analytical Processing (OLAP)

accentul pe analiza si explorarea
datelor (de ce se intampla?)
Caracteristici
Viziune multidimensionala
Foarte rapide
Interactive
Nivele multiple de agregare
Calcule complexe
Mihaela Muntean-2013
Concepte de baz

-Cub n-dimensional
-dimensiuni
-membrii
-masuri
-ierarhii


Operatii de baza
- Slice i dice sau selecii n cub: Afieaz vnzrile din luna Ianuarie.
- Drill down / roll up- parcurgerea ierarhiile din dimensiuni (de ex din
dimensiunea Produse)
-Drill across - combin mai multe cuburi cu una sau mai multe dimensiuni
comune (jonciunea de cuburi).
- Ranking sau top/bottom n
- Rotating- rotirea cubului (o alta viziune asupra datelor)
Mihaela Muntean-2013

OLAP
Oracles Hyperion Essbase
Microsoft Analysis Services
SAP Business Explorer
Excel 2007-cea mai populara interfata la datele OLAP
(optiunea pivot table si pivot chart)
Mihaela Muntean-2013
Mihaela Muntean-2013
Dashboard
este o aplicatie multinivel construita pe o infrastructura BI si de
integrare a datelor ce permite organizatiilor sa masoare , monitorizeze
si sa gestioneze eficient performanta de business (Eckerson, 2006).
Caracteristici:
utilizeaza componente vizuale (grafice, gauges, harti, stoplights, etc)
pentru a evidentia datele si exceptiile ;
utilizeaza o mare varietate de surse de date
permit operatii de tip drill-down pe sursele de date
prezinta o viziune unitara si dinamica a business-ului
afiseaza indicatorii de performanta intr-un format intuitiv
permit monitorizarea performantelor la nivel de: unitate de business,
organizatie, proces
usor de utilizat de catre manageri
Ex: Managementul financiar, managementul performantelor angajatilor
MicroStrategy Enterprise Dashboard, Qlikview, Tableau Software

Mihaela Muntean-2013
Instrumente Data Mining
extind facilitatile analitice si implementeaza noi tehnici pentru a explora
datele din baze de date de dimensiuni foarte mari (date structurate) dar si
nestructurate:
extragerea cunotinelor ascunse n date
identificarea de tendine i modele neintuitive n seturi de date.
identificarea asocierilor ce exista intre obiectele din BD exprimate ca
reguli
Tehnici:
Segmentarea- gruparea populatiei eterogene de date intr-un numar
specific de subgrupuri cu caracteristici omogene.
De exemplu se pot grupa clientii in 5 subgrupuri in functie de venitul lor
si categoria de varsta.
Asocierea identificarea asocierilor ce exista intre obiectele din BD
exprimate ca reguli.
De exemplu, in 60% din tranzactiile in care sunt incluse produsele A si
B, se vinde de asemenea si produsul C
etc


Mihaela Muntean-2013
Text Mining
Date nestructurate (fisiere text) 80% din informatiile utile ale
unei organizatii.
analiza gradului de satisfactie a clientilor
identificarea riscurile pacientilor care sufera de boli de inima,
etc
Web Mining
Descopera si analizeaza tipare si informatii de pe Web
mining de continut, mining de structura, mining de utilizare

Alte exemple: Managementul riscului, Detectarea fraudelor bancare
Oracle Miner, Intelligent Miner-IBM, Hyperion System 9 BI+Analytic
Services, etc


Data Mining
Mihaela Muntean-2013
Factorii care influeneaz alegerea
instrumentelor BI
Tipul de utilizatori (utilizatori finali,
analisti/specialisti) :
experiena
80%-90% din consumatorii de informaii sunt
utilizatori finali cu o experien limitat sau au
nevoie de faciliti analitice limitate
Mihaela Muntean-2013
Factorii ce influeneaz alegerea
instrumentelor BI
Cerinele informaionale i analitice ale
utilizatorilor
Analistii i utilizatorii intensivi au nevoie n
special de faciliti analitice complexe
utilizatorii finali nu au experiena necesar
pentru a utiliza aceste faciliti.

Mihaela Muntean-2013
Factorii ce influeneaz alegerea
instrumentelor BI
Tehnologia utilizat (relaional sau
multidimensionala):
bazele de date relaionale sunt flexibile, au o
arhitectur deschis
bazele de date multidimensionale ofer
faciliti analitice mai bune.
Mihaela Muntean-2013
Factorii ce influeneaz alegerea
instrumentelor BI
Tipul de arhitectur client-server
aplicaiile BI complexe utilizeaz o interfa
Web care le permite utilizatorilor s acceseze
uor aceste aplicaii.
majoritatea instrumentelor BI permit o
arhitectura client server pe dou sau trei
niveluri.
Nici un instrument BI nu este optim pentru
orice tip de aplicaie BI.

Mihaela Muntean-2013
Aplicatii BI
analiza vanzarilor
analize de marketing
planificare si forecasting
consolidare financiara, bugetara
analiza profitabilitatii. [Thomson, 2004]

Mihaela Muntean-2013
Intrebari
Studiu individual: Bologa Razvan, Sisteme ERP. Elemente
introductive, ed ASE, 2012, cap 3 (biblioteca ASE)
Specificai etapele unui proces ETL
Specificai componentele de baz ale unui sistem BI
Un depozit de date se utilizeaza pentru:__________
Identificati 4 exemple (altele decat cele de la curs) pentru fiecare
categorie de instrumente BI
Identificati 3 firme IT care ofera solutii pentru depozite de date
Identificati 3 firme IT care ofera instrumente ETL
Identificati 3 facilitati BI oferite de Excel
Identificati ce tipuri de aplicatii (si in ce domenii) se pot dezvolta
cu instrumentul QlikView (utilizati site-ul firmei). Alegeti una din
aplicatii (demo) si identificati ce facilitati ofera. Realizati un referat
de max 1pag .

S-ar putea să vă placă și