Documente Academic
Documente Profesional
Documente Cultură
Business Intelligence
Business Intelligence (BI) este abilitatea unei ntreprinderi de a studia
comportarea i aciunile trecute, cu scopul:
de a stabili poziia i situaia curent a organizaiei i
de a prezice sau modifica ceea ce se va ntmpla n viitor
Business Intelligence
BI i data warehouse se nscriu n domeniul mai general Corporate
Information Factory (CIF), care s-a dezvoltat n ultimii 20 ani
Depozitele de date
stocheaz date istorice
Datele sunt semnificative
pentru un anumit moment
de timp (time-variancy)
De aceea nregistrrile
contin o informaie privind
momentul sau perioada
de timp pentru care sunt
valabile
7
10
OLTP
Bazele de date operaionale suport prelucrarea tranzaciilor (On-Line
Transaction Processing OLTP)
Tranzaciile sunt operaii atomice care acceseaz (n general) un numr mic
de nregistrri, pentru operaiile zilnice ale ntreprinderii
Bazele de date operaionale sunt proiectate s maximizeze numrul de
tranzacii/secund (throughput) i s minimizeze conflictele concureniale
11
OLAP
Depozitele de date suport prelucrarea analitic a datelor (On-Line
Analitical Processing - OLAP)
Depozitele de date conin date consolidate, rezumate din mai multe baze de
date operaionale, pe perioade de timp ndelungate
Depozitele de date sunt mult mai mari (cu cel puin un ordin de mrime)
dect bazele de date operaionale
12
Modificarea datelor:
13
14
Datele din depozite sunt gestionate de unul sau mai multe servere de
depozite (warehouse servers)
Mai exist i centre de date (data marts) care conin date specifice
anumitor departamente i servere pentru acestea (data mart servers)
Depozitele i centrele de date reprezint datele de intrare pentru toolseturi de:
Interogare
Analiz (OLAP)
Explorare (data mining)
15
16
17
Schema star
n implementarea relaional a schemei stea, baza de date const din:
o tabel corespunztoare msurii (fact table) (foarte mare, cu date
agregate)
cte o tabel pentru fiecare dimensiune (relativ mici)
18
Schema snowflake
n implementarea relaional a schemei snowflake, baza de date
const din:
o tabel corespunztoare msurii (fact table) (foarte mare, cu date
agregate)
Tabelele de dimensiuni sunt normalizate in mai multe tabele
19
Schema constelation
Mai multe tabele facts
Tabelele de dimensiuni
20
n ODW se folosete
preponderent:
Schema stea pentru
proiectarea logic a
depozitului
Implementarea relaional
a schemei stea
21
Componentele OWB
23
Cube - n ODW
Datele unui CUBE pot fi interpretate diferit de grupuri de utilizatori prin
decuparea feliilor din cub pe diferite dimensiuni:
Managerii regionali: studierea feliilor orientate pe piee regionale (market);
Managerii de producie: studierea feliilor orientate pe produs (product);
25
26
CUBE SALES
Dimensiunile:
PRODUCTS
PROMOTIONS
CUSTOMERS
CHANNELS
TIMES
27
Refer dimensiunile:
TIMES
PRODUCTS
CHANNELS
CUSTOMERS
PROMOTIONS
28
Proiectarea dimensiunilor
O dimensiune const din:
Atribute ale dimensiunii fiecare atribut avnd nume i tip (de date)
Un set de niveluri i un set de ierarhii definite pe aceste niveluri
30
32
35
37
38
Observatii: tabelul PRODUCTS este nenormalizat prezint redundane, dar interogarile sunt mai rapide
Denumirile coloanelor difera pt. ca s-a folosit deploymentul existent din exemplele Oracle (schema sh)
40
41
43
555
556
557
558
559
560
561
562
563
564
Observaie: irul de bii al indexului nu are doar 10 bii, ci o lungime egal cu cardinalitatea
tabelului CUSTOMERS
44
null
single
married
divorced
widow
555
556
557
558
559
560
561
562
563
564
0
45
47
Transformarea stea
Pentru execuia interogrii folosind transformarea stea, se transform
interogarea stea n sub-interogri pe fiecare dimensiune:
SELECT ... FROM sales
WHERE time_id IN
(SELECT time_id FROM times WHERE calendar_quarter_desc = '1999-Q1')
AND cust_id IN
(SELECT cust_id FROM customers WHERE cust_state_province='CA')
AND channel_id IN
(SELECT channel_id FROM channels WHERE channel_desc IN('Internet','Catalog'));
51
Sintaxa:
RANK ( ) OVER ( [query_partition_clause] order_by_clause )
DENSE_RANK ( ) OVER ( [query_partition_clause] order_by_clause )
53
Funciile lag/lead
Sintaxa:
Exemplu:
54
Data mining folosete mari volume de date pentru a crea modele, att n
aplicaiile economice ct i n aplicaii tiinifice
55
58
Bibliografie
W. H. Inmon, Building the Data Warehouse, Fourth Edition, Wiley
Publishing, Inc., 2005
S. Chaudhuri, U. Dayal, An Overview of Data Warehousing and OLAP
Technology, Intl. Conference on Data Engineering, 1995.
Oracle 11g Documentation
Oracle Database - Data Warehousing Guide 11g Release 1 (11.1) B2831302
Oracle Database - 2 Day + Data Warehousing Guide 11g Release 1 (11.1)
B28314-01
Oracle Warehouse Builder User's Guide 11g Release 1 (11.1) B31278-06
60