Sunteți pe pagina 1din 28

3.

SIAD BAZAT PE DATE

SIAD bazat pe date: OLTP vs. OLAP Motoda de proiectare multidimensionala Aplicatii back-end Aplicatii front-end

Business Inteligence
Termenul de Business Inteligence acoper un ansamblu de aplicaii i de tehnologii care asigur colectarea, conservarea, analiza i interpretarea datelor complexe, interpretare care ajut decidenii n luarea deciziilor, datele fiind analizate dup mai multe dimensiuni Termenul de Business Inteligence reprezint acele sisteme care ajut ntreprinderile s neleag care este situaia actual punnd n eviden cauzele, i s previzioneze efectele viitoare ale deciziilor actuale.

Arhitectura SIAD bazat pe date


.
EXTRACIA
experi

EXPLOATAREA R E O R G A N IZ A R E
non expert MD1

S1

S2

I N T E G R A R E

SG

C O N S T R U C I A

MD2

Depozitul de

date

I N T E R O G A R E

S3

MD3

- interogri - analize OLAP - data mining

Arhitectura SIAD bazat pe date


Sursele de date sunt numeroase, variate i autonome. Ele pot fi interne ( bazele de producie) sau externe (internet, bazele de parteneri etc.) ntreprinderii. Sistemele decizionale comport dou tipuri de spaii de stocare care sunt depozitele de date i magaziile de date. Un depozit de date regrupeaz ntr-un format omogen date utile pentru asistarea deciziei provenind din surse interne (baze de producie) si/sau externe (baze de parteneri, internet etc.). O magazie de date este o extragere de informaie dintr-un depozit de date constituit anterior, i organizat de o manier adecvat astfel nct s permit o analiz rapid avnd ca scop asistarea lurii de decizii. Instrumentele de analiz permit s se manipuleze datele urmrind axele de analiz. Informaia este vizualizat prin intermediul interfeei interactive i funcionale dedicat decidenilor care de obicei nu sunt informaticieni (directori, efi de servicii etc.)

Depozitul de date
Bill Inmon n cartea sa de referin Using the Data Warehouse [1994] definete depozitul de date ca o colecie de date integrate, orientate subiect, non volatile, istorice, organizate ca suport pentru procesul de asistare a deciziei

OLTP (On-line Transactional Processing)


OLTP (On-line Transactional Processing) : Mediu de tratare a informaiei n care rspunsul trebuie dat de o manier consistent i ntr-un timp acceptabil. n acest cadru modelul de date trebuie s asigure o minimizare a redundanelor n scopul prezervrii fiabilitii i coerenei sistemului. Conceptul de integritate este o noiune cheie ntr-un astfel de mediu, ea reprezentnd un ansamblu de constrngeri aplicate actualizrii bazei de date, permind astfel o cretere a coerenei acesteia. Originea scopului de minimizare a informaiei decurge n principal din faptul c sistemele tranzacionale efectueaz actualizarea on-line eventual de-a lungul unui ansamblu de aplicaii care partajeaz acelai model de date.

OLTP (On-line Transactional Processing)


ntr-un sistem tranzacional, concepia este orientat spre proces, iar modelul de date trebuie s susin aceast orientare. Interogrile sunt ntotdeauna previzibile. Din punctul de vedere al utilizatorului modelul de date este n totalitate transparent; el fiind accesat n mod indirect prin intermediul aplicaiilor de obicei de tip pachet (aplicaii informatice predefinite) puse la dispoziia lor. n acest context, datele sunt n general accesate prin chei, mai ales prin chei primare.

OLAP (On-line Analytical Processing)


OLAP (On-line Analytical Processing) : Caracterizeaz arhitectura necesar implementrii unui sistem informatic decizional. Se opune OLTP. Termenul OLAP desemneaz instrumentele de analiz care se sprijin pe baze de date multidimensionale. Informaiile sunt puse la dispoziia utilizatorului dar actualizarea lor nu se mai face on-line. Singurele actualizri efectuate n depozitul de date vor veni din sistemele operationale prin intermediul procesului de ncrcare.

OLAP (On-line Analytical Processing)


Odat efectuat procesul de achiziie de date, problema integritii datelor din depozitul de date nu va mai putea fi pus n discuie. Astfel devine evident introducerea redundanelor, ns acestea trebuie coordonate, bine gestionate n procesul de alimentare. O alt caracteristic a sistemelor decizionale este aceea c utilizatorul caut n mod frecvent s pun n relaie elemente care apriori nu au fost corelate.

OLAP (On-line Analytical Processing)


Spre deosebire de sistemele tranzacionale, sistemele decizionale pachet (predefinite) sunt foarte rare, aceasta datorit faptului c un depozit de date are ca scop s rspund cerinelor utilizatorilor n termeni de informaii i nu n termeni de tranzacii. O alt caracteristic a unui sistem decizional este c de cele mai multe ori acesta trebuie s permit implementarea unui model de date integrat avnd ca obiectiv transversabilitatea la nivel de ntreprindere. Acest model se constituie de cele mai multe ori ntr-o manier incremental, pe msura realizrii succesive de proiecte decizionale la nivelul ntreprinderii. n acest cadru, modelul de date va evolua de o manier constant i regulat.

Modelarea Depozitelor de date


Studiile au identificat cinci axe care s permit calificarea unui model de date decizional, iar acestea sunt [Le data warehouse J.-M. Franco 1997] : Primul obiectiv este asigurarea lizibilitii din punct de vedere al utilizatorului final; Al doilea i al treilea obiectiv se refer la performane: performane legate de ncrcarea depozitului de date; performane legate de execuia interogrilor;

Modelarea Depozitelor de date


.
Al patrulea obiectiv se refer la administrarea depozitului una din dificultile ntlnite de multe ntreprinderi nu este aceea de a construi depozitul de date ci aceea de a-i asigura funcionarea; Un ultim obiectiv este evolutivitatea ce permite ca dezvoltarea unui depozit de date s se fac de o manier incremental.

Modelarea Depozitelor de date

Modelele de date normalizate se caracterizeaz printr-o semantic slab din punct de vedere decizional. De obicei informaiile interesante pentru utilizatori nu se regsesc n mod direct, ele trebuind s fie extrapolate, prin recalcularea dinamic la fiecare interogare. Performanele obinute vor fi mediocre i chiar inacceptabile.

Modelarea dimensional a depozitului de date


Modelarea dimensional pleac de la principiul c obiectivul major al unui sistem decizional este analiza performanelor ntreprinderii. Aceste performane se pun n eviden printrun ansamblu de indicatori. Indicatorii vor fi analizai de-a lungul unor dimensiuni. Printr-o dimensiune se nelege o axa de analiz asociat indicatorilor, amintind dimensiunea temporar care este aproape quasi-frecvent n toate aplicaiile decizionale. Trebuie precizat c acest tip de modelare este independent de tehnologiile ce vor fi utilizate. El poate permite utilizarea tuturor tipurilor de baze de date, care pot fi relaionale, multidimensionale, obiect etc.

Definiie : Modelarea multidimensional const n a considera un subiect de analiz ca un punct ntr-un spaiu cu mai multe dimensiuni. Datele sunt organizate n maniera de a pune n eviden subiectul analizat i diferitele perspective de analiz.

Modelarea dimensional a depozitului de date

Modelarea conceptual a depozitului de date

Conceptual, aceast modelare multidimensional d natere conceptelor de fapt i dimensiune [Kimball 1996]

Conceptul de fapt
Subiectul de analiz este reprezentat prin conceptul de fapt. Definiie : Faptele modeleaz subiectul de analiz. O fapt reprezint msura activitii determinat la intersecia tuturor informaiilor referitoare la activitate. Reprezentarea grafic la nivel conceptual a unei tabele de fapte se face astfel:
Tabela de fapte Vnzri Cantitate Valoare Msuri ale activitii

Fig. Reprezentarea grafic a tabelei de fapte

Conceptul de dimensiune
Subiectul de analiz, adic fapta este analizat deseori urmrind diferite perspective. Aceste perspective corespund unei categorii utilizate pentru a caracteriza msurile activitii analizate [Marcel 1998]. Aceste perspective le denumim n continuare dimensiuni.

Conceptul de dimensiune
Definiie : Dimensiunea modeleaz o perspectiv de analiz. O dimensiune se compune din parametrii corespunznd informaiilor care fac s varieze msurile activitii. Reprezentarea grafic la nivel conceptual a unei dimensiuni se face astfel:
Timp IDTimp Zi Lun Trimestru Semestru An

Este mai fin

Ierarhia
Definiie : Ierarhia organizeaz parametrii unei dimensiuni dup o relaie de tip este mai fin n conformitate cu nivelul lor de detaliu. O dimensiune normal sa nu conina nicio ierarhie sau poate contine una sau mai multe ierarhii naturale.

Modelul Star
Plecnd de la procesul analizat i perspectivele de analiz a acestuia, este posibil s se stabileasc o structur simpl care s corespund necesitilor modelrii multidimensionale. Aceast structur este constituit din fapta (subiectul de analiza) care este aezat central i dimensiuni. Acest model reprezint din punct de vedere vizual o stea, vorbim astfel de modelul stea (star schema [Kimball 1996]).

Modelul Star
.
Timp Vnzri
IDTimp IDProdus

Produs

Zi Lun Trimestru Semestru An

Cantitate Valoare

Denumire prod. Marc prod. Subcategorie prod Categorie prod Raion

Magazin
IDMagazin

Denumire magazin Localitate Jude Regiune ara

Modelul Snow-flake
n modelarea entitate-asociere o relaie de tipul 1-n ntre atributele aceleiai tabele oblig automat la crearea unei noi tabele. n cadrul dimensiunilor existena ierarhiilor, din punct de vedere al abordrii clasice oblig la crearea de noi tabele. Normalizarea dimensiunilor va crea subdimensiuni dnd natere la un nou tip de model de date denumit fulg de nea (snow-flake).

Modelul Snow-flake
.
Timp
IDTimp

Produs Vnzri Cantitate Valoare


IDProdus

Zi Lun Trimestru Semestru An

Denumire prod. Marc prod. Subcategorie prod Categorie prod Raion Adres
IDLocalitate

Magazin
IDMagazin

Denumire magazin

Jude Regiune ara

Modelul Multi-star
O alt tehnic de modelare, derivat din cele dou tipuri de model amintite anterior este modelarea multi-star (constelaie). Aceasta se caracterizeaz prin fuzionarea mai multor modele star i/sau snow-flake care utilizeaz dimensiuni comune. Deci un model n constelaie cuprinde mai multe fapte i dimensiuni care pot fi partajate de dou sau mai multe tabele de fapte sau doar de o singur tabel de fapte.

Modelul Multi-star
.
Timp
Vnzri prod.
IDTimp IDProdus

Produs

Zi Lun Trimestru Semestru An

Cantitate Valoare prod.

Denumire prod. Marc prod. Subcategorie prod Categorie prod Raion

Serviciu Vnzri serv


IDServiciu

Magazin
IDMagazin

Denumire serv. Subcategorie serv. Categorie serv.

Valoare serv.

Denumire magazin Localitate Jude Regiune ara

Modelarea logic
La nivel logic mai multe posibiliti sunt disponibile pentru modelarea multidimensional. Exist posibilitatea s se utilizeze: un sistem de gestiune de baze de date (SGBD) relaional; un SGBD orientat obiect. Abordarea cea mai des utilizat const n a utiliza sisteme de gestiune a bazelor de date relaionale. Modelul multidimensional este transpus de maniera urmtoare: Fiecare fapt corespunde unei tabele, denumit tabel de fapte Fiecare dimensiune corespunde unei tabele, denumite tabel de dimensiuni Tabela de fapte este constituit din atributele ce reprezint msurile activitii i atributele chei externe ale fiecrei tabele de dimensiuni. Tabelele de dimensiuni conin parametrii i cheia primar care permite s se fac legtura cu tabela de fapte

Modelarea logic
Vnzri (IDProdus, IDMagazin, IDTimp, Cantitate, Valoare) Timp (IDTimp, Zi , Lun, Trimestru, Semestru, An) Magazin (IDMagazin, DenMagazin, Localitate, Jude Regiune, ar) Produs (IDProdus, Denumire prod., Marc prod., Subcategorie prod., Categorie prod., Raion)

S-ar putea să vă placă și