Sunteți pe pagina 1din 32

-- SISTEME SUPORT PENTRU DECIZII --

Managementul datelor
Depozitarea, accesarea, regsirea, analiza i vizualizarea
datelor

Cuprins

2.1 Stocarea, accesarea, analiza i vizualizarea datelor;


2.2 Tipurei de date i caracteriticile acestora
2.3 Procesul de colectarea datelor i elemente de calitate;
2.4 Structura i organizarea bazelor de date;
2.5 Depozite de date;
2.6 Procesarea analitica on-line: accesarea, exploatarea, cercetarea i analiza
datelor sistemul OLAP;
2.7 Microsoft SQL Server
2.8 Vizualizarea datelor i multidimensionalitatea;
2.9 Studiu de caz.

Pagina 1 din 32
-- SISTEME SUPORT PENTRU DECIZII --

2.

Managementul datelor
Depozitarea, accesarea, regsirea, analiza i vizualizarea
datelor

n condiiile actuale ale dezvoltrii din ce n ce mai rapide a proceselor


industriale, a creterii complexitii proceselor economice, a existenei unui numr tot
mai mare de informaii despre aceste procese se impune exisitena unui sistem eficient
care s realizeze managementul acestor date.
Managementul datelor implic stocarea acestor date ( ce exist ntr-un volum
foarte mare de ordinul milioanelor de nregitrri pentu o companie), accesarea lor n timp
util, asfel nct s fie de folos factorilor de decizie de pe diferitele nivele ierarhice ale
companiei, analizarea i vizualizarea lor funcie de obiectivele fiecrui factor decident i
ntr-o manier care s satisfac mobilitatea obiectivelor, condiionat de mediul dinamic
i incert n care compania ii desfoar activitatea.
Efectul de globalizare i pune i el amprenta asupra managementului datelor n
sensul existenei unei intercolerri ntre datele diferitelor companii utilizate n procesul de
luare al deciziilor. O soluie la aceast problem se regseste n conceptul de depozitare a
datelor, de accesare i regsire a lor, de procesare analitic on-line, de vizualizare
multidimensional.

2.1 Stocarea, accesarea, analiza i vizualizarea datelor

Unitile economice mari utilizeaz o baza de date centralizat pentru susinerea


procesului decizional. Bazele de date centralizate colecteaz date din surse diferite i le
organizeaz astfel nct acestea devin uor de accesat prin intermediul aplicaiilor DSS i
EIS i cu eficien sporit.
De menionat c n condiiile creterii numrului de utilizatori la aceste date, a
suprancrcrii cu informaii a unitilor economice, a necesitii regsirii rapide a datelor
este necesar depozitarea, procesarea analitic on-line, vizualizarea lor. Relaiile dintre
acestea sunt evideniate n figura 2.1.
Utilizatorii finali acceseaz bazele de date folosind diferite instrumente selectate
n funcie de motivul accesrii. De exemplu, n DSS pot fi utilizate instrumente de
documentare sau mascare; n EIS pot fi utilizate instrumente de monitorizare sau
exploatare a datelor. Datele accesate trebuiesc analizate i prezentate utilizatorilor
folosind instrumente prietenoase pentru vizualizare i prezentare multidimensional.

Pagina 2 din 32
-- SISTEME SUPORT PENTRU DECIZII --

Comunicarea
de afaceri

Documentarea

Surse de date Realizarea


rapoartelor
Surse
interne Achiziionarea, Calcul tabelar,
extragerea, estimare, Prezentarea i
livrarea, Depozitarea vizualizarea
analiza,
transformarea datelor datelor
Surse modelare
datelor
externe

Multimedia

EIS, altele

Fig. 2.1 Procesare analitic on-line a datelor

2.2 Tipuri de date i caracteriticile acestora

Sistemele suport de decizie folosesc trei categorii de date, date propriu-zise,


informaii i cunotinte.
Datele propriu- zise referitoare la evenimente, activiti i tranzacii dintr-un
sistem sunt nregistrate, clasificate i stocate, dar nu sunt organizate pentru a comunica
o anumit idee. Datele pot fi numerice, alfanumerice, cifre, sunete sau imagini.
Informiile sunt date organizate astfel nct s aib un neles pentru destinatar,
acesta din urm poate interpreta informaiile, stabili noi conexiuni i emite concluzii.
Cunotinele reprezint date sau informaii organizate i prelucrate astfel nct s
fie capabile s comunice nelesuri, experien i s stabileasc noi nelesuri pe baza
unui proces de autonvare pentru a fi apoi utilizate ntr-o problem decizional curent
sau viitoare.
Bazele de date DSS precum depozitele de date pot include aceste trei categorii
mai sus menionate. Datele DSS pot cuprine documente, imagini, sunete i animaii.

Pagina 3 din 32
-- SISTEME SUPORT PENTRU DECIZII --

Datele pot fi primare, brute sau prelucrate i provin din surse interne, externe i
personale.
Datele interne sunt stocate n locaii diferite i se refer la factorul uman,
produse, servicii sau procese. Aceste date provin din sursele interne ale sistemului
economic sau de pe INTRANET.
Datelele externe acopera arii diferite, de la baze de date comerciale pn la date
colectate cu ajutorul senzorilor sau sateliilor i sunt disponibile utilizatorului pe CD-
ROM, sticker, internet. Adeseori ele sunt irelevante pentru anumii utilizatori dar
pentru alii nu, de aceea pentru a evita apariia unor omisiuni este necesar stocarea
tuturor datelor.
Datele personale i cunotinele vizeaz stocarea experienei i cunotinelor
factorilor decideni de pe diferite trepte ierahice ale sistemului analizat pentru reutilizri
viitoare.

2.3 Procesul de colectare a datelor i calitatea acestora

Nevoia de a extrage date din multe surse interne i externe complic sarcina de
proiectare i realizare a unui DSS.
De subliniat c datele trebuiesc colectate n punctele cu entropie minim pentru a
pstra acurateea i calitatea lor. Culegerea datelor trebuie s aib n vedere i momentele
de timp de culegere a acestora, astfel nct ele s reflecte strile semnificative din sistem.
Este util de a obine date, robuste i precise care s fac fa unor probleme slab
structurate i unor medii cu perturbaii puternice i acest lucru este posibil prin utilizarea
unor tehnologii corespunztoare care s asigura utilizarea lor eficient n DSS.
Pot apare o serie de probleme legate de:
- corectitudinea datelor (prin introducerea incorect sau slaba colectare a datelor
i care poate fi evitat prin utilizarea unor teste care s verifice domeniul cruia i
aparin, valoarea, limitele) ;
- actualitatea datelor ( datorit neactualizrii lor la timp i fenomenul se evit
prin modificarea sistemului de generare a lor);
- omisiunea datelor (fapt datorat unei analize ineficiente i incomplete i poate fi
evitat prin luara n considerare a tuturor obiectivelor prezente dar i viitoare);
- msurarea sau indexarea neadecvat (cauzat de o logic greit de culegere
att ca timp ct i ca loc, de frecvena culegerii sau de un grad prea mare de detaliere i
toate acestea se evit prin introducerea unui nou sistem de msurare i de indexare);
- relevan datelor (datorit unei corelri ineficiente ntre obectivele reale i cele
luate n considerare fapt ce poate fi evitat nnd seama de dinamicitatea sistemului
analizat i a mediului su);
- coerena datelor (fenomen ce se evit prin utilizarea unor teste statistice);
- integritatea datelor (de a nu aprea conflicte ntre acelai date stocate n locuri
diferite, se evit prin utilizarea unui sistem de securizare eficient a datelor);
- volumul mare de date (cauzat de complexitatea sistemului, problemele ce apar
se pot evita prin multidimensionalitate i tehnici de data mining) ;
- pierderea de informaii prin agregare ( se evit prin utilizarea unor tehnici de
analiz a datelor).
- accesibilitatea calitii datelor (se realizeaz prin securizare i tehnici de acces)

Pagina 4 din 32
-- SISTEME SUPORT PENTRU DECIZII --

Calitatea datelor este o problem important i pentru a realiza acest deziderat


trebuie s se aibe n vedere urmtoarele aspecte :
- contextul calitii datelor (relevana, valoarea, completitudinea, mrimea, de
valabilitatea n timp) ;
- intrinsecul calitii datelor ( acuratee, obiectivitate, credibilitate, reputaie) ;
- reprezentarea datelor pentru a fi prezentate ct mai concis, uor de neles i
de interpertat.
De menionat c tipul aplicaiei este acela care determin precizia msurtorilor i
gradul de calitate al datelor.
Gray i Watson /7 / arat c pentru a obine o bun calitate trebuie s se verifice :
- uniformitatea datelor ;
- versiunea (transformarea datelor prin utilizarea metadatelor s asigure coninutul
original al datelor);
- completitudinea datelor mai ales atunci cnd se fac agregri ale acestora ;
- conformitatea datelor care asigur c datele concise se gsesc n domeniul
corect ;
- genealogia datelor i sondarea acestora pentru a stabili traseul lor de la versiunea
iniial la cea actual.
Datele externe ptrund n organizaii din mai multe surse i anume prin
intermediul internetul sau prin bncile comerciale de date care ofer DSS-ului date de
actualitate i cu un cost rezonabil.
Servicii reprezentative ce furnizeaz astfel de date sunt :
CompuServe i The Source Reele pentru P.C.-uri, ce ofer date statistice
(statistici de pe pieele financiare i de afaceri), precum i date bibliografice.
(www.compuserve.co.uk)
CompuStat furnizeaz date statistice despre mai mult de 12000 de corporaii de la
bnci, uniti economice .a.m.d. pn la agricultur. (www.compusat.com)
Dow Jones Information Service furnizeaz date statistice despre burs i alte piee
financiare precum i statistici financiare aprofundate despre toate corporaiile nregistrate
la burs.
Interactive Data Corporation Distribuitor de date statistice ce acoper o gama
larg de domenii precum agricultura, industria automobilelor, sistemul bancar, mrfuri,
populaie, economie, energie, finane, afaceri internaionale i asigurari. Principalii si
furnizori sunt Chase Econometric Associates, Standards&Poors i Value Line.
Lockheed Information Systems cel mai mare distribuitor de date bibliografice.
Datele provin de la firme de cercetare economic, asociaii de schimb i instituii
guvernamentale.
Mead Data Control (www.mead.com) ofer informaii i rezumate despre anumite
cercetri i articole din ziare, reviste, servicii de tiri, documente guvernamentale etc..
Colectarea datelor din mai multe surse externe, implic pentru creterea eficienei
folosirea unui manager al fluxului de date (DFM-data flow manager), care adun
informaiile din surse externe i le stocheaz acolo unde este nevoie i ntr-o form util.
Managerul de flux de date (DFM ) reprezint un sistem :
de sprijin a procesului decizional;
un procesor central pentru accesarea datelor ;
un instument pentru meninerea integritii datelor

Pagina 5 din 32
-- SISTEME SUPORT PENTRU DECIZII --

un procedeu de sortare a surselor de date externe.


Internetul i sistemele de baze de date ale corporaiilor permit obinerea unor
informaii utile pentru DSS. Avem astfel setul de programe Pilot pentru sprijinirea
procesului decizional combinat cu programul InTouch/2000, Lotus Notes-Domino i TCB
Works. Alte instrumente ofer caracteristici proprii browserelor web, i permit crearea de
prezentri multimedia, biblioteci selectate n funcie de obiect i secvene OLAP.
Powersoft, Power Builder Windows sunt destinate clienilor sau serverelor Web.
Furnizorii de baze de date i pagini Web includ Spider Technologies (Palo Alto,
CA), ce permit compararea alternativelor de-a lungul mai multor axe, Hight Software
(Raleigh, NC), Next Software Inc. (Redwood City, CA), Oracle Corp. (Redwood Shores,
CA) i One Wave Inc. (Cambridge, MA).
Este necesar s existe un sistem de administrare a bazelor de date, care faciliteaz
o mai bun integrare a datelor, o salvare i modificare rapid, o securizare eficient a
datelor. Un sistem de administrare a bazelor de date combinat cu un limbaj de
reprezentare formeaz o pereche tipic care este utilizat n construirea DSS.
Datele dintr-o baza de date sunt extrase i prelucrate prin programe statistice
pentru o analiz mai aprofundat dar DSS-urile au incorporate n ele aceasta operaie.
Programele de calcul tabelar din DSS se ocup de reprezentare, efectueaz
calcule repetate cu variabile corelate i includ funcii matematice, statistice, logice i
financiare extinse.
n aplicaiile DSS este adesea necesar s se lucreze n acelai timp cu date,
reprezentri i modele folosind n acest scop instrumente integrate, interfee performante.

2.4 Tipuri de baze de date

O baz de date reprezint o colecie de date integrate, structurate i persistente


care este partajat de mai multe aplicaii sau utilizatori. n proiectarea structurii bazei de
date trebuie s se asigure o independen logic (s nu depind de particularitile
aplicaiei) i una fizic (s nu depind de modul de memorare a datelor).
Tipurile de baze de date se bazeaz pe structura acestora avem astfel baze de date
relaionale, ierarhice, n reea, orientate pe obiect, inteligente, multimedia.
Baze de date relaionale organizeaz datele sub forma unor colecii de tabele i
ele permit utilizatorului s vad tabelele n doua dimensiuni i s fac o analiz a datelor
prin accesri multiple n timp rapid. ntr-o asfel de baz de date fiierele sunt corelate
prin existena unor cmpuri comune. Utilizatorul poate uor manipula, modifica aceasta
baz i o poate accesa prin formate neanticipate la momentul proiectrii sale iniiale.
Baze de date ierarhice ordoneaz datele prin legturi ierahice sub form de
arbore sau o organigram. Legturile se fac de la nodul parinte ctre nodurile fii. Uneori
n aplicaii aceast condiie este prea restrictiv i pentru a emula faptul c aceiai
nregistrare este necesar n mai multe poziii n baza de date, se introduc noduri virtual,
ce conin pointere ctre o nregistrare fizic unic. Aceste BD sunt mai puin flexibile.
Baze de date reea permit legturi mai complexe ntre oricare pereche de noduri,
conexiuni laterale ntre elementele asociate i structura este numit i modelul
CODASYL. Ea conduce la importante economii de spaiu de memorare.

Pagina 6 din 32
-- SISTEME SUPORT PENTRU DECIZII --

Depozitele de date au conexiunile ntre date n form de stea, de fulg de nea sau
de constelaii( fig. 2.2, 2 :3, 2.4). Aceste conexiuni permit agregri pe nivele superioare
ale dimensiunilor iniiale prin utilizarea datelor din nomenclatoare.
Dimensiunea Dimensiunea
TIMP OPERAIE
Timp_id Tip operaie
Ziua Denumire
Luna
Trimestru TRANZACII
An
Timp_i Dimensiunea
d
Operaie_id LOCAIE
Dimensiunea
Locatia_id
BENEFICIAR Benef_id Locaie_id
cantitate Ora,
Beneficiar_id strad, Nr.
Nume
Tip_beneficiar

Fig 2.2 Schema stea a unui depozit de date

Dimensiunea Dimensiunea
TIMP OPERAIE

Timp_id Operaie_id
Ziua Denumire
Luna
TRANZACII
Trimestru BENEFICIAR
An
Timp_id
Operaie_id Dimensiunea
Filiala_id LOCAIE
Dimensiunea Client_id
BENEFICIAR Cantitate transp Locaie_id
Nume
Beneficiar_id Ora, sector,
Nume strada, Nr.
Tip_beneficiar MIJLOC DE
TRANSPORT

Dimensiunea
Timp_id
OPERATOR Locaia_id
Operator_id Operator_id
Nume Nr_curse
Data_incadrare Cant. transportat
Salariu

Fig.2.3 Schema constelaie a unui depozit de date


Pagina 7 din 32
-- SISTEME SUPORT PENTRU DECIZII --

Timp_id Operaie_id
Ziua Denumire
Luna TRANZACII
Trimestru BENEFICIAR
An
Timp_i
dOperaie_i
Timp_id dLocatia_id
Ziua Beneficiar_id
Sezon Cantitate
Locatie_id
transportata
Nume

FILIALA
Adresa

Beneficiar_id
Nume Oras, sector
Tip_beneficiar strada, Nr.

Tip beneficiar
Ctg. Beneficiar
Subctg. Benef.

Fig. 2.4 Schema fulg de nea a unui depozit de date

Baze de date orientate pe obiect


Aplicaiile complexe DSS includ prelucrarea computerizata integrat (CIM
computer integrated manufacturing) ce necesit acces la date complexe, care pot include
imagini sau conexiuni complicate. Nici una din arhitecturile bazelor de date (ierarhic,
relaional sau reea) nu permit manevrarea eficient a acestora. Bazele de date orientate
pe obiect permit analiza datelor la un nivel conceptual care s pun n eviden relaiile
naturale dintre obiecte, clasele de obiecte, ierarhia acestora. Ierarhia dintre obiecte,
incapsularea datelor cu prelucrarea permit o uoar manevrare a acestora, n scopuri
multiple. (OODBMS), adres ( businessobjects.com).
Baze de date multimedia
Aceste baze de date grupeaz datele ntr-o varietate de formate n completarea
textelor standard i a cmpurilor numerice. Ele includ imagini, video clipuri, sunete i
realitatea virtual (imagini multidimensionale).

Pagina 8 din 32
-- SISTEME SUPORT PENTRU DECIZII --

Sistemele Oracle, Informix i Sybase stocheaza cantiti importante de date


multimedia sub forma de obiecte binare mari (BLOBS binary large objects). Alte
sisteme pot aministra multiple tipuri de date cum ar fi Oracle 8 i Universal Server al
Informix ce i nbogesc oferta de date.
Pentru aplicaii ale bazelor de date multimedia i demonstraii multimedia pe
Internet exist: Leisureplan Multimedia Travel Decision System de Leisureplan
International (http://www.leisureplan.com), Illustra Information Technologies, Inc.
(http://www.illustra.com ), Visual Intelligence Corp. (http://www.illustra.com) i ADB
Matisse (http://www.adb.fr).
Baze de date inteligente (BI)
Aceste baze de date includ tehnologiile de inteligen artificial, a sistemelor
expert, a reelelor neuronale, ce permit accesul i manipularea mai uoar a bazelor de
date complexe i o eficientizare a managementului lor. Ele utilizeaz limbaje naturale
pentru regsirea datelor i includ un optimizator al cererilor query optimizer . De
exemplu, un optimizator de cercetare ar constata c este mult mai eficient s transfere
trei nregistrari ctre un suport care pstreaz 50000 de nregistri dect invers. Un asfel
de produs este INGRES Intelligent Database sau KEE Connection, care transforma
comenzile KEE n solicitri asupra bazelor de date i urmrete n mod automat
transferul datelor ntre baza de cunotine a KEE i o baz de date relaional i dispune
de un optimizator inteligent care furnizeaza cunotinele necesare navigrii printre
date. Sistemele integrate pot lucra cu reprezentari simbolice de date. Baza de date
inteligent INGRES lucreaz cu date, cunotine i obiecte i permite ntelegerea unor
informaii complexe, precum:
Vineri + 1 (zi lucratoare) = Luni
Aciunile Microsoft cotate la burs 155 5 / 8 .
Prin utilizarea optimizatorului inteligent i a capacitailor sistemului de
administrare a bazelor de date (bazate pe obiecte), sistemul poate determina modul cel
mai rapid de a rspunde la o solicitare legata de bazele de date. Sistemul este
independent de formulare, rspunsul fiind furnizat intr-un timp foarte scurt.
Exploatarea inteligent a datelor include sisteme inteligente care permit
gsirea anumitor informaii aflate n depozitele de date pe care solicitrile i rapoartele
nu le pot descoperi efectiv i care sunt utile n elaborarea strategiilor sistemului.
Instrumentele de exploatare a datelor identific anumite abloane pentru date i deduc
pe baza acestora o serie de reguli, care pot fi utilizate n luarea decizilor i n stabilirea
efectelor acestora ( asociere, secvene, clasificri, previziuni).
Principalele tipuri de instrumente utilizate n exploatarea inteligent datelor sunt:
Argumentaie bazat pe cazuri anterioare. Utiliznd cazuri istorice, argumentaia
bazat pe acestea poate fi folosit pentru recunoaterea anumitor modele (abloane).
Cazurile noi pot fi identificate rapid cu unul din cele existente n depozitele de date,
informaiile fiind corecte n proporie de aproximativ 90%.
Estimarea neuronal este un tip de abordare prin intermediul careia datele istorice pot
fi analizate n scopul gasirii unor modele, de exemplu se pot identifica potenialii clieni
ai unui nou produs sau realiza previziuni privind evoluia unor companii.
Agentii inteligeni permit gsirea informaiilor n baze de date externe ntr-un mod
pertinent i eficient.
Alte instrumente includ arbori decizionali algoritmi genetici.

Pagina 9 din 32
-- SISTEME SUPORT PENTRU DECIZII --

Baze de date bazate pe documente sunt folosite pentru propagarea informaiilor,


stocarea i administrarea formularelor contribuind la automatizarea muncii.

2.5 Depozite de date

2.5.1 Caracteristici generale


O dat cu explozia informaiilor i a multitudinii de platforme informatice
existente pe pia, managerii din vrful organizaiilor au simit nevoia de a accesa i
analiza informaii i cunotine din alte sisteme ce fac parte din mediul lor sau cu care
acestea interacioneaz pentru luarea unor decizii eficiente. ngroparea unor date potenial
utile n sistemele informatice particulare ale diferitelor organizaii i cerina de a le
acccesa n timp util pentru luarea unor decizii eficiente la vrful organizaiei a determinat
utilizarea unor noi concepte , metode i instrumente aa cum este depozitul de date.
Un depozit de date este o colecie de date orientate pe domenii i subiecte, care
conine date detaliate, agregate i istorice, corelate n timp, nonvolatile i care are
drept obiectiv furnizarea de informaii precise i n timp util factorilor decideni de pe
diferitele nivele ierarhice ale unui sistem economic.
Nonvolatilitate nseamn c se permit doar operaiile de ncrcare i accesul la
date iar corelarea n timp semnific c se pstreaz toate datele de-a lungul unei perioade
de 5-10 ani iar cheia de acces conine obligatoriu elementul timp.
Depozitele de date pot stoca volume mari de date (10 12 bytes) care s fie utilizate
ulterior, deci ntr-un asfel de sistem este necesar arhivarea datelor.
Arhivarea datelor implic selectarea lor din diferite surse i n acest sens este
necesar de a detecta datele de interes i de a determina modul de ncrcare a lor ( de
obicei pe loturi- batch). De asemenea procesul de arhivare impune n prealabil conversia
datelor din formatul original n cel al depozitului.
Sistemul de arhivare faciliteaz reinerea de date istorice despre un eveniment, o
aciune, o entitate, o decizie i realizez apoi integrarea lor ntr-o structur unic care s
permit apoi factorilor decizionali s le utilizeze pentru aciuni viitoare (prognoze).
n acest sens este necesar o exploatare inteligent a datelor care s se
acomodeze rapid la cererile i tendiele pieii i ale utilizatorilor cu un cost sczut i cu
creterea profitului.
Este important s fie descoperite i anticipate din timp locurile nguste dintr-un
sistem care creaz probleme, s existe posibilitatea remedierii lor i realizrii unor
corelaii ntre date i a unor prognoze care s permit luarea unor decizii mai eficiente.
Utilizarea unor motoare inteligente de cutare i interogare i a unor instrumente
moderne de analiz a datelor (precum sistemul OLAP) contribuie la eficiena utilizrii
depozitelor de date n procesul decizional.
Un depozit de date are n vedere separarea fizic a domeniului operaional de cel
de suport de decizii. Scopul unui depozit s permit un acces rapid la datele operaionale
necesare n aplicaiile destinate procesului decizional i sistemelor de informare direct
i n acest scop el creaz un depozitar de date asemntor unui director de date.
Datele operaionale detaliate trebuiesc corelate pentru a fi mai uor prelucrate n
vederea furnizrii de informaii corecte, sintetice i n timp util managerilor n procesul
de luarea a deciziilor.

Pagina 10 din 32
-- SISTEME SUPORT PENTRU DECIZII --

Datele culese din diverse surse eterogene nainte de a fi stocate n depozitele de


date sunt supuse unui proces de selectare, filtrare, validare i transformare (serviciul
DTS) care s asigure o calitate sporit a informaiilor furnizate pe baza acestor date.
Procesul de curire include pe lng funciile de baz i funcia de corectare a
erorilor precum i acea de completare a omisiunilor.
Validarea datelor se refer la uniformizarea unitilor de msur, verificarea
ncadrrii lor n categorii, grupe, clase, de exemplu conversia unitilor monetare etc.
Procesul de transformare a datelor implic operaii de agregare i rezumare iar cel
de conversie implic trecerea datelor de la formatul original la cel al depozitului de date.
O data ce sunt stocate ntr-un depozit de date, datele sunt transformate sau
integrate ntr-o structur logic. Transformarea datelor pregtete datele primare pentru
analize complexe ulterioare.
Depozitele de date permit stocarea de metadate care pot include date concise ce
faciliteaz cutarea mai uoar a unui index.
Metadatele conin informaii referitoare la :
- modul de structurare a datelor, originea lor, operaii de agregare, frecvena de
modificare a metadatelor, proceduri de conversie ;
- istoricul extragerii datelor din sursele primare,
- descrierea tipurilor de acces permise i definirea procedurilor de calcul.
Metadatele pot fi de mai multe tipuri i anume : sintactice, structurate, semantice
(descriu nelesul datelor), pentru afaceri (bazate pe potenialul structurii datelor).
Metadatele sunt utilizate i pentru a asista procesul de conversie a datelor i
informaiilor n cunotine. Avnd n vedere procesul de evoluie a acestora Zaho /19 /
descrie cinci trepte n evoluia managementului metadatelor i anume: (1)adhoc,
(2)cercetare, (3)dirijare, (4)optimizare, (5)automatizare. Aceste trepte ne ajut s
nelegem ct de bine o organizaie i utilizeaz metadatele n procesul de management a
datelor n DSS.
Transferul informaiilor DSS n afara calculatorului confer unei companii
posibilitatea de a-si restructura strategia DSS. Companiile pot crea un nou mod de
producere i aranjare a datelor din DSS. Ele au astfel posibilitatea de a face datele ct mai
uor de prelucrat de orice utilizator, n vederea luarii anumitor decizii.
Observaie. Un depozit de date furnizeaz date deja transformate i sintetizate,
crend astfel un mediu adecvat pentru o dezvoltare i accesare mai eficient a
aplicaiilor DSS i EIS.
Sinteza i analiza datelor n depozite se realizeaz prin, consolidarea, comasarea
sistematizarea i gruparea datelor n scopul obinerii unor informaii pertinente care s
ajute factorii de conducere n luarea decizilor adecvate i descoperirea cauzelor care
afectez performanele sistemului.
Proiectarea structurii unui depozit de date implic :
- achiziionarea datelor i pregtirea lor ;
- depozitarea lor adic popularea cu date a depozitului;
- exploatarea curent a lui adic explorare, analiz, raportare utiliznd
instrumente software de ultim or de la browsere la data mining i ageni inteligeni.
Exploatarea curent a unui depozit de date conduce la noi cerine informaionale
n procesul de asistare a deciziei ceea ce implic extinderea structurii depozitului,
popularea cu date istorice a extensiei i integrarea noilor date n aplicaiile de analiz. n

Pagina 11 din 32
-- SISTEME SUPORT PENTRU DECIZII --

procesul de proiectare a organizrii datelor depozitului trebuie s se in seama de datele


importante dar i de contextul acestora. Structura depozitului trebuie proiectat asfel nct
s se fac o identificare rapid i un acces uor la date. Depozitele de date se proiecteaz
innd seama de cerinele viitorilor utilizatori, iar cele specializate se numesc piee de
date (data marts).
Exist mai muite tipuri de arhitecturi a depozitelor de date i anume /16/ :
- cu piee de date independente (uor de construit i de oganizat) ;
- cu piee de date distribuite, federale ( necesit metadate centralizate, reele pentru
conectare, o platform unic pentru toate pieele de date i se preteaz mai ales pentru
bussines) ;
- cu piee de date dependete arhitectur numit hube and spoke ce permite o uoar
interaciune a utilizatorilor prin utilizarea unei interfee, ce conine o platform unic
pentru toate pieele de date, pretabile pentru organizaii mari, dar implic costuri
ridicate) ;
- cu date centralizate, integrate cu acces direct. Se caracterizeaz prin piee de date
independente, un management simplu i uurin n administrarea datelor. Se
utilizeaz de ntreprinderi n domeniul afacerilor, necesit o conducere corporativ i
o viziune de perspectiv asupra viitorului.
Exist o serie de factori ce determin selectarea tipului de arhitectur utilizat
pentru depozitul de date i anume /3 / :
- interdependena informaiilor ntre organizaii :
- necesitiile informaionale ale factorilor decizionali din vrful
oranzaiei ;
- natura utilizatorilor finali;
- restriciile i resursele existente ;
- compatibilitatea cu sistemele existente ;
- mijloacele tehnice disponibile ;
- perspectiva srategic a depozitului de date inainte de implementare ;
- abilitatea personalului de IT ;
- urgena de a avea un un depozit de date implementat ;
- factorii sociali i politici existeni.
O alt problem care trebuie avut n vedere la proiectarea unui depozit de date de
dimensiuni foarte mare este factorul de scalabilitate. Acest factor are n vedere ct de
repede va crete depozitul de date, numrul de utilizatori ce l acced simultan precum i
complexitatea cererilor utilizatorilor. Se impune existena unei scalri pe orizontal i
vertical. Deasemenea construirea unor depozite de date n timp real (RDW) cunoscute i
sub numele de depozite active (ADW) este o cerin de mare importan ce permit luarea
de decizii tactice i operative i nu doar strategice.
Depozitul de date combina diferite surse de date ntr-o singura resurs care s fie
accesibila utilizatorilor. Redondana datelor este permis ntr-un depozit de date. Datele
stocate n depozite de date se centralizeaz pe mai multe nivele de agregare. Utilizatorii
pot efectua cercetari ad-hoc, pot analiza rapoarte i pot vizualiza informaia coninut de
depozitul respectiv. Depozitarea datelor const, de regul, n combinarea unei varieti de
tehnogii ntr-o soluie unic integrat.
Dac ar fi s facem o comparaie nre bazele de date i depozitele de date
observm c apar o serie de diferene. /18 /

Pagina 12 din 32
-- SISTEME SUPORT PENTRU DECIZII --

1) n bazele de date se stocheaz date operaionale ce sufer shimbri (prin


actualizare) i care sunt apoi utilizate n diferite tranzacii (calcule). n depozitele de date
datele detaliate, centralizate orientate pe domenii i subiecte de interes decizional nu se
schimb n timp ele reflect situaii globale cu caracter istoric.
2) n bazele de date exist un mare numr de utilzatori, de aceea datelor trebuie s
li se asigure un caracter de securitate, de integritate sporit. n DSS-uri numrul de
utilizatori este reprezentat mai ales de decideni care sunt n numr mic iar problemele de
securitate , siguran salvare i recuperare sunt mai relaxate
3) Prelucrarea datelor n sistemele tranzacionale se face foarte rapid, volumul de
calcule fiind mare. n DSS se prelucreaz un volum foare mare de date aflate n zone
dispersate, iar rezultatul acestor prelucrri este necesar n procesul de luare al decizilor i
este ceva mai lent dar n timp util.
4) Bazele de date sunt proiectate pentru scopuri cunoscute n prealabil, au un ciclu
de via mai lung iar adaptarea la schimbri necesit reproiectare. DSS sunt proiectate
ntr-o manier incremental, nu toate cererile sunt cunoscute n momentul proiectri,i el
trebuie s se adapteze n timp noilor cerine.
5) Sistemele tranzacionale urmresc fluxul datelor din activitatea curent sunt
orientate pe procese ( vnzri, achiziii, pli, producie etc.). DSS este organizat i
gestionat avnd n vedere obiectivele analizei de decizie orientat pe subiecte (client
furnizor, resurse etc.)
6) Datele stocate n baze de date sunt gestionate ca un ntreg, cele din DSS sunt
organizate pe subiecte i gestionate pe seciuni (data marts).

2.5.2 Componentele structura i mediul de depozitare a datelor n DSS

Depozitele de date apar n diferite forme i mrimi cu unul sau mai multe servere.
Principalele componente ale unui DSS sunt :
Baza de date fizica mare reprezentat de toate datele ce urmeaz a fi stocate alturi
de metadate i de logica de prelucrare necesar pentru selecionarea, organizarea, codarea
i procesarea datelor pentru utilizatorii finali.
Depozitul de date logice conine toate metadatele, regulile i logica de procesare a
metadatelor necesar pentru selecionarea, organizarea, codarea i procesarea datelor. Ea
conine informaiile necesare gsirii i accesarii datelor efective, oriunde ar fi localizate.
Piaa de date (data mart) este o colecie de date specializat, ce ndeplinete rolul de
depozit de date departamental, regional sau funcional. n procesul de stocare a datelor,
organizaia construiete o serie de piee de date, de-a lungul timpului, pe care le poate uni
prin intermediul unei baze de date logice raportat la ntreaga organizaie.
Sisteme de sprijinire a procesului decizional i un sistem de informare actvi care
nu sunt depozite de date, ci aplicaii care utilizeaz depozitele de date.
Proiectarea depozitului de date include urmtorii pai :
1. Stabilirea obiectivelor de proiectare : domeniile, subiectele spre care va fi
orientat ;
2. Precizarea surselor interne- tranzacionle, externe de culegere a datelor ;
3. Identificarea instrumentelor pentru realizarea procesului de curire, conversie,
transformare, agregare, sintetizare a datelor ;

Pagina 13 din 32
-- SISTEME SUPORT PENTRU DECIZII --

4. Stabilirea structurii depozitului i a instrumentelor pentru populare i accesare ;


5. Precizarea modului n care se va face analiza i vizualizarea informaiilor,
mediu de dezvoltare de aplicaii, produse specializate n analiza datelor, aplicaii dedicate
Pentru proiectarea structurii unui depozit de date se folosesc modele de tip stea,
conexiuni stelare sau fulg de nea, ce sunt modele conceptuale multidimensionale. Aceste
modele utilizeaz trei concepte importante i anume msura dimensiunile i faptele.
Dimensiunile privite n sensul de aspecte ale ale activitii sunt complet
independente. Unitle de msura reprezint expresia cantitativ sau calitativ asupra
datelor, iar contextul n care se desfoar aceste activiti este redat de fapte. Faptele au
un tabel asociat care reprezint combinaiile dimensiunilor i msurile pentru care se va
realiza analiza. Faptele conin sub form de coduri numerice cheile de legtur cu
tabelele de dimensiuni. O msur cuprinde de obicei propietatea numeric a faptului dar
uneori i o formul ce reprezint o funcia de agregare sau un scenariu. Msurile iau
valori diferite pentru combinaii diferite ale valorilor dimensiunilor. Anumite msuri se
pot aplica la toate dimensiunile, iar altele au sens doar pentru o anumit dimensiune.
De subliniat c modelele conceptuale multidimensionale ale depozitului de date
utilizeaz o schem deschis ce se poate modifica pe parcursul ciclului de via al
depozitului ntr-o manier incremental.
Dac avem n vedere structura unui DSS putem spune c exista cteva arhitecturi
de baz pentru depozitarea datelor i anume cu un suport cu dou i cu trei.
Datele provenite din surse interne (motenite) i externe sunt extrase, purificate,
filtrate i sintetizate nainte de a fi introduse n depozitul de date. Apoi, datele sunt
prelucrate din nou i depozitate ntr-o baza de date adiional, multidimensional (al
treilea suport n arhitectu (fig 2.5 /16/), organizat pentru prezentri multidimensionale.
Utilizatorii DSS i EIS pot cerceta noul server i efectua analize. Intr-o arhitectura cu
dou suporturi nu exista baze de date multidimensionale sau servere.

Surse Depozitar
Program de achizitionare a

interne Client
EIS
Server al Server
datelor

bazei de EIS/DSS Client


date DSS

Surse Client
externe EIS

Depozit de date Baza de date


multidimensionala
Fig 2.5 Arhitectura cu trei suporturi

Fig 2.5 Arhitectura cu trei suporturi a unui depozit de date.

Pagina 14 din 32
-- SISTEME SUPORT PENTRU DECIZII --

Un mediu de depozitare a datelor conine urmtoarele componente :


sursele de date, instrumentele de proiectare i dezvoltare, instrumente de extragere i
transformare a datelor, instumente de administrare i analiz a datelor.
Mediul de lucru Data Warhousing Framework al firmei Microsoft a fost utilizat
la construcia SQL Server care are rolul de a asista activitile de proiectare,
implementare i administrare a depozitelor de date pe durata ciclului lor de via.
Infrastructura sa este bazat pe depozitul de metadate i pe nivelul de transport al datelor
OLEDB (Object linking and embeding data base). Ele ofer urmtoarele faciliti :
- arhitectur deschis uor de integrat ;
- servicii uoare de introducere i extragere a datelor cu teste de validare ;
- metadate integrate pentru proiectarea depozitului, ncrcarea lui, sistemul de gestiune
al severului i instrumente de acces rapid la informaii pentru utilizatorul final.
- managementul infrastructurii (gestiunea evenimentelor uzuale, de alert, a taskurilor.
Observaii.
Depozitele de date se preteaz s fie utilizate n acele sisteme economice unde:

Datele sunt stocate n sisteme diferite.


Managementul se bazeaz pe utilizarea informaiilor.
Exist o gama larg, diversificat de clieni.
Acelai date sunt reprezentate diferit n sisteme diferite.
Datelele sunt stocate n formate foarte tehnice, greu de descifrat.
Depozitele de date de ultim generaie pot lucra n timp real permind asfel
luarea unor decizii tactice i operative nu doar strategice, ele fiind numite Active Data
Warehouse ADW. Ele au un numr mare de utilizatori (peste 1000), sunt flexibile, permit
obinerea de date sintetice i detaliate ntr-un timp foarte scurt i sunt uilizate cu succes in
domeniul gestiunii stocurilor. ( adres util overstoc.com)
Putm concluziona c depozitele de date au urmtoarele caracteristici :
Organizate dup subiecte detaliate (conin informaii necesare lurii corecte a
deciziilor)
Integritate. Datele pot fi codificate diferit funcie de locaie dar n depozitul de date
acestea sunt consistente. (de exemplu datele referitoare la profesie pot fi codificate
numeric ntr-o locaie sau prin litere n alta)
Includ variante de timp multiple. Datele sunt depozitate pentru perioade de 5-10 ani
i sunt sunt utilizate n stabilirea evoluiilor viitoare.
Nonvolatile adic odata depozitate, datele nu sunt schimbate i nici actualizate.
Conin date istorice;
Utilizate pentru decizii pe termen mediu i lung;
Permit accesul partajat al diverilor utilizatori;
Includ metadate precum i date externe i operaionale.
Conin date detaliate i agregate.
Adrese utile sunt http://www.data warehousing.compapers.asp

2.6Prelucrarea analitica on-lin a datelor. Sistemul OLAP

Pentru prelucrarea tranzaciilor colective e necesar procesarea on-line a acestora


utiliznd baze de date relaionale distribuite. Cea mai recent inovaie n acest domeniu

Pagina 15 din 32
-- SISTEME SUPORT PENTRU DECIZII --

este reprezentat de adaugarea unei arhitecturi client/vnzator. Un astfel de instrument


care este destinat procesarii tranzaciilor on-line este Informix-OnLine
Termenul de procesare analitic on-line se refera la estimarea de tip DSS i EIS
efectuat de utilizatorii finali n sisteme on-line. Procesarea analitica on-line este
efectuat de utilizatorii finali, n timp ce procesarea tranzactiilor on-line este utilizat de
profesionitii IT. Procesarea anlitica on-line implic:
- realizarea de cercetri (Focus 4.8);
- crearea de rapoarte ad-hoc;
- efectuarea de analize statistice;
- crearea unor aplicaii multimedia.
- Pentru prelucrrile analitice on-line este recomandat s se lucreze cu depozite de date
multidimensionale, precum i cu un set de instrumente cu capaciti multidimensionale.
Ele pot fi foi de calcul tabelar, instrumente de exploatare a datelor, instrumente de
vizualizare a datelor etc. Principalii furnizori sunt Lotus Development Corp., Computer
Associates, Cognos, Arbor Software Corp., Information Resources, Comshare, SAS
Institute Inc., Software A&G, Business Objects Inc., Intersolve i Platinum Technology.
Prelucrarea analitic on-line cu sistemul OLAP
OLAP este un instrument modern care permite:
- o accesare rapid a datelor oriunde s-ar afla i n orice volum;
- o sintetzare a datelor aflate n depozite funcie de obiective;
- o prelucrare rapid i inteligent a datelor util managerilor de pe diferite nivele
ierarhice n luarea decizilor ;
- capacitatea de a efectua analize numerice i statistice, o orientare n timp;
- o vizulizare multidimensional a datelor ;
- o partajare a datelor adic accesarea de mai muli utilizatori ceea ce implic un
sistem de securizare eficient ;
- posibilitatea de aface previziuni asupra evoluiei datelor.
OLAP permite de a construi noi scenarii rspunznd la ntrebride tip
what-if ce ar fi dac ? fa de depozitele de date ce rspund la ntrebri de tip cine ?
ce ? unde ? cnd ? cum ?. El faciliteaz o perspectiv multidimensional asupra datelor,
o capacitate de calcul intensiv, o orientare n timp(time intelligence) necesar pentru
comparaii i analize.
Perspectiva multidimensional asupra datelor se refer la capacitatea de a intrega
diferite activiti privite din perspective (dimensiuni) diferite : timp, locaie, tip entitate,
unitate de msur etc. Fiecare dimensiune utilizat aici n sensul de aspect poate avea
mai multe nivele (de exemplu pentru dimensiunea timp avem nivelele ani, semestre,
trimestre, luni, sptmni, zile, schimburi, ore.) i ne putem referi la perioade curente,
anterioare i viitoare. Dimensiunile sunt complet independente iar ca uniti de msur
se pot lua cele ntlnite n dimensiunea respectiv sau cele rezultate din agregri calculate
sau scenarii (exemplu cantitatea planificat, estimat, realizat.)
Nivelele unei dimensiuni formeaz o ierarhie obinut pe baza unor criterii de
agregare a datelor (exemplu clasa produs, ansamblu, subansamblu, repere , operaii).
Perspectivele multidimensionale asupra datelor se numesc hipercuburi de date.
n figurile 2.6, 2.7, 2.8, se pot vedea asfel de hipercuburi cu diferite dimensiuni i
cu membrii acestora. Msura poate constitui i ea o dimensiune a acestui cub.

Pagina 16 din 32
-- SISTEME SUPORT PENTRU DECIZII --

Beneficiar

tip
adres
cant.comanda
t Perioada
clasa
beneficiar Produs
tip
tipodimensiune

Fig.2.6 Fig.2.7

Beneficiar
A x .
Benef.n
0ra de n
Ju

B
0ra
y Benef.4
de
Ju
C Benef.3 depozitare
0ra Benef.2 transport
marcare
Benef.1 ambalare
P1 P2 P3 P4 Pn Produs
Timp Tip 1 Tip 2 Tip 2 Tip k produsee
Clasa 1 Clasa 2

Fig.2.8

Aceste hipercuburi permit posibilitatea de a face analize complexe i n timp


scurt, de a realiza o orientare n timp (time intelligense) adic exploatarea acestei
dimensiuni universale pentu a realiza comparri, analize i a emite apoi judeci. Exist
posibilitatea de a realiza o adresare multidimensional direct asupra cuburilor unitare a
aceluiai hipercub utiliznd n acest scop algoritmi de ultim or (genetici neuronali, tip
colonii de furnici etc.). Bazele de date multidimensionale folosite de OLAP pot stoca
straturi de date agregate dup diferite criterii i pe diferite nivele ierarhice.
Exemplu de transfer a datelor din depozite de date n structuri multidimensionale.
Datele de sintez stocate n depozitul de date, referitoare la totalul tranzaciilor cu
produse livrate lunar ctre diferii beneficiari, pot conine informaii referitoare la:
denumire produs, tip produs, tipo-dimensiune, pre, cod beneficiari, cantitate, data livrrii
(an/lun/zi), valoare medie. Date de sintez cu privire la beneficiari stocate n depozitul
de date pot conine: cod identificare beneficiar (denumire, adres : adic jude, ora,
strad, numr), total cantitate, nr. tranzacii, valoare medie. Datele de sintez stocate n

Pagina 17 din 32
-- SISTEME SUPORT PENTRU DECIZII --

baza multidimensional OLAP cuprinde informaii referitoare la : numr de tranzacii cu


produsele pe luni i pe benefiari, valoarea tranzaciilor cu produse pe luni i pe
beneficiar, nr de tranzacii cu produse i cu beneficiarii pe judee, orae.
Utilizat mpreun cu depozitele de date bazele de date multidimensionale OLAP
pot stoca straturi de date agregate dup diferite criterii ierarhice, precum i date statistice
precalculate fiecrui nivel de agregare.
Utilizarea limbajului de cercetare structurata (SQL)
Reprezint un limbaj standard pentru accesarea i manipularea datelor n
sistemele de management al bazelor de date relaionale. El este uor de manipulat
utiliznd o semantic asemntoare limbii engleze i const din mai multe straturi. SQL
este utilizat pentru accesarea on-line a bazelor de date, pentru managementul acestora i
executarea unor funcii de accesare i manipulare a datelor cu ajutorul unor produse
software pentru sisteme de management al datelor ( Oracle, DB2, Ingres i Supra).
SQL este un limbaj non-procedural i adaptabil oricarui utilizator, faciliteaz
integrarea programelor scrise n diverse limbaje iar comenzile lui au un format liber.
De exemplu, modific tabelul Angajati, adaug numarul de bonusuri este o
comanda ce const n modificarea unui tabel existent (numit Angajati) prin adaugarea
unei coloane numit Bonusuri. O solicitare de identificare a angajailor cu un salariu
lunar de peste 1000E este scrisa astfel: SELECT Nume, salariu FROM Angajai WHERE
Salariu > 1000
Exemple de comenzi SQL
Limbaj natural SQL
Listeaza toate achizitiile efectuate de SELECT PRODUSE ACHIZITIONATE PRET
CANTITATE FROM LISTA-ACHIZITII WHERE
A:S:E. ncepnd cu ianuarie 2000, n NUME-CLIENT EQ A.S.E. DATA ACHIZITIEI GE
termeni de produse, preuri i cantiti 01/01/2000

Listeaz preurile i cantitile SELECT PRET, CANTITATE VANDUTA FROM


PRODUSE WHERE NUME PRODUS EQ
calculatoarelor pe grupe de valori i firme CALCULATOR SI FIRMA EQ S.R.L SI iTARA EQ
din ar. ROMANIA
Limbajul MDX permite operarea asupra cuburilor utiliznd o semantic
asemntoare cu cea a limbajului SQL. Exemplu de sintax :
SELECT < specificator axa 1 > .. < specificator axa k >
FROM < specificator cub >
WHERE < specificator seciune (slice) >
Numrul de axe determin dimensiunile cubului, primele cinci axe avnd
denumirea de coloane, rnduri, pagini, capitole i seciune. Specificatorul de axe include
setul de membrii ai dimensiunii respective. Dac specificatorul pentru axa page lipsete
avem un cub bidimensional redus de fapt la o tabel pivot. Specificatorul seciune
prezint numele dimensiunii i membrul pe care se face seciunea transversal cu
specificarea subdimensiunilor ierarhice pn la rdcin.
Sistemul Microsoft permite pn la 63 de axe i o ax pentru msuri ce are un
regim special, nepermind nsumri ale proieciilor i reprezint o dimensiune vizibil.
Utilizarea unor instrumente inovatoare (de tip data mining,) pentru accesarea
datelor n bazele de date sau depozitele de date cresc eficiena utilizrii acestora.

Pagina 18 din 32
-- SISTEME SUPORT PENTRU DECIZII --

Data Mining este un instrument pentru a descoperi noi cunotine ntr-o baz de
date sau depozit de date. El include recunoaterea activitilor, extagerea acestor
cunotine, arheologia datelor, explorarea datelor, prelucrara structurilor de date, tipare
de prelucrare, colectarea datelor i analiza lor n scopul previziunii evoluiei lor n viitor.
Extragerea cunotinelor direct de utilizatori i realizarea dezideratelor de mai sus
utiliznd algorimi neuronali, genetici, sau de alt tip conduc la vitez sporit de prelucrare
i memorare. Principalele caracteristici ale tehnicii data mining sunt :
- posibilitatea de a exploata date adnci ngropate ;
- vizualizarea multidimensional a datelor ;
- descoperirea de noi date pe baza prediciilor i analizei arheolologice a datelor ;
- explorarea datelor se face direct de utilizatorul final care prin creativitate descoper
noi cunotine consistente ;
- prelucrarea prin analogie pentru explorarea datelor cu un volumul mare.
O serie de decizii importante, n aproape orice domeniu legat de afaceri i
societate, se bazeaz pe analiza unor baze de date complexe stocate n depozite de date i
care utilizeaz tehnici de data mining pentru regsiri i analize. Aplicaii ale exploatarii
datelor se fac n domeniul marketingului pentru a stabili clienii care vor rspunde unei
oferte, n afaceri bancare (estimarea nivelului mprumuturilor neperformante i a crilor de
credit utilizate fraudulos), n pobleme de programare a produciei, n comer pentru stabili
corect aprovizionrile funcie de vnzri, n companiile aeriene, n sntate s.a.m.d.

2.7 Microsoft SQL Server


2.8
Microsoft SQL Server reprezint un instrument software penru depozitele de date
i sistemul OLAP, fiind o aplicaie grafic care utilizeaz obiectele de asistare a deciziei
oferite de DSS. n figura 2.9 (/18 /) se d arhitectura depozitului de date i servicilor
OLAP incluse SQL server.
Managerul Olap este un mediu de lucru care permite utilizatorului printr-o interfa
(consola de management microsoft) s-i construiasc o soluie pe baza surselor de date
existente. Prin intermediul asistenilor (wizards) el permite construirea de noi cuburi
OLAP, modificarea structurii celor deja existeni sau a drepturilor de acces. Managerul
OLAP realizeaz un control asupra serverului OLAP i a metadatelor ce descriu stuctura
cubului
Modelele obiect pentru decizii (DSO) se construiesc pe baza cererilor furnizate de
utilizatori, a datelor existente n bazele de date relaionale sau baze de date
multidimensionale precum i a informailor din aplicaiile personalizate. SQL Server
utilizeaz depozitul de metadate (repository) pentru a stoca informaii despre obiectele
cu care lucreaz sevicile i instrumenele sale.
Depozitul de metadate este o component informatic complex ce cuprinde informaii
despre bazele de date, serviciul DTS, serviciul OLAP, modelul informaional al
instrumentelor (TIM), i modul de lucru pentru utilizatori.
Pentru accesul la date sistemul OLAP utilizeaz diferite tipuri de tehnologii, cele
mai cunoscute fiind ROLAP, MOLAP, HOLAP, WOLAP.

Pagina 19 din 32
-- SISTEME SUPORT PENTRU DECIZII --

Microsoft management Console


(MMC)

OLAP Add-in Manager Add_in personalizate

OLAP Manager Aplicaii personalizate

Obiect Model Metadate


(Decision support Objects) (DSO)

OLAP Server Sursa de date


Baze de date
( date multidimensionale )
Date ROLAP relaionale

Date HOLAP

Baze de date
multi-
Pivot table service dimensionale
Date MOLAP

SQL Server Fiiere


Aplicaii Client de date

Fig. 2.9 Arhitectura depozitului de date i a serviciului OLAP oferite de SQL Server

Prin intermediul tehnologiei ROLAP ce este o tehnologie relaional se


pot implementa structuri multidimensionale accesnd date din baze relaionale, dar
timpul de explorare poate fi uneori mare. Stocarea datelor se face n mai multe tabele
ntre care se stabilesc legturi logice prin cheia extern cheie primar. Primul produs
ROLAP a fost Metaphor 1984 / 18 /. Un asfel de produs are cteva caracteristici i
anume :
- existena unui generator SQL ce poate realiza operaii de selectare ;
- posibilitatea de a realiza clasificri, comparaii i calcule pe clase:
- descrierea modelului datelor prin metadate i posibilitatea interogrii n timp real;

Pagina 20 din 32
-- SISTEME SUPORT PENTRU DECIZII --

- utilizarea partajat a produsului.


Tehnologia MOLAP utilizeaz bazele multidimensionale asigur un acces rapid
la date, dar actualizri mai greoaie fiind necesare reconfigurri ale cuburilor. Organizarea
datelor se face sub form de hipercub i tehnologia permite felierea (slincing), decuparea
(dicing) a cubului, forarea adnc (drill down) sau sintetizarea (drow-up), pivotarea
(rotaia). Primul instrument a fost EXPRESS al firmei Oracle, au urmat apoi SYSTEM,
IMPROVE (IBM) i Tensor (Microsoft).
Tehnologia hibrid HOLAP realizeaz un compromis ntre cele dou stocnd
datele agregate de la nivelele inferioare n baze relaionale i cele de pe nivelele
superioare n baze multidimensionale. Dezavantajul acestei tehnologii este timpu l de
comutare ntre cele dou sisteme ROLAP i MOLAP. Un asfel de produs e PLATO-Microsoft.
Tehnologia WOLAP permite accesul la date prin intermediul browsrelor Web, iar
tehnologia Desktop OLAP permite analize i prezentri multidimensionale clienilor de
birou, utiliznd baze de date relaionale i multidimensionale.
Firme ce au utilizat cu succes aceste tehnologii n aplicaile lor, sunt Microsoft
(sun.com), Ford Motor CO(ford.com), Britich Airway(ba.com), Britich Petrolium
(bp.com).
Serverul OLAP constituie nucleul tehnologiei OLAP el extrage date din diferite surse le
sintetizeaz le agreg i le prelucreaz pentru a le stoca n baze multidimensionale n
vedera utilizrii lor ulterioare dar poate utiliza i date stocate n tabelele centralizatoare
ale sistemelor tranzacionale.
Tabelele pivot funcioneaz ca o interfa de conectaere la serviciile oferite de
OLAP- Server i ele pot exporta i importa date spre mediile clasice precum
Excel, Access. Ele faciliteaz crearea de cuburi locale utiliznd baze de date relaionale,
gestioneaz un cub o singur dat i nu includ SGBD-uri multidimensionale. Tabelele
pivot fiind sisteme de interogri dinamice pot reprezenta situaia la zi, i cheia succesului
este dat de alegerea tabelei pivot care corespunde cel mai bine cerinelor utilizatorului.
Utilizatorul prin intermediul interfeei poate fixa dimensiunile pe axe, subdimensiunile,
msurile i poate selecta anumite valori pentru acestea.
Serverul de analiz DSS pune la dispoziia utilizatorului obiecte ce constitue
suporturi de decizie i care pot fi utilizate apoi de serverul OLAP pentru aplicaii
orientate obiect scrise n limbaje precum Visual Basic, Java, C ++.
Serviciul Englich Query permite adresarea cererilor de ctre utilizatori n limbaj
natural, fiind capabil de a reinstaura informaiile lips prin suprapunerea acestori cereri
peste modelul semantic al depozitului, performanele lui depind de calitatea modelului.
Serviciul client este instalat n sistemul de calcul al utilizatorului i el utilizeaz
tabelele pivot care acceseaz serverul OLAP dar i alte tehnologii precum OLEDB
(object linking and embedding data base) i Active X Data Objects pentru a extrage
datele din bazele clasice i a le pune ntr-o memorie cashe pentru reutilizri viitoare (n
mod off- line).
SQL server introduce o serie de informaii referitoare la instrumentele sale
n depozitul de metadate mai exact n motorul de inferen a acestuia. Aceste informaii
se refer la : SGBD pentru datele operaionale, serviciul DTS, serviciul OLAP,
instrumente pentru utilizatorul final (serviciul de cereri i tabele pivot).

Pagina 21 din 32
-- SISTEME SUPORT PENTRU DECIZII --

Fiecare instrument conine un model informaional al instrumentului TIM care


memoreaz informaii referitoare la natura instrumentului a intrrilor i ieirilor sale i a
comportamentului acestuia.
Asfel spre exemplu modelul informaional al serviciului de curare i
transformare a datelor DTS conine un obiect principal ce memoreaz informaii despre
procesele de achiziii, de export i de transformare a datelor precum i obiecte de tip
conexiune, task, sau control. Obiectul de tip conexiune asigur interfaa cu sursa sau
destinaia datelor prin calea de transport OLDB. Obiectele de tip task sunt programme
care realizeaz operaii asupra datelor furnizate de obiectele de tip conexiune. Obiectele
de tip control supervizeaz controlul asupra DTS, verificnd restriciile i modul de
nlnuire a taskurilor. Utilizatorul are acces la DTS prin interfaa grafic DTS designer,
asistenii DTS, interfaa de programe DTS, i are posibilitatea de a modifica chiar n
structura DTS.

2.8 Vizualizarea datelor i multidimensionalitatea

Vizualizarea datelor se refer la instrumentele utilizate pentru vizualizarea


informaiilor. Acestea pot include imagini digitale, sisteme de informare geografic,
interfee grafice, multidimensiuni, tabele i grafice, realitate virtual, prezentri
tridimensionale i animaie.
Analiza vizual, permite descoperirea unor noi aspecte datorit unei comunicri
mai mai eficiente cu utilizatorul. Uneori pentru a obine o pertinen mai bun a
prezentrii informaiilor se pot utiliza i combinat aceste instrumente. Existena unui
depozit de date sau a unui server multidimensonal faciliteaz procesul de vizualizare.
Multidimensionalitate. Utilizarea acestui concept n prezentarea
multidimensional, const n faptul c datele pot fi organizate pe subiecte, domenii n
concordan cu doleanele factorilor decizionali de pe diferitele nivele de decizie ale
sistemului, pot fi percepute uor i obinute rapid i ofer perspective diferite asupra
acelorai date, permind luarea de noi decizii eficiente.
Cei trei factori importani ce caracterizeaz multidimensionalitatea sunt:
dimensiunea, unitatea de msura i durata n timp.
Exemple de dimensiuni: produse, tipuri de furnizori, segmente de piaa, uniti
de afaceri, locaii geografice, canale de comunicaie, firme de distribuie.
Exemple de uniti de msura: bani, volumul vnzrilor, numarul de angajai,
profit dup inventariere, actual faa de cel previzionat.
Exemple de durate de timp: zilnic, sptmnal, lunar, semestrial sau anual.
De exemplu dac un manager va dori sa stie vnzrile unui produs, ntr-o anumit
zona geografic, realizate de un anume vnztor, ntr-o anumit lun, n uniti vndute,
sau pe sorto- tipodimensiune atunci utilizatorul folosind un program de cercetare
conceput pentru multidimensionalitate va primi rapid rspunsul. In oricare dintre cazuri,
utilzatorul poate naviga prin multiplele dimensiuni i nivele de date, prin tabele i
grafice i poate face interpretri rapide referitoare la modificri semnificative, evoluii
importante sau nivele de alert.
Ca dezavantaeje ale multidimensionalitii menionm:
Spaiu de memorie mai mare cu pn la 40% i preuri cu 50% mai mari fa de
produsele relaionale standard.

Pagina 22 din 32
-- SISTEME SUPORT PENTRU DECIZII --

Necesitatea unor resurse considerabile i un timp mai mare pentru popularea bazelor
de date multidimensionale funcie de volumul de date i numrul de dimensiuni.
Crearea interfeelor i mentenana acestora necesit un efort mai mare de resurse.
Multidimensionaliatea este disponibil n diverse grade de complexitate i utilizat n
diverse aplicaii cum ar fi monitorizarea piloilor, sisteme de cercetare ale bazelor de
date etc. Adrese utile sunt (http://www.pilotsw.com, http://www.brio.com ).
Pentru vizualizarea tridimensional exist o serie softuri precum ADIVZOR Solutions la
adresa (advizorsolutions.com) utilizat n conexiune cu web-ul, ANALYTICA
(lumina.com), ENDECA (endeca.com) ce permit o analiz vizual interactiv, ILOG
Visualisation Suite (ilog.com) pretabil pentru analiz vizual la volume mari de date.
Principalele tipuri de instrumente utilizate n exploatarea datelor sunt:
Argumentaie bazat pe cazuri anterioare. Utiliznd cazuri istorice, argumentaia
bazat pe acestea poate fi folosit pentru recunoaterea anumitor modele( abloane).
Cazurile noi pot fi identificate rapid cu unul din cele existente n depozitele de date,
informaiile fiind corecte n proporie de aproximativ 90%.
Estimare neuronal este un tip de abordare mecanic prin intermediul careia datele
istorice pot fi analizate n scopul gasirii unor modele. Cercetnd date istorice pot fi
identificai, de exemplu, potenialii clieni ai unui nou produs sau pot fi relizate
previziuni priviind evoluia unor companii.
Agentii inteligeni permit gsirea informaiilor n baze de date externe ntr-un mod
pertinent i eficient.
Alte instrumente includ arbori decizionali sau algoritmi genetici.
Concluzii
Datele necesare luarii deciziilor provin dintr-o serie de surse att interne, ct i
externe. Datorit faptului c sistemele de administrare a bazelor de date constituie o
component major a sistemelor de susinere a procesului decizional, este important ca
utilizatorii s cunoasc cele mai noi inovaii n domeniu. Organizaiile recunosc c
datele de care dispun conin informaii deosebit de importante care trebuiesc explorate.
Prin urmare, aceste DSS depoziteaz i exploateaz date pentru ca utilizatorii s poat
obine informaiile personal (prin intermediul unor instrumente de analiza
multidimensionala i noi arhitecturi ale sistemului intregiiorganizaii) i s stabileasc
legturi pe care iniial nu le cunoteau (pe baza exploatrii datelor). Instrumentele
procesarii analitice on-line fac posibil analiza on-line a datelor pentru identificarea
problemelor i oportunitilor. Abordarea orientat pe obiect n analiza, crearea i
implementarea sistemelor poate reprezenta o incredibil oportunitate pentru o
reprezentare simplificat a sistemelor, o data cu reutilizarea mai multor coduri. O larg
varietate de formate de date este accesibil simultan cu dezvoltarea i desfurarea
sistemelor de administrare a bazelor de date multiledia. Internet-ul i intranet-ul, prin
intermediul browserelor web, alaturi de web- hooks, furnizeaz interfee universale,
prevzute cu capaciti de formulare a unor solicitri asupra sistemelor de baze de date
(mpreun cu majoritatea pachetelor de aplicaii). Nu n ultimul rnd, metodele bazate
pe inteligena artificiala pot fi utilizate la imbuntirea analizei i organizrii datelor.

2.9 Studiu de caz

Pagina 23 din 32
-- SISTEME SUPORT PENTRU DECIZII --

n cadrul acestei aplicaii ne propunem s utilizm modelul multidimensional al


datelor i instrumente de analiz OLAP pentru managementul activitii de vnzare din
cadrul firmei S.C. Componente de Asamblare S.A, firm ce produce i comercializeaz
componente de asamblare n special pentru industria auto . ntr-o prim faz s-a creat o
baz de date ce permite gestionarea informaiilor primare ce se folosesc n cadrul
activitii de vnzare din cadrul firmei. Pe baza acestei baze de date s-a creat ulteror un
depozit de date ce permite modelarea i vizualizare datelor n dimensiuni multiple i care
reprezint sursa de date pentru o analiz OLAP. Analiz cu ajutorul cubului OLAP,
permite managerilor firmei de a lua cele mai bune decizii pentru sporirea vnzrilor de
componente. nstrumentul soft utilizat a fost utilitarul Microsoft Access.
Realizarea aplicaiei cuprinde mai muli pai i anume:
1. Crearea bazei de date n Microsoft Access
n scopul creerii bazei de date s-au folosit urmtoarele tabele:

PRODUS(codprodus, denprodus, um, pre)


SOCIETATECLIENT (codclient, denclient, codfiscal, adres, email, tel)
ANGAJAT (marcaangajat, nume, prenume, dep, comision)
VNZARE (codvnz, codfactura, marcaangajat)
FACTUR (codfactur, rndfactur, datavnz, angajat)
RNDFACTUR (nrrndfactur, produs, cant)

unde codprodus, codclient, marcaangajat, codvnz, codfactur, nrrndfactur


reprezint chei primare.
Modul de legtur ntre tabele se urmrete pe ecranul 1:

Pagina 24 din 32
-- SISTEME SUPORT PENTRU DECIZII --

2. Crearea modelul multidimensional al datelor (depozitul de date)

Avnd drept surs baza de date creat anterior, s-a construit depozitul de date, ce
permite modelarea i vizualizarea datelor n dimensiuni multiple. Modelul este definit
prin dimensiuni i fapte.
n acest caz, dimensiunile luate n considerare sunt:
1. Dangajat ce caracterizeaz persoana care se ocup de un anumit contract;
2. Dprodus care descrie produsele ce sunt comercializate;
3. Dsocietateclient prezint atribute legate de clienii firmei;
4. Timp ce poate avea dou nivele de ierarhizare lun i an.
Fiecare dimensiune are un tabel asociat numit tabel dimensiune.
Faptele au de asemenea un tabel asociat reprezentat n acest caz de tabelul
Situaievnzri. Faptele sunt valori numerice care reprezint subiectul analizei noastre
viitoare. Ele sunt implicit definite prin combinaia elementelor dimensiunilor. Msurile
considerate n cazul nostru sunt: valoare vnzri i valoare comision.
Tabelul fapte conine, de asemenea, coduri de legtur cu tabelele dimensiune:
codvnz, codfactur, marcaangajat, codprodus.
Legtura dintre tabelele dimensiune i tabela fapte este o structur de tip stea. Ea
conine tabelul central care este tabelul de fapte, cu un volum mare de date i o mulime
de tabele dimensiune dispuse n jurul lui.Modelul pentru problema de management a
activitii de vnzare n cadrul firmei S.C. Organe de Asamblare S.A. este urmtorul
(ecranul 3)

3. Analiza modelului multidimensional prin operaii OLAP

Pagina 25 din 32
-- SISTEME SUPORT PENTRU DECIZII --

Modelul construit este quadruplu, el permind analize penru diferite combinaii


ale acestor dimensiuni, precum i obinerea de vizualizri ale datelor existente sau
calculate.
S-au realizat o serie de analize n cadrul Microsoft Access cu ajutorul cubului
OLAP, analize specifice managementului activitii de vnzare n cadrul unei firme
Spre exemplu dac managerul de pe un anumit nivel ierarhic din cadrul firmei
este interesat de performanele angajailor si, atunci el va realiza o analiz ce arat
valoarea vnzrilor efectuat de un anumit angajat, structurat pe produse i pe
firmele crora le-a vndut aceste produse. n ecranul 3 se poate urmri acest lucru.

Dimensiunile selectate sunt codprod i codsocietate, iar ca filtru (o alt


dimensiune) marcaangajatului. Faptele reprezint n acest caz valoarea vnzrilor.
O astfel de analiz se poate realiza pentru fiecare angajat n parte. Comparnd
rezultatele se poate evidenia care sunt angajaii cu cele mai bune performane, respectiv
cele mai slabe i i lua n consecin msurile de rigoare (recompensa celor mai buni sau
penalizarea celor mai slabi).
Dac privim aceast analiz din punctul de vedere al angajatului, acesta ar putea fi
interesat de identificarea acelor produse a cror vnzare i aduc cele mai mari comisioane.
Astfel, se poate realiza pentru fiecare produs o analiz care s arate valoarea comisionale
obinute de toi agenii de la fiecare societate, ca n ecranul 4:

Pagina 26 din 32
-- SISTEME SUPORT PENTRU DECIZII --

Marcaangajat i codsocietate reprezint dimensiuni, codprodus dimensiune


filtru, iar valoarea comisionului faptele.

Managerii ce lucreaz pe vnzri sunt direct interesai de valoarea total a


vnzrilor, pentru a vedea care este evoluia firmei (recompunere dimensiunea timp roll-
up). n exemplul urmtor s-a realizat un tablou complet al vnzrilor, n funcie de produs
i de societatea care a achiziionat acele produse:

Pagina 27 din 32
-- SISTEME SUPORT PENTRU DECIZII --

Codsocietate, codprodus i datavnz reprezint cele trei dimensiuni, iar valvanz,


faptele.
Managerul poate fi interesat nu numai de valoarea vnzrilor n general, ci de
valoarea vnzrilor ntr-o anumit perioad (descompunerea dimensiunea timp pe nivele
ierarhice roll down). Astfel n exemplul urmtor, s-a evideniat care este situaia
vnzrilor pe anul 2008:

Pagina 28 din 32
-- SISTEME SUPORT PENTRU DECIZII --

Pentru a realiza aceast analiz s-a procedat ca i n exemplul precedent, numai c


s- a folosit ca filtru data, iar anul ales a fost 2008.
Un manager trebuie s tie care sunt vnzrile pe fiecare produs n parte, pentru a
putea decide a mri sau micora producia dintr-un anumit produs. n acest sens, s-a
realizat o analiz OLAP n care putem observa pentru fiecare produs n parte care au fost
vnzrile, structurate pe societile cliente i agenii ce au realizat respectivele vnzri.
Dimensiunile luate n calcul au fost: codprodus, codsocietate, respectiv codprodus
filtru, iar faptele valoarea vnzrilor.

Pagina 29 din 32
-- SISTEME SUPORT PENTRU DECIZII --

4. Concluzii
irul exemplelor de astfel de analize poate continua, ns n prezentare s-au selectat
cteva considerate ca fiind reprezentative. Exemplificarea modulului de realizare al
acestor analize cu ajutorul cubului OLAP, are n vedere deciziile . Modelarea
multidimensional este o tehnic ce prezint importan ntruct permite conceptualizarea
i reprezentare aspectelor cantitative ale activitii de analizat n strns legtur cu
contextul n care s-au desfurat, unde prin context nelegem principalii parametrii care
caracterizeaz activitatea: cine a iniit-o, cine a executat-o, cine a fost beneficiarul, ce
resurse au fost utilizate, ce structuri organizatorice au fost implicate, etc. Mai mult,
permite o descompunere, respectiv recompunere pe nivele , precum i o agregare a
datelor ntr-o structur simpl i flexibil.

Bibliografie

1. Agosta, L. The data strategy adviser: the year ahead-data warehousing trends, DM
Review, vol. 16 nr.1, january. 2006.
2. Akbay,S. Data warehousing in real time Business Intelligence Journal, vol.11, nr.1,
2006, quarter 1.
3. Ariyachandra,T., Watson, H., Key factors in selecting a data warehouse arhitecture
Business Intelligence Journal vol. 10, nr.2, 2006, jan.

Pagina 30 din 32
-- SISTEME SUPORT PENTRU DECIZII --

4. Brath, R., Peters, M., Visualisation spreadsheets, DM Direct, 2oo6 january.


5. Filip, F.G., Decizii asistate de calculator, Editura Tehnic, Bucureti 2005.
6. Gazella, J. Overstock.com meets high volume High Performance Real Times Data
transformation, needs with beinopsis, DM Review jan., 2006 (shareholder.com)
7. Gray, P., Watson, H.J., Decision support in data warehousing, Prentice Hall, 1998.
8. Hwang, M., Xu, H., A survey of data warehousing success issues, Bussiness
Intelligence Journal, vol. 10, nr. 4, 2005, Fall.
9. Hoffer, J. A., Prescot, M.B., McFadden, F.R. Modern data base management
Upper Scadle River, N.J, Prentice Hall, 2007 8th. Edition.
10. MicroStrategy, The5 styles of buissness intelligence 2006 adresa
(microstrategy.com/Solutions/5Styles/enterprise_reporting.asp)
11. Patel, J., Seven simple rules for succesful real times business intelligence, DM
Review, 2005, May.
12. Pun, M., Hartulari, C., Analiza diagnoza i evaluarea sistemelor din economie,
Editura ASE., Bucureti 2004.
13. Schleger,.K, Web analitics essentials InternetWorld 2003, june.
14. Seen, A., Metadata management: past, present and futures, Decision Support
Systems vol. 37, nr.1, 2004, april.
15. Seen, A., Sinha, P., A comparasion of data warehousing methodoligies,
Communication of ACM. vol.48, nr.3, 2005.
16. Turban, E., Aronson, J.E., Decisions support and bussiness intelligence systems,
Prentice Hall, edition, 2008, 2005 ,2001.
17. Vduva, A., Vettereli, T. Metadata management for data warehousing an overview
International Journal of Cooperative Information Systems, vol. 10, nr. 3, 2001, sept.
18. Zaharie, D., Albescu, F., Bogdan, I., Ivancenco, V., Vasilescu, C., Sisteme
informatice pentru asistarea deciziei, Editura Dual The, 2001 Bucureti.
19. Zaho, X., Meta data management maturity model, DM Direct Newsletter, october
2005.
20. Werner,V., Abraham, C., Managing clickstream data Journal of Data Warehousing,
vol. 6, nr. 3, 2001.

Pagina 31 din 32
-- SISTEME SUPORT PENTRU DECIZII --

Legtura ntre metadate i date se face prin tabele bitmap. Acestes conin cte o coloan
pentru fiecare membru al dimensiunii, i cte un rnd pentru fiecare nregistrare care
stocheaz valorile binare i care au valoarea 1 n dreptul biilor asociai membrilor
dimensiunii ce se gsesc n nregistrare. Vor fi selectate din tabela de msuri, doar
nregistrrile ce au un bit 1 n poziia corespunztoare biilor din masc. Tabelele bitmap
sunt greu de construit i se bazeaz pe dimensiuni cu un numr fix de membrii. Masca de
interogare se construiete prin exploatarea structurii ierarhice a metadatelor, de unde se
extrag seturile de membrii ai dimensiunilor, indicai prin specificatorii de axe. Pe baza
setului de adrese de nregistrri, care se suprapun cu tiparul mtii, se face adresarea
direct a tabelei de msuri, de unde se preiau valorile care se centralizeaz cu
dimensiunile cubului.
Se exemplu vrem s selectm toate mainile vndute n luna martie din anul 2008 n
Bucureti de firma Renault. Tabela bitmap i masca de interogare se vd n tabelul 2.1

Exploatarea datelor la Marriott


Compania s-a decis sa identifice acei clieni care erau mai pasibili de a raspunde
reclamelor lor. In acest mod au redus foarte mult corespondena trimis i au mbuntit
procentul de rspunsuri. Marriott utilizeaza in exploatarea datelor tehnologia de
estimare neuronal al carei obiectiv este sa detecteze anumite modele repetitive prin
combinarea listelor de clieti.
Explorand un tezaur cu nregistrari de maini, nregistrari de proprieti, cari de
credit i liste de persoane care au cumprat prin mail, un program informatic
imbogeste lista anselor de a rspunde la reclame. Adaug o serie de factori precum
vrstele clienilor, vrstele copiilor, venitul estimat, tipul de maini pe care le conduc i
dac joaca sau nu golf. Sistemul Marriott identific apoi care clieni vor raspunde cel
mai probabil la reclamele trimise prin mail. Exploatarea datelor a sporit cu 33% rata
rspunsurilor primite de la clieni n urma trimiterii reclamelor pe aceste filiere.

Pagina 32 din 32