Sunteți pe pagina 1din 30

DECIZIE ASISTATA DE CALCULATOR; CONCEPTE,

METODE I TEHNICI PENTRU


DECIZIILE CENTRATE PE ANALIZA DATELOR
F. G. Filip
Academia Rma!a "i I!#$i$%$%l !a&i!al de ce'ce$a'e(de)*l$a'e +!
i!,'ma$ica(ICI
Re)%ma$. Analza datelor constitue o etapa initiala importanta in luarea
deciziilor. Ea permite identificarea cauzelor care duc la aparitia unei situatii
decizionale. Acest al doilea articol al unei serii dedicate prezentarii
conceptelor i solutiilor din domeniul deciziei asistate de calculator face o
trecere n revista a unor rezultate recente privind magaziile de date,
prelucrarea analitica on-line i mineritul datelor. Acestea reprezinta
tehnologii noi si in plina dezvoltare, care au atras atentia in primul rand a
marilor firme producatoare de produse informatice.
-. I!$'d%ce'e
ntr-un articol anterior(Filip,2!, au fost prezentate c"teva metode de
asistare a proceselor decizionale n care pozi#ia central$ era ocupat$ de
intui#ia i %udecata uman$. &ot n acel capitol, s-a afirmat c$, acele metode, n
care caracterul calitativ predomin$, necesit$ de multe ori efectuarea unei
analize a datelor. 'copul acestui articol este de a face o prezentare sistematic$
a principalelor concepte i rezultate n domeniul asist$rii cu mi%loace
informatice a acelor activit$#i din procesul decizional care presupun analiza
datelor. Este vor(a de trei concepte i anume) a! magaziile(sau depozitele) de
date (Data warehouse DW); prelucrarea analitic on line (On line
analytic processing OLAP) i c! mineritul datelor (Data mining D),
denumit uneori descoperirea cuno!tin"elor (#nowledge data disco$ery
%DD)&
*a#iunile care au condus la alegerea con#inutului acestui articol privesc
at"t continuitatea prezent$rii c"t i, mai ales, efervescen#a domeniului a(ordat.
ntr-adev$r, dup$ cum s-a ar$tat mai sus, metodele i tehnicile care urmeaz$ a
fi prezentate n acest articol au ca scop facilitarea proceselor decizionale n
+
care intui#ia i %udecata sunt prevalente i au i au uneori nevoie de un suport
informa#ional. n ceea ce privete dezvoltarea puternic$ a domeniului, n
special n partea a doua a ultimei decade scurse, se o(serv$ un interes ma%or i
o competi#ie acer($ din partea marilor produc$tori de tehnologii informatice.
Acestea au contientizat limitele sistemelor actuale de gestiune a (azelor de
date n conte,tul schim($rilor petrecute (i oportunit$#ilor ap$rute! n modul
de administrare a ntreprinderilor i afacerilor, care presupune considerarea
c"t mai operativ$ a unei multitudini de surse informa#ionale diverse.
n continuare, articolul este organizat dup$ cum urmeaz$) -apitolul 2
a(ordeaz$ pro(lematica magaziei de date. .agazia de date este un concept
afirmat la nceputul anilor /0 i este definit$ prin analogie cu depozitele de
(unuri industriale. -a i acestea, magazia de date este alimentat$ dintr-o
multitudine de (aze de date care au meniri diverse n scopul com(in$rii
elementelor intrate n magazie ntr-un 1pachet2 integrat, care con#ine elemente
verificate. .ai nt"i (n su(capitolul 2.+.!, se evoc$ o ta,onomie vizionar$
(propus$ cu peste dou$ decenii n urm$! a instrumentelor informatice de
asistare a deciziilor, urmat$ de enumerarea tipurilor de date folosite n
administrarea i func#ionarea unei organiza#ii i de prezentarea necesit$#ii
noului concept. 'u(capitolul 2.2. prezint$ caracteristicile definitorii generale
ale magaziei de date i descrie c"teva tipuri particulare.
-apitolul 3. este dedicat sistemelor de prelucrare analitic$ on 4 line
(56A7!. 56A7 este instrumentul informatic care permite realizarea
1pachetului2 de date plec"nd de la surse diferite i livrarea informa#iilor n
forma solicitat$ pentru luarea deciziei. 'e prezint$ mai nt"i (n su(capitolul
3.+.! defini#ia dat$ de -odd, care a inspirat, 1micarea 56A72, tipurile
func#ionale i 8testul FA'.92, care poate califica un produs informatic n
categoria 56A7. n continuare, su(capitolul 3.2. con#ine o descriere a
principalelor dou$ direc#ii tehnologice i anume) a! 'azele de date
multidimensionale (ultidimensional data 'ases D(! i solu"iile
2
rela"ionale OLAP ()elational*OLAP )OLAP! denumite uneori 156A7-pe-
relational2. 9deile 56A7 au 1r$d$cini2 vechi i acestea se evoc$ n
su(capitolul 3.3.
-apitolul :. trece n revist$ defini#iile i tehnicile folosite n mineritul
datelor.
-apitolul ;., care ncheie acest articol, con#ine unele comentarii privind
domeniul instrumentelor de asistare a deciziilor centrate pe date i recomand$
c"teva surse importante de documentare (n special pe 9nternet!, care sunt n
curs de continu$ m(og$#ire.
Articolul de fa#$ are o orientare mai pronun#at$ dec"t cel
anterior( Filip,2! c$tre tehnologiile informatice. El este recomandat n
primul r"nd analitilor i facilitatorilor proceselor decizionale.
.. Ma/a)ii de da$e
.agazia (sau depozitul! de date reprezint$ un nou care vizeaz$
asistarea proceselor decizionale n conte,tul noilor cerin#e de administrare a
organiza#iilor folosind analiza a c"t mai multe informa#ii provenind din surse
diferite.
..-. E*l%&ii +! a#i#$a'ea deci)iei ce!$'a$e pe da$e
Asistarea deciziei centrat$ pe date au un caracter normativ relativ
sc$zut. -aracteristica sa esen#ial$ const$ n furnizarea la timp a informa#iilor
cerute de decident n activit$#ile sale (azate n primul r"nd pe intui#ie i
%udecat$ pentru rezolvarea pro(lemei decizionale.
..-.-. O *i)i%!e $imp%'ie
6a sf"ritul anilor /<, Alter (+0<<, +0=!, n ncercarea sa de a realiza
o clasificare a instrumentelor i sistemelor informatice folosite n acea vreme
pentru asistarea deciziilor, a%ungea la concluzia c$, cel mai util criteriu de
3
clasificare este 1gradul n care rezultatele furnizate de produsul informatic
poate determina +n mod direct decizia2, sau, altfel spus, 1gradul n care ieirile
sistemului implic$ o ac#iune >efectiv$?2. Alter distingea apte clase, pe care le
propunea n ordinea cresc$toare a gradului de normativitate. Aceste clase
variau de la sistemele de tip 1sertare cu dosare2 (cele mai 1pasive2!, la
modelele computerizate care sugereaz$ direct decizia (cele mai 1normative2!
n cazul unor situa#ii decizionale (ine structurate. -ele apte clase se grupau
n final n dou$ superclase) a! sistemele informatice 1orientate c$tre date2 i
(! sistemele 1orientate c$tre modele2. .etodele i tehnicile care corespund
celei de a doua superclase vor fi descrise n capitolele : 4 < care urmeaz$.
9nstrumentele orientate c$tre date ndeplinesc func#ii de reg$sire a
datelor i@sau de analiz$ a datelor. 7rincipalele clase identificate de Alter
(+0<<! sunt prezentate n continuare)
+. ,istemele de tip -sertar cu dosare., care au ca scop automatizarea unui
mod de lucru manual i servesc la accesul on-line la anumite date. Ele sunt
destinate persoanelor cu sarcini opera"ionale (func#ionari, efi de ateliere!
care au nevoie de a avea acces imediat la valoarea curent$ a anumitor
varia(ile. Ae e,emplu, un ef de atelier, atunci c"nd dorete s$ lanseze o
anumit$ lucrare pentru a suferi o prelucrare mecanic$, are nevoie s$
cunoasc$ situa#ia curent$ a nc$rc$rii mainilor unelte din atelier. n acelai
mod, patronul unui magazin tre(uie s$ cunoasc$ nivelul stocurilor
produselor aflate n depozit sau 1la raft2 pentru a lansa comenzi de
aprovizionare.
2. ,isteme pentru analiza datelor, care a%ut$ personalul cu sarcini de spri%in
al conducerii n analiza fiierelor cu date curente i istorice cu scopul de a
produce rapoarte pentru manageri. 17rodusele generalizate2 permit analize
cu caracter general folosind datele e,istente ntr-o (az$ de date i chiar
formularea i programarea unor modele matematice simple. -a e,emple,
:
se pot enumera rapoartele privind stadiul de realizare a unor comenzi de
fa(rica#ie, sau analiza eficien#ei unor investi#ii.
3. ,istemele pentru analiza in/orma"iilor, care asigur$ accesul la o serie de
(aze de date destinate asigur$rii informa#ionale a deciziilor i la modele de
dimensiuni reduse n scopul furniz$rii informa#iilor specifice pentru
rezolvarea unor situa#ii decizionale particulare. Aup$ cum ar$ta Alter
(+0<<!, sistemele din aceast$ clas$ 1sunt proiectate s$ e,trag$ datele
relevante din aplica#iile de prelucrare electronic$ a datelor (0lectronic data
processing 0DP! proprii ale ntreprinderii i s$ le completeze cu date
e,terne2. 5 caracteristic$ definitorie a unor astfel de sisteme o constituia
faptul c$ accesul nu tre(uia s$ fie st"n%enit de considerente privind
planificarea func#ion$rii eficiente a unui centru de calcul. Aup$ cum se va
vedea n continuare n acest capitol, sistemele din categoria 3 anticipeaz$
din punct de vedere func#ional dezvolt$rile tehnologice ale anilor /0 n
domeniul magaziilor de date i n realizarea de instrumente de tip 56A7
sau 01, (02ecuti$e in/ormation systems!.
..-... Tip%'i de da$e
nainte de a analiza tipurile de date care se acumuleaz$ ntr-o
organiza#ie cu o vitez$ din ce n ce mai mare, se va ncerca o foarte sumar$
clarificare a con#inutului unor no#iuni, care sunt, de multe ori, folosite n mod
amestecat. Este vor(a de date, in/orma"ii i cuno!tin"e. F$r$ a avea preten#ia
unei a(ord$ri aprofundate, f$cute din mai multe perspective (teoria
comunic$rii, tiin#ele cognitive, tiin#a organiz$rii, tiin#ele politice, literatura,
informatica!, precum cea propus$ de *oBleC (+0==!, se vor adopta n
continuare urm$toarele n#elesuri care sunt asem$n$toare cu cele propuse de
&ur(an i Aronson (+00=! i &argett (+00D!.
+. Datele sunt 1urmele2 l$sate de anumite o(iecte (evenimente, st$ri, situa#ii
sau activit$#i petrecute sau anticipate, procese de calcul, %udec$#i, opinii
;
etc.! care pot fi reprezentate su( forma unor numere, iruri de caractere,
grafice, sunete sau imagini statice (fotografie! sau n micare (video! n
vederea colect$rii, memor$rii i altor prelucr$ri ulterioare. 6uate ca atare,
n conte,tul unei anumite pro(leme, datele pot s$ nu ai($ un n#eles care ar
putea servi unei activit$#i decizionale.
2. 1n/orma"iile sunt acele date care sunt luate n considerare i sunt organizate
n aa fel nc"t au un n#eles i o valoare n conte,tul pro(lemei
decizionale i i sunt de folos utilizatorului pentru rezolvarea sarcinii sale.
3. 3uno!tin"ele sunt acele date organizate i prelucrate astfel nc"t
favorizeaz$ n#elegerea unui anumit domeniu c"t i identificarea i
rezolvarea eficace a pro(lemelor din domeniul respectiv.
n continuare, se va urm$ri folosirea termenului cel mai potrivit, dar pot
ap$rea situa#ii n care denumiri ncet$#enite de%a n literatur$ nu sunt aparent
n concordan#$ cu accep#iunile adoptate mai sus.
&ur(an i Aronson (+00=! identific$ mai multe tipuri de date care se
acumuleaz$ ntr-o organiza#ie i anume)
+. Aatele interne se refer$ la resursele organiza#iei (umane, tehnice,
financiare etc.! i procesele, evenimentele i activit$#ile desf$urate n acea
organiza#ie. ntr-o organiza#ie informatizat$, aceste date sunt stocate de
o(icei n diferite (aze de date care servesc n aplica#ii distincte.
2. Aatele e2terne privesc mediul ncon%ur$tor (natural, economic, social, de
reglement$ri! n care organiza#ia i desf$oar$ activitatea i pot avea
surse diferite precum) mi%loacele de informare n mas$, opiniile
comunicate de c$tre clien#i i parteneri, (i(liotecile specializate sau
generale, 9nternetul i serviciile diferite de ($ncile de date.
3. Aatele care apar"in unor persoane anga%ate n organiza#ie i pe care
acestea le folosesc n interesul organiza#iei.
7rincipalele pro(leme generale care pot ap$rea n ceea ce privete
con#inutul datelor au fost semnalate de Alter (+0=! i sunt legate de
D
imprecizia, incompletitudinea, indisponi(ilitatea sau chiar ine,isten#a
(deoarece nu le-a cerut nimeni! acelor date care sunt considerate necesare la
un moment dat. E,plozia informa#ional$ asociat$ cu multiplicarea i
diversificarea surselor au condus n ultima vreme la alte tipuri de complica#ii
precum) opacitate (supraa(unden#$ a datelor disponi(ile asociat$ cu
nerelevanta lor pentru sarcinile de rezolvat!, con#inut contradictoriu i formate
incompati(ile datorit$ platformelor diferite pe care datele se stocheaz$.
Acestor complica#ii li se adaug$ pro(lemele de natur$ tehnologic$ care vor fi
e,puse n continuare.
..-.0. Ra&i%!i $e1!l/ice
Apari#ia conceptului de magazie de date este %ustificat$ prin limitele
sistemelor de prelucrare on line a tranzac"iilor (On line transaction
Processing OL4P! . Acestea nu pot furniza cu promptitudinea cerut$ i n
formatul dorit c$tre manageri acele informa#ii care le sunt necesare. Ae cele
mai multe ori, este vor(a de informa#ii care servesc la verificarea unor ipoteze
nl$n#uite considerate n rezolvarea pro(lemelor decizionale. Aceste informa#ii
se pot o(#ine (n ma%oritatea cazurilor! din analiza unor serii de timp diferite,
care se g$sesc n (aze de date distincte. n contrast cu 1datele opera#ionale2,
pe care le manipuleaz$ sistemele de tip 56&7, cerin#ele decidentelor se
numesc n terminologia 9E. (+00D! 1date informa#ionale2.
-"teva motive pentru o a(ordare nou$ sunt date n continuare (Ahar,
'tein, +00<F 9E., +00DF &ur(an, Aronson, +00=!. n primul r"nd, sistemele de
tip 56&7, sunt specializate pe tipuri de pro(leme, de e,emplu conducerea
produc#iei, efectuarea de tranzac#ii comerciale etc. 7rin firea lucrurilor, ele au
ca misiune principal$ manipularea rapid$ i sigur$ a datelor i sunt denumite
uneori sisteme cu misiune critic$, sau 1cu timp critic2 (1mission@time critical
sCstems2!. 7entru a asigura performan#ele cerute i, uneori, din motive
istorice sau de securitate, ele nu sunt proiectate pentru a lucra n cooperare cu
<
alte sisteme. n consecin#$, cu toate progresele tehnologice relative privind
1integrarea aplica#iilor2 (Filip, E$r(at, +000!, realizarea de misiuni
suplimentare ca de e,emplu cele de furnizare de informa#ii c$tre manageri,
altele dec"t cele originare, poate reprezenta o pertur(a#ie inaccepta(il$, care
poate impieta asupra performan#elor proceselor conduse cu astfel de sisteme.
Alte motive care indic$ sistemele de tip 56&7 ca neadecvate pentru nevoile
managerilor sunt legate de) a! limitarea datelor manipulate de aceste sisteme
la valorile curente necesare ndeplinirii misiunii lor i (! aspectele de
securitate n cazul 4 din ce n ce mai r$sp"ndit al produc#iei glo(alizate 4 n
care diferitele (aze de date sunt distri(uite din punct de vedere geografic.
Aac$ se analizeaz$ pro(lema din punct de vedere al instrumentului
informatic care administreaz$ (aza de date se pot o(serva alte complica#ii.
ntr-o organiza#ie e,ist$ 1sisteme motenite2(1legacC sCstems2! care sunt
realizate prin folosirea unei diversit$#i de sisteme de gestiune a 'azelor de
date (,5(D) (Aate, +0=DF Glman, +0=2!. Acestea sunt fie mai vechi (inde,at
secven#iale, de tip re#ea, ierarhice!, fie mai noi (rela#ionale, orientate pe
o(iecte!, sau specializate (de e,emplu pentru lucrul n timp real, pentru
stocarea de date multimediale etc.!. 6a ora actual$ predomin$ 'HEA de tip
rela#ional, care permit efectuarea de zeci de mii de tranzac#ii pe minut (+00D!.
'HEA rela#ionale au o serie de avanta%e. Ele permit acumularea unor volume
impresionante de date ntr-un mod neredundant su( forma unor ta(ele, care
pot fi com(inate prin anumite opera#ii, (ine fundamentate matematic, pentru
a o(#ine informa#iile dorite. 9nterogarea poate fi realizat$ ntr-un mod fle,i(il
folosind lim(a%ul 'I6 (1'tructured JuerrC language2!. -u toate aceste
avanta%e, folosirea direct$ a 'I6 de c$tre un manager de pe nivelurile
superioare ale ierarhiei de conducere, necesit$ din partea acestuia cunotin#e
i timp pe care acesta nu le are n unele cazuri.
7entru a ocoli aceste nea%unsuri, o solu#ie intermediar$ au constituit-o
sistemele de in/ormare a directorilor (02ecuti$e in/ormation systems6 01,!.
=
Acestea sunt nite sisteme de tip 1front-end2 pentru sistemele de tip 56&7 i
au ca misiune realizarea de opera#ii de agregare a datelor primite de la
sistemele de tip 56&7 care sunt stocate n mod intermediar n dispozitivele de
memorare ale E9'. .anagerul, n loc s$ formuleze comenzi de interogare
ntr-un lim(a% misterios pentru el ('I6! au posi(ilitatea s$ aleag$ dintr-un
meniu presta(ilit pentru a o(#ine informa#ia necesar$.
Aei solu#iile de tip E9' au reprezentat un pas important nainte n
asistarea deciziilor centrate pe date, ele sufer$ de anumite nea%unsuri izvor"te
din ns$i concep#ia de realizare. n primul r"nd, culegerea de date de la
sisteme de tip 56&7 r$m"ne o pro(lem$ care, uneori, nu este simpl$ din punct
de vedere tehnic. n al doilea r"nd, solu#ia E9' sufer$ de infle,i(ilitate.
9nfle,i(ilitatea se manifest$ at"t n utilizare (este necesar$ parcurgerea de
c$tre manager a unor secven#e de meniuri presta(ilite i nimic mai mult sau
mai pu#in! c"t i n ntre#inere i dezvoltare, situa#ie n care poate fi necesar$
reproiectarea de la nceput pentru a considera cerin#e de informare
suplimentare. 'u(iectul E9' va fi dezvoltat ntr-un articol ulterior.
-ele ar$tate mai sus c"t i limitele atinse de instrumentele de tip
sisteme de gestiune a (azelor de date au determinat necesitatea unui concept
nou (magazia de date! i, respectiv, a unor instrumente informatice noi
(56A7!. Acestea vor fi prezentate n su(capitolele care urmeaz$.
..-.2. O #l%&ie mde'!3
'olu#ia pentru asistarea deciziei centrate pe date, adoptat$ cu entuziasm
de furnizori mai mari sau mai mici de produse informatice(7endse, 2 c!
se (azeaz$ pe conceptul de magazie de date (AK! i pe instrumentele de
prelucrare analitic$ on-line (56A7!.
.agazia de date este o (az$ de date specializat$ care r$spunde nevoilor
i cerin#elor specifice deciden#ilor afla#i pe nivelurile superioare ale ierarhiei
de conducere a ntreprinderii. Ea cuprinde multe tipuri de date, provenind de
0
la mai multe 1surse de aprovizionare2, care pot fi sisteme de tip 56&7,
calculatoare de proces, re#ele industriale, (i(lioteci de c$r#i, fotografii sau
-A-*5., 9nternet etc. E,istenta mai multor tipuri de date diferentiaza
magazia de date de noile versiuni 3-A ale foilor de calcul electronic. Acestea
au fost inaugurate de3-A sheet al 9E.-6otus i au fost urmate de solutiile de
tip 8note(ooL2 i 8BorL(ooL2 ale produselor Iuatro 7ro for KindoBs (al lui
-orel! i respectiv E,cel (al lui .icrosoft!.
7rincipalele opera#ii care se efectueaz$ asupra datelor primite sunt
(Ahar, 'tein, +00<!)
+. +ncrcarea datelor din diferite surse, care const$ n urm$toarele) a!
detectarea datelor noi de interes aflate n (azele de date surs$ i (!
determinarea modului i a locului pentru nc$rcare. nc$rcarea se
efectueaz$ la momente programate, n regim 1pe loturi2 ((atch! pentru a
nu pertur(a func#ionarea sistemelor furnizoare de tip 56&7F
2. con$ersia datelor din formatul original n cel adoptat n magazia de dateF
3. cur"irea datelor, care cuprinde func#ii de identificare i corectare a
erorilor de conversie i completarea omisiunilorF
:. trans/ormarea datelor prin opera#ii de agregare i rezumare.
9nstrumentele de tip 56A7 servesc la manipularea datelor ntr-un mod
care e,tinde i fle,i(ilizeaz$ func#iile i maniera de operare a sistemelor de tip
E9' descrise n su(capitolul anterior. ntr-un mod intuitiv, func#ionarea 56A7
este sugerat$ de opera#ii de tip 1feliere i decupare de cu(ule#e2 (,lice and
diceig ,7D! a (azei de date n scopul de a permite decidentul s$ g$seasc$
acele informa#ii care i permit constatarea unor situa#ii de interes sau
verificarea unor ipoteze. .ai multe detalii despre 56A7 vor fi date n
capitolul 3.
.... De,i!i&ii
+
-onform defini#iei lui 9nmon (+00;!, aparent cea mai r$sp"ndit$ i
acceptat$ p"n$ n prezent, o magazie de date este o colec#ie integrat$ de date
de tip serii de timp, nevolatile, orientat$ pe un su(iect i care are ca scop
spri%inirea proceselor decizionale ale managerilor. Aceast$ defini#ie a celui
care este considerat 1p$rintele magaziei de date2 (HraC, +00<! va fi detaliat$
i particularizat$ n urm$toarele dou$ su(capitole (2.2.+. i 2.2.!.
....-. Ca'ac$e'i#$ici
5 magazie de date este n general un lucru scump. Ea poate costa
milioane de dolari i stoca volume de date cuprinse ntre ; de Higaocteti i
c"#iva &erraocteti (HraC, Katson, +00D!. 7entru ca magazia de date s$ merite
investi#ia f$cut$, ea tre(uie s$ serveasc$ necesit$#ile managerilor prin oferirea
de r$spunsuri rapide i n conformitate cu cerin#ele de interogare i de
prezentare ale acestora. 7entru ca magazia de date s$ merite investi#ia f$cut$,
ea tre(uie s$ serveasc$ necesit$#ile managerilor prin oferirea de r$spunsuri
rapide i n conformitate cu cerin#ele de interogare i de prezentare ale
acestora. 7entru aceasta, o magazie de date tre(uie s$ posede o serie de
caracteristici generale (9nmon, +00;F HraC, Katson, +00D!, care se prezint$
mai %os)
+. ,epararea /izic de (azele de date opera#ionale. Aceast$ cerin#$ are ca
scop pe de o parte, furnizarea operativ$ a informa#iilor necesare procesului
decizional i pe de alt$ parte, evitarea pertur($rii aplica#iilor operative,
care tre(uie s$ satisfac$ standardele legate de timpul de r$spuns i de
siguran#a opera#iilor.
2. Orientarea ctre un su'iect. 'pre deose(ire de (azele de date opera#ionale
care sunt centrate pe aplica#ii sau func#ii, magazia de date este organizat$
ca s$ vizeze anumite su(iecte de interes pentru manager precum) clien#i,
produse, activit$#i.
++
3. 1ntegrarea f$r$ e,cep#ii a datelor. Aceasta se traduce prin consisten#a
(uniformitatea!) a! conven#iilor folosite n definirea datelor, (! unit$#ilor de
m$sur$ utilizate, c! atri(utelor datelor etc.
:. Pstrarea seriilor de timp& 'pre deose(ire de datele opera#ionale, care sunt
vala(ile numai n momentul accesului, cele con#inute n AK sunt vala(ile
oric"nd. Aceasta se traduce prin urm$toarele tr$s$turi derivate) a! orizontul
de timp de ;-+ ani (fa#$ de ma,imum c"teva zeci de zile n cazul
opera#ional!, (! structura cheii de acces, care con#ine elementul 1timp2 (zi,
lun$, an! i c! interzicerea modific$rii datelor stocate corect la un anumit
moment discret de timp.
;. 8e$olatilitatea datelor. Aceasta se traduce prin reducerea num$rului de
tipuri de opera#ii permise n cazul AK la dou$) a! nc$rcarea ini#ial$ i (!
accesul la date, spre deose(ire de cazul opera#ional, n care se efectueaz$ o
multitudine de nser$ri, tergeri i actualiz$ri la nivelul unei singure
nregistr$ri. -onsecin#ele acestei caracteristici sunt diverse. n primul r"nd,
dispare pericolul poten#ial al actualiz$rilor eronate. n al doilea r"nd, se
poate realiza proiectarea la nivel fizic pentru a optimiza accesul f$r$ a mai
#ine cont de cerin#ele de neredondan#$ i normalizare. n al treilea r"nd,
dispare necesitatea folosirii unor tehnici complicate pentru asigurarea
integrit$#ii datelor i pentru %urnaliere i recuperare c"t i pentru de(locare
din punct mort.
...... Tip%'i de ma/a)ii de da$e
&ermenul de magazie de date este destul de general. Gnii autori sau
furnizori de produse informatice folosesc diferite denumiri pentru a numi
unele cazuri particulare sau componente ale AK. Astfel &ur(an i Aronson
(+00=! identific$ urm$toarele 1componente2) a! 'aze de date /izice mari (n
care sunt con#inute datele i metadatele c"t i programele de 1cur$#are2,
organizare, asam(lare i preprocesare!, (! magazii de date logice (care
+2
cuprind numai metadatele i programele de organizare, asam(lare,
preprocesare mpreun$ cu informa#iile necesare pentru a g$si i a avea acces
la date indiferent de locul unde sunt stocate! i c! 1t"rguri2 sau compartimente
de date (1data mart2!, care reprezint$ su(seturi ale unei AK, necesit$#ile unei
p$r#i sau func#ii a ntreprinderii. &"rgurile de date mpreun$ cu leg$turile
sta(ilite prin intermediul AK logice constituie componente n dezvoltarea
incremental$ a unei AK de ntreprindere (9nmon, +00=!.
5 clasificare recent$ i sistematic$ a tipurilor de magazii de date este
propus$ de c$tre Firestone (2!, care identific$ cinci tipuri de magazii de
date. &oate tipurile au n comun faptul c$ sunt 1colec#ii integrate, nevolatile,
de date de tip serie de timp care au ca scop asistarea proceselor decizionale
manageriale2. -eea ce diferen#iaz$ tipurile de magazii de date este aria de
cuprindere a proceselor decizionale, dup$ cum se arat$ mai %os)
+. .agazia de date galactic (HAK!, asist$ procesele decizionale
manageriale care privesc oricare !i toate procesele de (usiness i
compartimentele ntreprinderi c"t i ntreprinderea luat$ ca un ntreg.
2. .agazia de date orientat pe un proces de 'usiness (E7AK! asist$
procesele decizionale care privesc oricare !i toate procesele de (usiness i
leg$turile lor reciproce precum i cu mediul lor ncon%ur$tor.
3. .agazia de date departamental (AAK! asist$ procesele decizionale care
privesc oricare !i toate compartimentele i interac#iunile lor reciproce
precum i cu mediul lor ncon%ur$tor.
:. Gn t"rg de date (data mart! de tip proces de 'usiness ((PD! asist$
procesele decizionale centrate pe un singur proces de (usiness.
;. Gn t"rg de date departamental (AA.! asist$ procesele decizionale
centrate pe un singur compartiment.
6egat de aceast$ clasificare, Firestone (2! face c"teva o(serva#ii
interesante. n primul r"nd el consider$ c$ interesul c$tre HAK este n
descretere i c$, E7AK i E7A. sunt mai de dorit datorit$ orient$rii
+3
actuale c$tre considerarea proceselor de (usiness, care nu #in seama de
grani#ele compartimentelor (Mammer, -hampC, +003!. n acelai timp,
Firestone (2! mai o(serv$ c$ simpla reuniune a unor AA. nu constituie o
magazie de date deoarece nu asigur$ suportul pentru deciziile manageriale
care privesc procesele care traverseaz$ grani#ele compartimentelor sau
interac#iunile dintre compartimente i pe cele cu mediul ncon%ur$tor. n
acelai spirit se arat$ c$, reuniunea unor E7A. nu constituie o magazie de
date. &otui autorul citat nu respinge posi(ilitatea distri(uirii la nivel fizic a
unei magazii de date care poate fi caracterizat$ la nivel logic aa cum s-a
ar$tat la nceputul acestui su(capitol n prima clasificare prezentat$.
0. P'el%c'a'ea a!ali$ic3 ! li!e
-onform cu Hlosarul propus de 56A7 -ouncil (+00<!, 1prelucrarea
analitic on line (56A7! desemneaz$ o categorie de instrumente softBare,
care permit analitilor, managerilor i directorilor s$ n#eleag$ esen#a datelor
printr-un acces rapid, consistent i interactiv la o mare varietate de vederi
posi(ile ale informa#iilor, care au fost o(#inute prin transformarea datelor
primare, astfel nc"t s$ reflecte dimensiunile reale ale ntreprinderii aa cum o
percepe i o n#elege utilizatorul2.
Gn ser$er OLAP este, conform aceluiai Hlosar (56A7 -ouncil, +00<!
1un motor de tip multi-utilizator, de mare capacitate pentru manipularea
datelor proiectat astfel nc"t s$ poat$ lucra cu structuri de date
multidimensionale. 5 structur multidimensional este alc$tuit$ astfel nc"t
orice dat$ poate fi localizat$ i accesat$ prin intersec#ia coordonatelor sale de-
a lungul acelor dimensiuni care definesc amplasarea datei. 7roiectarea
serverului i a structurii de date sunt realizate astfel nc"t s$ se poat$ realiza
at"t optimizarea reg$sirii ad-hoc a informa#iei c"t i calcule fle,i(ile folosind
formule matematice2.
+:
56A7 i magazia de date sunt complementare. Aup$ cum se arat$ n
-artea al($ a -onsiliului 56A7 (Forsman, +00<!, este important s$ se fac$
distinc#ia ntre conceptul de magazie de date i 56A7. n timp ce magazia de
date acumuleaz$ informa#ii cu caracter tactic ntr-o (az$ de date rela#ional$
specializat$, cu scopul de a furniza r$spunsuri la ntre($ri de tipul 1-ineNO2
i 1-eNO2, 56A7 folosete de o(icei o vedere cu mai multe dimensiuni a
unor date agregate pentru a putea a r$spunde la ntre($ri suplimentare de tipul
1Ae ceN.O2 (1KhCNO2! i 1-e se nt"mpl$ dac$NO2 (Khat ifNO2!, tipice
pentru sistemele de asistare a deciziei.
0.-. E*l%&ii
Aei, dup$ cum arat$ 7endse (2 (!, r$d$cinile 56A7 pot fi
identificate cu mul#i ani n urm$ n lim(a%ul A76, adev$rata lansare a
termenului a fost prile%uit$ de un articol al lui -odd et all. (+003!. -el care
este socotit 1p$rintele (azelor de date rela#ionale a ar$tat c$, datele ar tre(ui
folosite pentru o prelucrare analitic$ i c$ n acest scop (azele de date
multidimensionale sunt mai adecvate i, n consecin#$, le vor nlocui pe cele
rela#ionale.
0.-.-. F%!c&ii
*aden (+00;! distinge dou$ tipuri de (az$ de instrumente 56A7)
+. 56A7 n sens restr9ns care permite interog$ri interactive ale datelor prin
care se poate realiza o analiz$ const"nd din /elieri !i decupri de cu'ule"e
(8slice and dice2! ale (azei de date i din /orri (1drill-doBn2! succesive
pe niveluri de detaliere, din ce n ce mai pronun#ate. 9nforma#iei i se
atri(uie caracteristica de multidimensionalitate i poate fi afiat$ n ta(ele
ncruciate, pentru care e,ist$ instrumente specializate pentru a realiza
pivotarea a,elor i ta(ularea ncruciat$. &oate opera#iile sunt numai de
citire.
+;
2. 56A7 +n sens larg permite opera#ii suplimentare precum) a! actualizare,
(! calcule de (az$ de agregare sau consolidare pe una sau mai multe
dimensiuni i c! calcule mai avansate de tipul) preduc#ie, analiz$ de
trenduri i chiar optimizare.
3.
0.-... Re/%lile l%i Cdd "i $e#$%l FASMI
-artea al($ propus$ n +003 de -odd et all, intitulat$ 17roviding 56A7
(5n line AnalCtical 7rocessing! to Gser - AnalCst) An 9& .andate2, la
comanda firmei Ar(or 'oftBare (7endse, 2 a!, con#inea +2 reguli, a c$ror
ndeplinire putea califica un produs softBare ca fiind de tip 56A7. Aceste
reguli, au f$cut epoc$ la vremea respectiv$, dei au e,istat suspiciuni c$ ele au
fost influen#ate de comanda unui produc$tor de softBare (7endse, 2 a!.
*egulile defineau urm$toarele caracteristici ale produselor de tip 56A7
(HraC, Katson, +00DF 7endse, 2 a!)
): 7osi(litatea unor $ederi conceptuale multidimensionale care este
asociat$ cu opera#ii de feliere i decupare de cu(uri (1slice and dice2!.
); 4ransparen" pentru utilizator, n sensul c$ acesta putea nici m$car s$
nu ai($ idee de sursele datelor, care puteau fi oric"t de eterogene.
)< Accesi'ilitatea, care d$dea motorului 56A7 caracterul de mediator
(2middleBare2! ntre sursele eterogene de date i front-end-ul 56A7.
)= )aportarea consistent, care cere ca performan#ele rapoartelor s$ nu fie
degradate n m$sur$ semnificativ$ prin creterea num$rului de dimensiuni
ale (azei de date.
)> Arhitectura de tip client prestator (1client 4 server2!, asociat$ cu un
grad ridicat de inteligen#$ a instrumentului 56A7, astfel nc"t clien#i noi i
diveri s$ poat$ fi ataa#i cu un efort minim de programare.
)? 8umr generic de dimensiuni echi$alente at"t n ceea ce privete
structura c"t i opera#iile posi(ile. Aceast$ regul$ este cea mai
controversat$ din tot setul celor +2 reguli. 7endse (2 a! arat$ c$, n
+D
sistemele aplicative, e,ist$ tendin#e de a ignora aceast$ regul$, n timp ce
furnizorii de produse informatice declar$ c$ ncearc$ s$ o respecte.
)@ .anipularea automat$ a unor matrici rare. Glterior aceasta a fost
e,tins$ la aAustarea automat a schemei la ni$el /izic n scopul adapt$rii la
tipul de model de date, la volumul i la e,isten#a unor pozi#ii goale n
matricea datelor, care poate deveni rar$.
)B ,uport multi6utilizator, care e,tindea accesul dincolo de aplica#iile
1numai citire2 (1read onlC2! i permitea acces concurent (inclusiv
actualiz$ri! cu facilit$#i de asigurare a integrit$#ii i securit$#ii datelor.
)C Efectuarea f$r$ restric#ii de opera#ii ntre dimensiuni care nsemna c$,
se putea realiza orice fel de opera#ii folosind datele care aveau
coordonatele n dimensiuni diferite.
):D anipularea intuiti$ a datelor, care tre(uia realizat$ prin ac#iunea
direct$ asupra celulelor dintr-o vedere f$r$ a recurge la micarea prin
meniuri, sau la comenzi multiple.
):: )aportarea /le2i'il, care cerea ca aran%amentul a,elor n rapoarte s$
fie la li(era alegere a utilizatorului.
):; 8umrul nelimitat de dimensiuni !i ni$eluri de agregare, fiind
acceptate totui (din motive de capacitate limitat$ a calculatoarelor! valori
de minimum +; dimensiuni i fiind recomandate valori de 2 de
dimensiuni. Ahar i 'tein (+00<! indic$ o limit$ ma,im$ practic$ de <
dimensiuni iar, mai de cur"nd, 7endse (2 a! arat$ c$ sunt pu#ine
aplica#ii care dep$esc cifre care variaz$ ntre = i + dimensiuni.
7endse (2 a! arat$ c$, n +00;, -odd a mai ad$ugat ase reguli i a
restructurat ntregul set n patru grupe de trsturi (1features2!, dup$ cum
urmeaz$)
+. 4rsturi de 'az, care sunt numerotate de la F+ la F=. Aintre acestea,
tr$s$turile F+, F2, F3, F;, FD, F< i F= corespund n ordine regulilor *+,
+<
*+, *3, *;, *2 i respectiv *=. n plus, sunt introduse urm$toarele
tr$s$turi noi)
E=&02trac"ie pe loturi (-'atch.) $s& de tip interpretor, care se traduce prin
posi(ilitatea de a folosi fie propria (az$ de date aran%at$ special, fie de
avea acces 1pe viu2, direct de la surse e,terne.
E>&Asistarea modelelor de natur de tip OLAP i anume) a! raportarea
static$ parametrizat$, (! 1felierea si decuparea de cu(ule#e cu forarea n
ad"ncime2, c! analiza de tip 1-e se nt"mpl$ dac$N.O2 (simulare! i d!
model de 1urm$rire a unui scop2 (optimizare!.
;& 4rsturile speciale, numerotate cu F0 4 F+2)
EC& 4ratarea datelor nenormalizate&
E:D& emorarea rezultatelor OLAP i p$strarea lor separat de datele surs$.
E::& 02tragerea $alorilor care lipsesc, interpretat$ de 7endse (2 a!
prin realizarea distinc#iei acestor valori de valorile nule.
E:;& 4ratarea $alorilor care lipsesc, care sunt ignorate de analizorul
56A7, indiferent de provenien#$.
7lec"nd de la constatarea c$, 1+=, sau chiar +2 reguli sunt prea mult2 i
ncerc"nd s$ defineasc$, n mod independent de implementare, caracteristicile
unei aplica"ii OLAP, 7endse (2 a! propune testul FA'.9 (1Fast AnalCsis
of 'hared .ultidimensional 9nformation2 4 Analiza rapid a in/orma"iei
multidimensionale partaAate!. -ele patru cuvinte cheie care calific$ un produs
ca fiind compliant cu 56A7 sunt descrise mai %os.
+. -uv"ntul cheie 1analiz$2 cere ca sistemul de tip 56A7 s$ permit$
efectuarea de c$tre utilizator, ntr-un mod suficient de facil i intuitiv a
oric$rei analize logice sau statistice care este relevant$ pentru aplica#ie.
Aceasta include, pe l"ng$ func#ii preprogramate i posi(ilitatea de definire
a unor calcule ad hoc i furnizarea de rapoarte n orice form$ dorit$ f$r$ a
face apel la lim(a%e de programare profesionale.
+=
2. -uv"ntul cheie 1rapid$2, indic$ faptul c$, sistemul tre(uie s$ furnizeze
ma%orit$#ii utilizatorilor datele cerute ntr-un interval de timp p"n$ la cinci
secunde. 7entru analize simple, cerin#a de timp de r$spuns este de o
secund$ i, numai n foarte pu#ine cazuri e,cep#ionale, se admite un timp
de r$spuns mai mare de 2 de secunde.
3. -uv"ntul cheie 1informa#ie2 se refer$ la toate datele primare i informa#iile
care au fost o(#inute din acestea n m$sura n care ele sunt relevante pentru
aplica#ie. .$sura volumului de informa#ie se refer$ la cantitatea de
informa#ie care poate fi manipulat i nu la capacitatea de stocare.
:. -uv"ntul cheie 1multidimensional$2, care reprezint$ punctul esen#ial al
testului FA'.9, arat$ c$ o aplica#ie 56A7 tre(uie s$ poat$ furniza vederi
conceptuale ale datelor cu mai multe dimensiuni, f$r$ a fi nevoie s$ se
specifice a priori num$rul acestora, care e dependent de aplica#ie.
;. -uv"ntul cheie 1parta%at$2 implic$ cerin#e privind asigurarea
confiden#ialit$#ii i de (locare a actualiz$rilor concurente c"nd e cazul unor
accese multiple de tip 1nscriere2.
0... Te1!l/ii de impleme!$a'e
Aup$ cum s-a ar$tat mai nainte cuv"ntul cheie care definete conceptul
de 56A7 (produs sau aplica#ie! este n mod constant multidimensionalitatea
vederilor folosite n analiz$. n prezent, coe,ist$ dou$ solu#ii de implementare
a multidimensionalit$#ii) a! 'olu#ia OLAP (-ultidimensional OLAP.),
care folosete (aze de date multidimensionale (1.ultidimensional Aata Ease2
4 D(!, sau (aze de date de tip 1hipercu(2 (de fapt, hiperpoliedru! i (!
'olu#ia (azelor de date rela#ionale care asigur$ multidimensionalitatea pentru
analiz$, denumite pe scurt )OLAP (1*elational@56A72 sau 156A7 - on -
*elational2!.
0...-. Sl%&ii de $ip ROLAP
+0
5 (az$ de date rela#ional$ are dou$ dimensiuni sau a,e (coloane i
r"nduri! i presupune e,isten#a unui lim(a% de interogare de tip 'I6
(seJuential JuerC language!. Asigurarea posi(ilit$#ii de a efectua analize
multidimensionale folosind o (az$ de date rela#ional$ se realizeaz$ n
implement$rile actuale prin folosirea unei scheme de proiectare intitulat$
1schema stea2, sau 1floarea soarelui2 (9E., +00DF HraC, Katson, +00DF
HradC, 2!. Aceasta creeaz$ dou$ tipuri de ta(ele) a! o 1ta(el$ de fapte2
(care poate avea milioane de r"nduri! i con#ine informa#iile care sunt
su(iectul interog$rilor i (! mai multe ta(ele care con#in datele descriptive
privind fiecare dimensiune.
*aden (+00=! propune c"teva criterii pentru a califica un produs drept
*56A7 dintre care amintim)
P e,isten#a unui generator 'I6, care poate realiza opera#ii de selectare n
mai multe treceriF
P posi(ilitatea de a realiza clasific$ri ne(anale, compara#ii i calculul
procentelor pe clase)
P e,isten#a unui mecanism care descrie modelul datelor prin intermediul
metadatelor i care poate folosi metadatele n timp real pentru a realiza
interog$riF
P posi(ilitatea de a parti#iona aplica#ia ntre clien#i, prestatori i un
element mediator care gestioneaz$ irurile de apeluri la (aza de date.
7rimul produs de tip *56A7, denumit .etaphor, a fost lansat n +0=:
pentru aplica#iile de marLeting la companiile produc$toare de (unuri de
consum. 'uccesul comercial al lui .etaphor (de#inut din anul +00+ de c$tre
firma 9E.! a fost destul de limitat. Ae atunci o serie de alte produse au fost
lansate, ca de e,emplu, AQ'R' al firmei Advantage, Eeacon al firmei 7rodea
sau .eta-u(e al lui 'tanford &echnologC Hroup. Ae asemenea s-au petrecut
o serie de fuziuni i achizi#ii de firme din domeniu (*aden, +00;F 7endse,
2 (!.
2
0..... Sl%&ii de $ip MOLAP
5pera#iile primare i tipice pentru aplica#iile 56A7 sunt /elierea !i
/orarea. Ele presupun o organizare logic$ a datelor su( forma unui hipercu(
(n 4 dimensional! format din celule n care timpul este o dimensiune
o(ligatorie (HraC, Katson, +00D! n locul ta(elelor (idimensionale ale (azelor
de date rela#ionale. *aden (+00;! identific$ trei etape de proiectare a
hipercu(ului) a! alegerea su(iectelor de interes pentru ntreprindere (de
e,emplu) v"nz$rile, reclama#iile, sau capacit$#ile de produc#ie!, (! sta(ilirea
valorilor care tre(uie culese (de e,emplu volumul lucr$rilor, elementele de
cost, sau gradul de nc$rcare i timpii de sta#ionare ai mainilor i instala#iilor!
i c! determinarea granularit$#ii datelor sau a nivelului de detaliu. Acelai
autor o(serv$ c$, spre deose(ire de (azele de date rela#ionale, .AE nu au
nc$ un model acceptat de toat$ lumea i nici o metod$ de acces standard cum
era 'I6 n cazul rela#ional.
7rimul instrument informatic pentru .AE a fost E,press, care a fost
g"ndit la nceputul anilor /<, pentru aplica#ii cu timp parta%at n mediul
academic. n prezent, E,press este de#inut din anul +00; de c$tre firma
5*A-6E (un mare produc$tor de instrumente pentru (azele de date
rela#ionale! i i men#ine conceptele ini#iale dei prezint$ noi solu#ii de
implementare. Ae atunci, alte produse au fost lansate ca de e,emplu) 'Cstem
K al firmei -omshare, sau Ess(asse al firmei Ar(or i 7rodusul &ensor al
firmei .icrosoft, care a fost adoptat ca standard industrial chiar nainte a fi
lansat. -el mai nou produs al aceleiai firme (.icrosoft!, denumit 7lato,
posed$ o arhitectur$ sofisticat$ (*56A7@.56A7@Mi(rid! (7endse, 2 (F
*aden, +00;!. !. Aetalii practice practice privind implementarea solutiilor de
tip .56A7 sunt date de &homsen(+00<!. 7entru completitudine ta(loului,
vom mentiona n treacat dezvoltarea n paralel a solutiei 9mprove a lui 9E. 4
6otus pentru foile de calcul ta(elar electronic.
2+
5 compara#ie a solu#iilor de tip *56A7 i .56A7@.AE, folosind mai
multe criterii precum) a! func#ionalitatea, (! adecvan#a, c! performan#ele i d!
scala(ilitatea mpreun$ cu recomand$ri de a folosi una sau alta dintre cele
dou$ solu#ii este data de *aden (+00;
2. Mi!e'i$%l da$el'
ineritul datelor (1Aata .ining2 4 D!, denumit uneori i
descoperirea cuno!tin"elor n (azele de date (1SnoBledge AiscoverC in Aata
Eases 14 %DD! este cea mai recent$ tehnologie de analiz$ a datelor, asociat$,
al$turi de 56A7, cu conceptul de magazie de date.
Alte denumiri i n#elesuri cuprinse n conceptul de A.@SAA sunt)
1arheologia datelor2, 1prelucrarea pattern-urilor de date2, 1culesul
informa#iilor2 sau 1dragarea datelor2 (&ur(an, Aronson, +00=!.
*$d$cinile A.@SAA sunt considerate a fi n principal n statistica
matematic$ i n pachetele softBare folosite n tiin#ele sociale (Agosta, 2!
i n inteligen#a artificial$ (.o,on, +00D!.
2.-. De,i!i&ii
-a i n cazul 56A7, n literatur$ e,ist$ mai multe defini#ii pentru
A.@SAA, lucru a(solut e,plica(il n cazul unei tehnologii noi, aflate ntr-o
mare efervescen#$.
5 defini#ie mai veche (FraBleC, +00+, citat de .ertens et all, +00D!
spune c$, mineritul datelor const$ n 1e,tragerea nu simpl$ i (anal$ a unor
informa#ii poten#ial utile, implicite i recunoscute dinainte dintr-o (az$ de
date2. HraC i Katson (+00D! arat$ c$, 1mineritul datelor permite analitilor i
managerilor s$ g$seasc$ n magazia de date r$spunsuri la pro(lemele
ntreprinderii, pe care acetia nici m$car nu i le-au pus2. .o,on (+00D!
adopt$ un n#eles mai restr"ns al mineritului datelor pe care l consider$ 1un
set de tehnici folosit n a(ordarea automatizat a opera#iilor de e2plorare
22
e2hausti$ a unor (aze de date foarte mari i de aducere la supra/a" a unor
rela#ii comple,e e,istente n acele (aze de date2.
ntr-o ntreprindere se acumuleaz$ de-a lungul timpului foarte multe
date. Aatele p$strate de mult$ vreme n fiiere pot con#ine informa#ii i
cunotin#e ascunse care pot servi la (unul mers al ntreprinderii, dar luate ca
atare, nu au mare utilitate dac$ nu sunt nso#ite de mecanisme care s$ permit$
e,plorarea lor i n#elegerea fenomenelor care au guvernat func#ionarea
surselor de date. Aup$ cum ar$ta M. 'imon, laureatul 7remiului To(el pentru
economie, la -onferin#a 9nterna#ional$ pentru Economie, .anagement i
&ehnologia 9nforma#iei (desf$urat$ la &oLio n anul +002!, 19nforma#ia nu
lipsete. -eea ce lipsete este timpul managerului de a considera toate
informa#iile care sunt disponi(ile2.
&ehnologiile de analiz$ a datelor prezentate mai nainte (E9', 56A7!
pot fi v$zute ca %uc"nd rolul unor 1a%utoare de verificare2 ale ipotezelor
formulate de utilizatori (manageri sau analiti! privind rela#iile care e,ist$
ntre diferitele date acumulate. -heia succesului const$ n intui#ia
utilizatorului de a formula cele mai adecvate interog$ri ini#iale i n
capacitatea lui de a continua rafinarea analizei pe (aza informa#iilor primite
de la sistemul informatic. -ontri(u#ia principal$ a acestuia const$ n
facilitarea procesului de analiz$. Aceasta se realiza fie prin uurarea activit$#ii
de formulare a interog$rilor i de o(#inere a unor rapoarte care permiteau o
vizualizare sugestiv$ (n cazul E9'!, fie prin o(#inerea rapid$ a unor
r$spunsuri prin e,plorarea multidimensional$ a unor ierarhii de date agregate,
nso#it$ eventual de prelucr$ri statistice (n cazul 56A7!.
Aup$ cum se poate o(serva (FaCCad, GthurusamC, +00DF .o,on,
+00D!, succesul unei astfel de a(ord$ri poate fi afectat de capacitatea limitat$
a utilizatorului de a intui fenomenele i de ndem"narea sa de a folosi toate
posi(ilit$#ile oferite de instrumentul informatic. Eficacitatea procesului poate
23
sc$dea dramatic n cazurile comple,e, n care utilizatorul are de a face cu
milioane de situa#ii, fiecare descris$ prin sute de nregistr$ri.
n cazul A.@SAA, sistemul informatic are ca misiune investigarea
e,haustiv$ a datelor pentru a scoate la lumin$ clasific$ri, asocieri, sau alte
modele ale datelor, n timp ce analistului (sau managerului! i revine sarcina
de a decide ce s$ fac$ apoi cu aceste rezultate (9E., +00D!.
2... F%!c&ii
7rincipalele func#ii realizate de A.@SAA sunt (.o,on, +00D!)
+. 5ruparea (1clustering2!, care este, de cele mai multe ori, prima etap$ n
analiza (azat$ pe mineritul datelor. Ea const$ n identificarea grupurilor
de nregistr$ri nrudite care pot constitui punctul de plecare pentru
e,plorarea n continuare a unor alte rela#ii.
2. 3lasi/icarea, care este cea mai r$sp"ndit$ tehnic$ de minerit al datelor,
folosete un set de e,emple n scopul realiz$rii unui model pentru
aran%area n clase a mul#imii de nregistr$ri.
Alte func#ii pot fi) estimarea (o variant$ a clasific$rii!, asocierea i
analiza (azat$ pe secven#e.
.ineritul datelor folosete o serie de algoritmi i tehnici de analiz$,
care sunt descrii n alte articole ale acestei serii, precum ar(orii de decizie
ra#ionamentul (azat pe situa#ii, logica vag$, algoritmii genetici , sau
transform$rile (azate pe fractali. 5 list$ (ogat$ i la zi de referin#e privind
solu#iile dezvoltate n domeniu este dat$ de FaCCad, 7iatetsLC 4 'hapiro i
'mith (2! iar lucrarea recent$ a lui Kitten, FranL i HraC (+000! descrie o
serie de tehnici (azate n special pe instruire.
n ceea ce privete aplica#iile A.@SAA se pot enumera o serie de
realiz$ri (&ur(an, Aronson, +00=F -o,, 2! dintre care de interes n
conte,tul acestei lucrari sunt) a! clasificarea clien#ilor n categorii, (!
sta(ilirea pre#urilor i pozi#ionarea produselor pe pia#$, c! descoperirea de
clien#i poten#iali i p$strarea celor e,isten#i, d! predic#ia i prevenirea
2:
situa#iilor de faliment, e! determinarea nivelului de siguran#$ al portofoliului
de comenzi i a m$surilor adecvate care tre(uie s$ fie luate etc.
&oate aceste aplica#ii se caracterizeaz$ prin aceea c$ datele sunt su(
forma numeric$ sau a unor iruri de sim(oluri ordonate ntr-un mod consistent
(de o(icei, ta(ele cu r"nduri i coloane n (aze de date rela#ionale sau n foi
de calcul ta(elar electronic!. Aceasta permite din capul locului n#elegerea
semanticii i a structurii datelor de c$tre utilizator, n timp ce tehnologiei A.
i revine rolul de a descoperi paternuri prin e,plorarea e,haustiv$ a (azei de
date. n ultima vreme se constat$ o nou$ direc#ie promi#$toare de dezvoltare
i anume cea denumit$ 1mineritul te,telor2 cu format li(er (-o,, 2!.
.ineritul datelor este o tehnologie 1n cretere2, care pare s$ fie pe
punctul de a deveni o 1tehnologie cheie2. E,ist$ o serie de prototipuri i chiar
produse comerciale propuse at"t de firme mici i inovatoare c"t i de marii
produc$tori (de e,emplu, 9ntelligent .iner al 9E. lansat n +00=!.
'imptomul cel mai semnificativ care poate fi o(servat este tendin#a multor
gigan#i ai pie#ei tehnologiei informa#iei (.icrosoft, 5racle, 9E., T-*,
Rahoo, Amazon etc.! de a achizi#iona produse i firme inovatoare n domeniul
A.@SAA (Augusta, 2!. -u toate acestea, dezvoltarea i afirmarea deplin$
a domeniului este condi#ionat$ de rezolvarea adecvat$ a unor pro(leme
tehnice (.o,on, +00D! precum) a! sensi(ilitatea fa#$ de datele 1necur$#ate2 i
(! capacitatea limitat$ de e,plicare a rezultatelor n termeni inteligi(ili pentru
om (cum se nt"mpl$ de altfel n cazul sistemelor e,pert (azate pe reguli.
4. N$e "i cme!$a'ii
n acest articol s-a ncercat s$ se prezinte, ntr-un num$r rezona(il de
pagini, principalele a(ord$ri privind instrumentele informatice de asistare a
deciziilor (azate pe date. Aceste a(ord$ri, care poart$ denumiri cumva insolite
pentru un decident, precum magazii i t"rguri de date, mineritul datelor, sau
sunt referite prin a(revieri misterioase ca de e,emplu .56A7, *56A7, au
2;
cunoscut o dezvoltare impresionant$ ncep"nd cu mi%locul anilor /0. Aceast$
micare a fost sus#inut$ n principal de interesul marilor firme de pe pia#a
tehnologiilor informa#iei i n mai mic$ m$sur$ de lumea academic$. 5 serie
de produse comerciale n domeniul AK, 56A7, A.@SAA ela(orate de 9E.
i partenerii s$i sunt men#ionate de 9E. (+00D!, iar solutiile furnizate de alte
mari firme (T-*,5*A-6E, -omshare, 'eagate 'oftBare! sunt descrise de
Katson i HraC (+00<!.
-u toate acestea, se pot auzi voci care ndeamn$ la precau#ie. Astfel, 7.
Seen (+00<!, o mare autoritate i un pionier n domeniul deciziei asistate de
calculator, arat$ c$, 1furnizarea de date nu creeaz$ informa#ie. 9nforma#ia nu
conduce automat la cunotin#e. -unotin#ele nu conduc n mod direct la
ac#iuni. Ac#iunea n (usiness i impactul s$u tre(uie s$ fie #inta. Este un
pericol real ca nmagazionarea de date i domeniul managementului
cunotin#elor s$ treac$ uor cu vederea cele de mai sus. &re(uie s$ ncepem cu
oamenii, nu cu informa#ia2.
-apitolul nu a a(ordat unele su(iecte care, de multe ori, sunt descrise n
literatur$ n conte,tul instrumentelor informatice care asist$ decizia (azat$ pe
analiza datelor precum sistemele centrate pe date spa"iale*geogra/ice
(Heographic 9nformation 'Cstems - H9'!, sau ncerc$rile de folosire a
a(ord$rii o(iectuale n magaziile de date. -ititorului interesat de aceste
su(iecte i se recomand$ adresele)
+. http)@@mis.ucd.ie@isBsdss@sdss.html, unde se poate g$si pagina lui
7.Seenan referitoare la sisteme de asistare a deciziilor (azate pe date
spa#iale i
2. http)@@BBB.dLms.com@55AK2.html, unde se poate g$si -artea al($
nr.; a -onsiliului 56A7, din august +00< privind magaziile de date
orientate pe o(iecte.
Aup$ cum o(serv$ HraC (+00<!, 1anul +00D a fost anul magaziei de
date2 (n ceea ce privete pu(licarea de lucr$ri n domeniu!. Aintre lucr$rile
2D
ap$rute n acest an, se recomand$ studierea mpreun$ a c$r#ilor scrise de
9nmon (+00D!, 9nmon i MacLarthorn (+00D! i Sim(all (+00D!, care dau o
imagine aproape complet$ asupra construirii i utiliz$rii magaziilor de date i
respectiv, a unor studii de caz din diferite domenii aplicative. 5 (un$
prezentare intuitiv$ a conceptelor AK, 56A7 i A.@SAA se g$sete n
capitolul : al c$r#ii lui Ahar i 'tein (+00<!. -om(inarea recent$ a AK cu
tehnologia Be( este prezentat$ de Sim(all i .erz (2! care introduc
conceptul promi#$tor de 1Aata Ke(house2.
-"teva adrese 9nternet recomandate pentru aprofundarea studiului i
urm$rirea dezvolt$rilor din domeniu sunt)
+. http)@@dssresources.com@dsstCpes@ddss.html, care reprezint$ o (un$ 1poart$
de intrare2 pentru materialele disponi(ile pe 9nternet n domeniul asist$rii
deciziei (azate pe date. 5 (un$ parte dintre lucr$rile referite n acest
capitol au putut fi g$site plec"nd de la aceast$ pagin$F
2. http)@@dssresources.com@dss(ooL, care con#ine capitolul < al hiperc$r#ii lui
Aaniel 7oBer (2! dedicat asist$rii deciziei (azate pe dateF
3. http)@@BBB.dataBarehousing.com@papers.asp, a lui Aata Karehousing
-enter, de unde se poate ncepe e,plorarea unor articole interesanteF
:. http)@@BBB.dLms.com@BhiteU7apers.htm, de la care se pot e,plora o serie
de -$r#i al(e n domeniul magaziilor de date, 56A7 i mineritului datelor.
N$a. Autorul multumeste domnului profesor Moratiu Aragomirescu pentru o
serie de materiale documentare i adrese furnizate.
2.4. 5i6li/'a,ie
Agosta, 6. (2!. From data to insight) the critical path to data mining,
a short historC of data mining. PC7AI, 'ept@5ct, +D-2+.
Alter, '. (+0<<!. A ta,onomC of Aecision 'upport 'Cstems. Sla!
Ma!a/eme!$ Re*ie8, Fall, 30-;D.
Alter, '. (+0=!. Deci#i! S%pp'$ S9#$em#; C%''e!$ P'ac$ice# a!d
C!$i!%i!/ C1alle!/e#. Addison 4 KesleC, *eading .A.
2<
-odd, E.F., '.E. -odd, &.'. -linch (+003!. EeCond decision support.
Cmp%$e'8'ld, 2D VulC.
-o,, E. (2!. Free 4 form te,t data mining integrating fizzC sCstems,
self 4 organizing neural nets and rule-(ased LnoBledge (ases. PC7AI, 'ept.-
5ct., 22-2;.
Aate. -.V. (+0=D!. A! I!$'d%c$i! $ Da$a6a#e S9#$em#. Fourth
Edition, Addison 4 KesleC 7u(lishing -o., *eading .A.
Ahar, W., *. 'tein (+00<!. I!$elli/e!$ Deci#i! S%pp'$ Me$1d#; $1e
Scie!ce , :!8led/e ;'<. 7rentice Mall, Gpper 'addle *iver, TeB
VerseC.
AS.' (2!. ;1i$e Pape'#. Rep'$#, ;'<i!/ Pape'#, a!d
D:MS 5'ie,#. E,ecutive 9nformation 'Cstems 9nc http)@@BBB.dLms.com@
Bhite = 7apers.htm!.
AK- 4 Aata Karehousing -enter. Pape' a!d A'$icle#
(BBB.dataBarehousing.com@papers!.
FaCCad, G. (+00D!. Aata mining and LnoBledge discoverC in data
(ases. Cmm%!ica$i!# , $1e ACM, >Special I##%e?, 0@ (++!.
FaCCad, G., H. 7iatetsLC - 'hapiro, 7. 'mith (2!. E,panded
references. &he SAA process for e,tracting useful LnoBledge from volumes
of data (http)@@BBB.research.microsoft.com@research@dataBare@ -A-.-A.-
refs@faCCad-intrs.htm!.
Filip, F. H. (2!. Aecizie asistata de calculatorF metode i tehnici de
asistare a deciziilor centrate pe %udecata umana. I!,'ma$ica ec!mica, IA
(3!, +-22.
Filip, F.H., E. Ear(at (+000!. I!,'ma$ica aplica$3; !i pa'adi/me "i
aplica&ii. Editura &ehnic$, Eucureti.
Firestone, V... (+00<!. O6Bec$ O'ie!$ed Da$a ;a'e1%#i!/. Khite
7aper To. Five. E,ecutive 9nformation 'Cstems, 9nc. (http)@@BBB.dlms.com@
AK2.html!.
Firestone, V... (2!. AS.' Erief To. 'i,) Da$a ;a'e1%#e#, Da$a
Ma'$#, a!d Da$a ;a'e1%#i!/C Ne8 De,i!i$i!# a!d Ne8 C!cep$#
(http)@@BBB.dLms.com@AKA.EA.html!.
Forsman, 'arah (+00<!. OLAP C%!cil ;1i$e Pape'
(http)@@BBB.olapcouncil.org@research@Bhtpapco.htm!.
FraBleC V. F., H. 7iatetsLC 4 'hapiro, H.V. .atheus (+00+!. SnoBledge
discoverC in data (ases) an overvieB. A.I. Ma/a)i!e, 0 (+3!, ;<-<.
HrandC, -heril (2!. 5'ea<$1'%/1 Pe','ma!ce ,' S$a' Sc1ema#
D A Da$a ;a'e1%#i!/ Sl%$i!#. A ;1i$e Pape'. ACnamic 9nformation
'Cstems -orporation (http)@@BBB.disc.com.@dBhpaper.html!.
HraC, 7. (+00<!. Aata BarehousingF revieB of 1Euilding the Aata
Karehouse2 ((C K.M. 9nmon!. E%'!al , I!,'ma$i! S9#$em#
Ma!a/eme!$, -2(+! (http)@@dss.c(a.uni.edu@(ooLs@revieB+.html!
2=
HraC,7. M.V. Katson (+00D!. &he neB A'') Aata Karehouses, 56A7,
.AA, and SAA. (http)@@hs(.(aClor.edu@ramsoBer@ais.ac.0D@papers@ graCBats.
htm!.
Mammer, ..V. -hampC (+003!. Ree!/i!ee'i!/ $1e C'p'a$i!. A
Ma!i,e#$ ,' 5%#i!e## Re*l%$i!. Marper Eusiness, TeB RorL.
9E.(+00D!. Aata Karehousing -oncepts for A'@: (http)@@BBB.
as:.i(m.com@d(2@dataBare.htm!.
9nmon, K.M. (+003!. 5%ildi!/ Da$a ;a'e1%#e. Vohn KileC X 'ons.
TeB RorL.
9nmon, K.M. (+00;!. ;1a$ i# a Da$a ;a'e1%#eO
(http)@@BBB.cait.Bvstl.edu@cait@papers@prism@vol+ = no+@su(%ect@home.html!.
9nmon, K.M., -laudia 9mhoff, *. 'ousa (+00=!. C'p'a$e
I!,'ma$i! Fac$'9. Vohn KileC X 'ons, TeB RorL.
9nmon, K.M., *.A. MacLathorn (+00:!. U#i!/ $1e Da$a ;a'e1%#e.
Vohn KileC X 'ons. TeB RorL.
Seen, 7.H.K. (+00<!. 6et/s focus on action not info.
Cmp%$e'8'ld. +< Tovem(er. (http)@@BBB2.-omputerBorld.com@home@
print0:0<.nsf@A99@'6:DLeen+DF2!.
Sim(all, *. (+00D!. T1e Da$a ;a'e1%#e Tl<i$. Vohn KileC X
'ons. TeB RorL.
Sim(all, *. .erz (2!. T1e Da$a ;e6 1%#e Tl<i$ C 5%ildi!/ $1e
;e6(E!a6led Da$a ;a'e1%#e. Vohn KileC X 'ons, TeB RorL.
.ertens, 7., V. Magedorn, ..Fischer, T.Eissantz, ..Maase (+00D!.
&oBards active management sCstems. 9n 7. MumphreC, 6. Eannon, A.
.c-osh, 7..igliarese, V.-h. 7omerol (Eds.!. Impleme!$i!/ S9#$em# ,'
Ma!a/eme!$ Deci#i!#; C!cep$#, Me$1d# a!d EFpe'ie!ce. -hapman X
Mall, p.3;-32;.
56A7 -ouncil (+00<!. OLAPC O! ( Li!e A!al9$ical P'ce##i!/
(http)@@dssresources.com@glossarC@olaptrms.html!.
7endse, T. (2 a! Khat is 56A7O An analCsis of Bhat the
increasinglC misused 56A7 term is supposed to mean. OLAP Rep'$
(http)@@BBB.olapreport.com@FA'.9.M&.!.
7endse, T. (2 (!. &he origins of todaC/s 56A7 products. T1e
OLAP Rep'$. (http)@@BBB.olapreport.com@origins.htm!.
7endse, T. (2 c! Khat/s in a nameO &he 56A7 *eport
(http)@@BBB.olapreport.com@name.html!.
7oe, W. (+00D!. 5%ildi!/ a Da$a ;a'e1%#e ,' Deci#i! S%pp'$.
7rentice Mall, Gpper 'addle *iver, TeB VerseC.
7oBer, A. (2!. Deci#i! S%pp'$ S9#$em#C C!cep$# a!d
Re#%'ce#. -edar Falls, 9.A.) A'' *esources. -5., prepu(lication 7AF
version (http)@@dssresources.com@dss(ooL!.
*aden, T. (+00;!. Aata, data everCBhere. I!,'ma$i! ;e6, 5ct.3
>http)@@BBB.mem(ers.aol.com@nraden@iB = mct+.htm!.
20
*oBleC, Vennifer (+00=!. Khat is informationO I!,'ma$i! Se'*ice#
G U#e, -H>:!, 2:3-2;;.
&homsen, E. (+00<?. OLAP Sl%$i!#C 5%ildi!/ M%l$idime!#i!al
I!,'ma$i! S9#$em#. Vohn KileC X 'ons, TeB RorL.
&ur(an, E., V.E. Aronson (+00=!. Deci#i! S%pp'$ S9#$em# a!d
I!$elli/e!$ S9#$em#. (Fifth Edition!. 7rentice Mall, Gpper 'addle *iver, TeB
VerseC.
Glman, V.A. (+0=2!. P'i!ciple# , Da$a6a#e S9#$em#. -omputer
'cience 7ress, ..A.
Katson, M.V., 7. HraC (+00<!. Deci#i! S%pp'$ +! $1e Da$a
;a'e1%#e. 7rentice Mall, EnghleBood -liffs, TeB VerseC.
Kitten, 9.M., E. FranL, V. HraC (editors!. (2!. Da$a Mi!i!/C
P'ac$ical Mac1i!e Lea'!i!/ Tl# a!d Tec1!iI%e# 8i$1 Ea*a
Impleme!$a$i!#. .organ Saufmann 7u(lishers.
Publicat in INFORMATICA ECONOMICA IV (4),8-22


3

S-ar putea să vă placă și