Sunteți pe pagina 1din 30

+ DECIZIE ASISTATA DE CALCULATOR; CONCEPTE, METODE I TEHNICI PENTRU DECIZIILE CENTRATE PE ANALIZA DATELOR F. G. Filip Academia R ma!

a "i I!#$i$%$%l !a&i !al de ce'ce$a'e(de)* l$a'e +! i!, 'ma$ica(ICI Re)%ma$. Analza datelor constitue o etapa initiala importanta in luarea deciziilor. Ea permite identificarea cauzelor care duc la aparitia unei situatii decizionale. Acest al doilea articol al unei serii dedicate prezentarii conceptelor i solutiilor din domeniul deciziei asistate de calculator face o trecere n revista a unor rezultate recente privind magaziile de date, prelucrarea analitica on-line i mineritul datelor. Acestea reprezinta tehnologii noi si in plina dezvoltare, care au atras atentia in primul rand a marilor firme producatoare de produse informatice. -. I!$' d%ce'e ntr-un articol anterior(Filip,2 !, au fost prezentate c"teva metode de asistare a proceselor decizionale n care pozi#ia central$ era ocupat$ de intui#ia i %udecata uman$. &ot n acel capitol, s-a afirmat c$, acele metode, n care caracterul calitativ predomin$, necesit$ de multe ori efectuarea unei analize a datelor. 'copul acestui articol este de a face o prezentare sistematic$ a principalelor concepte i rezultate n domeniul asist$rii cu mi%loace informatice a acelor activit$#i din procesul decizional care presupun analiza datelor. Este vor(a de trei concepte i anume) a! magaziile(sau depozitele) de date (Data warehouse DW); prelucrarea analitic on line (On line analytic processing OLAP) i c! mineritul datelor (Data mining D ) , denumit uneori descoperirea cuno!tin"elor (#nowledge data disco$ery %DD)& *a#iunile care au condus la alegerea con#inutului acestui articol privesc at"t continuitatea prezent$rii c"t i, mai ales, efervescen#a domeniului a(ordat. ntr-adev$r, dup$ cum s-a ar$tat mai sus, metodele i tehnicile care urmeaz$ a fi prezentate n acest articol au ca scop facilitarea proceselor decizionale n

2 care intui#ia i %udecata sunt prevalente i au i au uneori nevoie de un suport informa#ional. n ceea ce privete dezvoltarea puternic$ a domeniului, n special n partea a doua a ultimei decade scurse, se o(serv$ un interes ma%or i o competi#ie acer($ din partea marilor produc$tori de tehnologii informatice. Acestea au contientizat limitele sistemelor actuale de gestiune a (azelor de date n conte,tul schim($rilor petrecute (i oportunit$#ilor ap$rute! n modul de administrare a ntreprinderilor i afacerilor, care presupune considerarea c"t mai operativ$ a unei multitudini de surse informa#ionale diverse. n continuare, articolul este organizat dup$ cum urmeaz$) -apitolul 2 a(ordeaz$ pro(lematica magaziei de date. .agazia de date este un concept afirmat la nceputul anilor /0 i este definit$ prin analogie cu depozitele de (unuri industriale. -a i acestea, magazia de date este alimentat$ dintr-o multitudine de (aze de date care au meniri diverse n scopul com(in$rii elementelor intrate n magazie ntr-un 1pachet2 integrat, care con#ine elemente verificate. .ai nt"i (n su(capitolul 2.+.!, se evoc$ o ta,onomie vizionar$ (propus$ cu peste dou$ decenii n urm$! a instrumentelor informatice de asistare a deciziilor, urmat$ de enumerarea tipurilor de date folosite n administrarea i func#ionarea unei organiza#ii i de prezentarea necesit$#ii noului concept. 'u(capitolul 2.2. prezint$ caracteristicile definitorii generale ale magaziei de date i descrie c"teva tipuri particulare. -apitolul 3. este dedicat sistemelor de prelucrare analitic$ on 4 line (56A7!. 56A7 este instrumentul informatic care permite realizarea 1pachetului2 de date plec"nd de la surse diferite i livrarea informa#iilor n forma solicitat$ pentru luarea deciziei. 'e prezint$ mai nt"i (n su(capitolul 3.+.! defini#ia dat$ de -odd, care a inspirat, 1micarea 56A72, tipurile func#ionale i 8testul FA'.92, care poate califica un produs informatic n categoria 56A7. n continuare, su(capitolul 3.2. con#ine o descriere a principalelor dou$ direc#ii tehnologice i anume) a! 'azele de date multidimensionale ( ultidimensional data 'ases D(! i solu"iile

3 rela"ionale OLAP ()elational*OLAP )OLAP! denumite uneori 156A7-perelational2. 9deile 56A7 au 1r$d$cini2 vechi i acestea se evoc$ n su(capitolul 3.3. -apitolul :. trece n revist$ defini#iile i tehnicile folosite n mineritul datelor. -apitolul ;., care ncheie acest articol, con#ine unele comentarii privind domeniul instrumentelor de asistare a deciziilor centrate pe date i recomand$ c"teva surse importante de documentare (n special pe 9nternet!, care sunt n curs de continu$ m(og$#ire. Articolul de fa#$ are o orientare mai pronun#at$ dec"t cel anterior( Filip,2 ! c$tre tehnologiile informatice. El este recomandat n primul r"nd analitilor i facilitatorilor proceselor decizionale. .. Ma/a)ii de da$e .agazia (sau depozitul! de date reprezint$ un nou care vizeaz$ asistarea proceselor decizionale n conte,tul noilor cerin#e de administrare a organiza#iilor folosind analiza a c"t mai multe informa#ii provenind din surse diferite. ..-. E* l%&ii +! a#i#$a'ea deci)iei ce!$'a$e pe da$e Asistarea deciziei centrat$ pe date au un caracter normativ relativ sc$zut. -aracteristica sa esen#ial$ const$ n furnizarea la timp a informa#iilor cerute de decident n activit$#ile sale (azate n primul r"nd pe intui#ie i %udecat$ pentru rezolvarea pro(lemei decizionale. ..-.-. O *i)i%!e $imp%'ie 6a sf"ritul anilor /< , Alter (+0<<, +0= !, n ncercarea sa de a realiza o clasificare a instrumentelor i sistemelor informatice folosite n acea vreme pentru asistarea deciziilor, a%ungea la concluzia c$, cel mai util criteriu de

: clasificare este 1gradul n care rezultatele furnizate de produsul informatic poate determina +n mod direct decizia2, sau, altfel spus, 1gradul n care ieirile sistemului implic$ o ac#iune >efectiv$?2. Alter distingea apte clase, pe care le propunea n ordinea cresc$toare a gradului de normativitate. Aceste clase variau de la sistemele de tip 1sertare cu dosare2 (cele mai 1pasive2!, la modelele computerizate care sugereaz$ direct decizia (cele mai 1normative2! n cazul unor situa#ii decizionale (ine structurate. -ele apte clase se grupau n final n dou$ superclase) a! sistemele informatice 1orientate c$tre date2 i (! sistemele 1orientate c$tre modele2. .etodele i tehnicile care corespund celei de a doua superclase vor fi descrise n capitolele : 4 < care urmeaz$. 9nstrumentele orientate c$tre date ndeplinesc func#ii de reg$sire a datelor i@sau de analiz$ a datelor. 7rincipalele clase identificate de Alter (+0<<! sunt prezentate n continuare) +. ,istemele de tip -sertar cu dosare., care au ca scop automatizarea unui mod de lucru manual i servesc la accesul on-line la anumite date. Ele sunt destinate persoanelor cu sarcini opera"ionale (func#ionari, efi de ateliere! care au nevoie de a avea acces imediat la valoarea curent$ a anumitor varia(ile. Ae e,emplu, un ef de atelier, atunci c"nd dorete s$ lanseze o anumit$ lucrare pentru a suferi o prelucrare mecanic$, are nevoie s$ cunoasc$ situa#ia curent$ a nc$rc$rii mainilor unelte din atelier. n acelai mod, patronul unui magazin tre(uie s$ cunoasc$ nivelul stocurilor produselor aflate n aprovizionare. 2. ,isteme pentru analiza datelor, care a%ut$ personalul cu sarcini de spri%in al conducerii n analiza fiierelor cu date curente i istorice cu scopul de a produce rapoarte pentru manageri. 17rodusele generalizate2 permit analize cu caracter general folosind datele e,istente ntr-o (az$ de date i chiar formularea i programarea unor modele matematice simple. -a e,emple, depozit sau 1la raft2 pentru a lansa comenzi de

; se pot enumera rapoartele privind stadiul de realizare a unor comenzi de fa(rica#ie, sau analiza eficien#ei unor investi#ii. 3. ,istemele pentru analiza in/orma"iilor, care asigur$ accesul la o serie de (aze de date destinate asigur$rii informa#ionale a deciziilor i la modele de dimensiuni reduse n scopul furniz$rii informa#iilor specifice pentru rezolvarea unor situa#ii decizionale particulare. Aup$ cum ar$ta Alter (+0<<!, sistemele din aceast$ clas$ 1sunt proiectate s$ e,trag$ datele relevante din aplica#iile de prelucrare electronic$ a datelor ( 0lectronic data processing 0DP! proprii ale ntreprinderii i s$ le completeze cu date e,terne2. 5 caracteristic$ definitorie a unor astfel de sisteme o constituia faptul c$ accesul nu tre(uia s$ fie st"n%enit de considerente privind planificarea func#ion$rii eficiente a unui centru de calcul. Aup$ cum se va vedea n continuare n acest capitol, sistemele din categoria 3 anticipeaz$ din punct de vedere func#ional dezvolt$rile tehnologice ale anilor /0 n domeniul magaziilor de date i n realizarea de instrumente de tip 56A7 sau 01, (02ecuti$e in/ormation systems!. ..-... Tip%'i de da$e nainte de a analiza tipurile de date care se acumuleaz$ ntr-o organiza#ie cu o vitez$ din ce n ce mai mare, se va ncerca o foarte sumar$ clarificare a con#inutului unor no#iuni, care sunt, de multe ori, folosite n mod amestecat. Este vor(a de date, in/orma"ii i cuno!tin"e. F$r$ a avea preten#ia unei a(ord$ri aprofundate, f$cute din mai multe perspective (teoria comunic$rii, tiin#ele cognitive, tiin#a organiz$rii, tiin#ele politice, literatura, informatica!, precum cea propus$ de *oBleC (+0==!, se vor adopta n continuare urm$toarele n#elesuri care sunt asem$n$toare cu cele propuse de &ur(an i Aronson (+00=! i &argett (+00D!. +. Datele sunt 1urmele2 l$sate de anumite o(iecte (evenimente, st$ri, situa#ii sau activit$#i petrecute sau anticipate, procese de calcul, %udec$#i, opinii

D etc.! care pot fi reprezentate su( forma unor numere, iruri de caractere, grafice, sunete sau imagini statice (fotografie! sau n micare (video! n vederea colect$rii, memor$rii i altor prelucr$ri ulterioare. 6uate ca atare, n conte,tul unei anumite pro(leme, datele pot s$ nu ai($ un n#eles care ar putea servi unei activit$#i decizionale. 2. 1n/orma"iile sunt acele date care sunt luate n considerare i sunt organizate n aa fel nc"t au un n#eles i o valoare n conte,tul pro(lemei decizionale i i sunt de folos utilizatorului pentru rezolvarea sarcinii sale. 3. 3uno!tin"ele sunt acele date organizate i prelucrate astfel nc"t favorizeaz$ n#elegerea unui anumit domeniu c"t i identificarea rezolvarea eficace a pro(lemelor din domeniul respectiv. n continuare, se va urm$ri folosirea termenului cel mai potrivit, dar pot ap$rea situa#ii n care denumiri ncet$#enite de%a n literatur$ nu sunt aparent n concordan#$ cu accep#iunile adoptate mai sus. &ur(an i Aronson (+00=! identific$ mai multe tipuri de date care se acumuleaz$ ntr-o organiza#ie i anume) +. Aatele interne se refer$ la resursele organiza#iei (umane, tehnice, financiare etc.! i procesele, evenimentele i activit$#ile desf$urate n acea organiza#ie. ntr-o organiza#ie informatizat$, aceste date sunt stocate de o(icei n diferite (aze de date care servesc n aplica#ii distincte. 2. Aatele e2terne privesc mediul ncon%ur$tor (natural, economic, social, de reglement$ri! n care organiza#ia i desf$oar$ activitatea i pot avea surse diferite precum) mi%loacele de informare n mas$, opiniile comunicate de c$tre clien#i i parteneri, (i(liotecile specializate sau generale, 9nternetul i serviciile diferite de ($ncile de date. 3. Aatele care apar"in unor persoane anga%ate n organiza#ie i pe care acestea le folosesc n interesul organiza#iei. 7rincipalele pro(leme generale care pot ap$rea n ceea ce privete con#inutul datelor au fost semnalate de Alter (+0= ! i sunt legate de i

< imprecizia, incompletitudinea, indisponi(ilitatea sau chiar ine,isten#a (deoarece nu le-a cerut nimeni! acelor date care sunt considerate necesare la un moment dat. E,plozia informa#ional$ asociat$ cu multiplicarea i diversificarea surselor au condus n ultima vreme la alte tipuri de complica#ii precum) opacitate (supraa(unden#$ a datelor disponi(ile asociat$ cu nerelevanta lor pentru sarcinile de rezolvat!, con#inut contradictoriu i formate incompati(ile datorit$ platformelor diferite pe care datele se stocheaz$. Acestor complica#ii li se adaug$ pro(lemele de natur$ tehnologic$ care vor fi e,puse n continuare. ..-.0. Ra&i%!i $e1! l /ice Apari#ia conceptului de magazie de date este %ustificat$ prin limitele sistemelor de prelucrare on line a tranzac"iilor (On line transaction Processing OL4P! . Acestea nu pot furniza cu promptitudinea cerut$ i n formatul dorit c$tre manageri acele informa#ii care le sunt necesare. Ae cele mai multe ori, este vor(a de informa#ii care servesc la verificarea unor ipoteze nl$n#uite considerate n rezolvarea pro(lemelor decizionale. Aceste informa#ii se pot o(#ine (n ma%oritatea cazurilor! din analiza unor serii de timp diferite, care se g$sesc n (aze de date distincte. n contrast cu 1datele opera#ionale2, pe care le manipuleaz$ sistemele de tip 56&7, cerin#ele decidentelor se numesc n terminologia 9E. (+00D! 1date informa#ionale2. -"teva motive pentru o a(ordare nou$ sunt date n continuare (Ahar, 'tein, +00<F 9E., +00DF &ur(an, Aronson, +00=!. n primul r"nd, sistemele de tip 56&7, sunt specializate pe tipuri de pro(leme, de e,emplu conducerea produc#iei, efectuarea de tranzac#ii comerciale etc. 7rin firea lucrurilor, ele au ca misiune principal$ manipularea rapid$ i sigur$ a datelor i sunt denumite uneori sisteme cu misiune critic$, sau 1cu timp critic2 (1mission@time critical sCstems2!. 7entru a asigura performan#ele cerute i, uneori, din motive istorice sau de securitate, ele nu sunt proiectate pentru a lucra n cooperare cu

= alte sisteme. n consecin#$, cu toate progresele tehnologice relative privind 1integrarea aplica#iilor2 (Filip, E$r(at, +000!, realizarea de misiuni suplimentare ca de e,emplu cele de furnizare de informa#ii c$tre manageri, altele dec"t cele originare, poate reprezenta o pertur(a#ie inaccepta(il$, care poate impieta asupra performan#elor proceselor conduse cu astfel de sisteme. Alte motive care indic$ sistemele de tip 56&7 ca neadecvate pentru nevoile managerilor sunt legate de) a! limitarea datelor manipulate de aceste sisteme la valorile curente necesare ndeplinirii misiunii lor i (! aspectele de securitate n cazul 4 din ce n ce mai r$sp"ndit al produc#iei glo(alizate 4 n care diferitele (aze de date sunt distri(uite din punct de vedere geografic. Aac$ se analizeaz$ pro(lema din punct de vedere al instrumentului informatic care administreaz$ (aza de date se pot o(serva alte complica#ii. ntr-o organiza#ie e,ist$ 1sisteme motenite2(1legacC sCstems2! care sunt realizate prin folosirea unei diversit$#i de sisteme de gestiune a 'azelor de date (,5(D) (Aate, +0=DF Glman, +0=2!. Acestea sunt fie mai vechi (inde,at secven#iale, de tip re#ea, ierarhice!, fie mai noi (rela#ionale, orientate pe o(iecte!, sau specializate (de e,emplu pentru lucrul n timp real, pentru stocarea de date multimediale etc.!. 6a ora actual$ predomin$ 'HEA de tip rela#ional, care permit efectuarea de zeci de mii de tranzac#ii pe minut (+00D!. 'HEA rela#ionale au o serie de avanta%e. Ele permit acumularea unor volume impresionante de date ntr-un mod neredundant su( forma unor ta(ele, care pot fi com(inate prin anumite opera#ii, (ine fundamentate matematic, pentru a o(#ine informa#iile dorite. 9nterogarea poate fi realizat$ ntr-un mod fle,i(il folosind lim(a%ul 'I6 (1'tructured JuerrC language2!. -u toate aceste avanta%e, folosirea direct$ a 'I6 de c$tre un manager de pe nivelurile superioare ale ierarhiei de conducere, necesit$ din partea acestuia cunotin#e i timp pe care acesta nu le are n unele cazuri. 7entru a ocoli aceste nea%unsuri, o solu#ie intermediar$ au constituit-o sistemele de in/ormare a directorilor (02ecuti$e in/ormation systems6 01,!.

0 Acestea sunt nite sisteme de tip 1front-end2 pentru sistemele de tip 56&7 i au ca misiune realizarea de opera#ii de agregare a datelor primite de la sistemele de tip 56&7 care sunt stocate n mod intermediar n dispozitivele de memorare ale E9'. .anagerul, n loc s$ formuleze comenzi de interogare ntr-un lim(a% misterios pentru el ('I6! au posi(ilitatea s$ aleag$ dintr-un meniu presta(ilit pentru a o(#ine informa#ia necesar$. Aei solu#iile de tip E9' au reprezentat un pas important nainte n asistarea deciziilor centrate pe date, ele sufer$ de anumite nea%unsuri izvor"te din ns$i concep#ia de realizare. n primul r"nd, culegerea de date de la sisteme de tip 56&7 r$m"ne o pro(lem$ care, uneori, nu este simpl$ din punct de vedere tehnic. n al doilea r"nd, solu#ia E9' sufer$ de infle,i(ilitate. 9nfle,i(ilitatea se manifest$ at"t n utilizare (este necesar$ parcurgerea de c$tre manager a unor secven#e de meniuri presta(ilite i nimic mai mult sau mai pu#in! c"t i n ntre#inere i dezvoltare, situa#ie n care poate fi necesar$ reproiectarea de la nceput pentru a considera cerin#e de informare suplimentare. 'u(iectul E9' va fi dezvoltat ntr-un articol ulterior. -ele ar$tate mai sus c"t i limitele atinse de instrumentele de tip sisteme de gestiune a (azelor de date au determinat necesitatea unui concept nou (magazia de date! i, respectiv, a unor instrumente informatice noi (56A7!. Acestea vor fi prezentate n su(capitolele care urmeaz$. ..-.2. O # l%&ie m de'!3 'olu#ia pentru asistarea deciziei centrate pe date, adoptat$ cu entuziasm de furnizori mai mari sau mai mici de produse informatice(7endse, 2 prelucrare analitic$ on-line (56A7!. .agazia de date este o (az$ de date specializat$ care r$spunde nevoilor i cerin#elor specifice deciden#ilor afla#i pe nivelurile superioare ale ierarhiei de conducere a ntreprinderii. Ea cuprinde multe tipuri de date, provenind de c! se (azeaz$ pe conceptul de magazie de date (AK! i pe instrumentele de

+ la mai multe 1surse de aprovizionare2, care pot fi sisteme de tip 56&7, calculatoare de proces, re#ele industriale, (i(lioteci de c$r#i, fotografii sau -A-*5., 9nternet etc. E,istenta mai multor tipuri de date diferentiaza magazia de date de noile versiuni 3-A ale foilor de calcul electronic. Acestea au fost inaugurate de3-A sheet al 9E.-6otus i au fost urmate de solutiile de tip 8note(ooL2 i 8BorL(ooL2 ale produselor Iuatro 7ro for KindoBs (al lui -orel! i respectiv E,cel (al lui .icrosoft!. 7rincipalele opera#ii care se efectueaz$ asupra datelor primite sunt (Ahar, 'tein, +00<!) +. +ncrcarea datelor din diferite surse, care const$ n urm$toarele) a! detectarea datelor noi de interes aflate n (azele de date surs$ i (! determinarea modului i a locului pentru nc$rcare. nc$rcarea se efectueaz$ la momente programate, n regim 1pe loturi2 ((atch! pentru a nu pertur(a func#ionarea sistemelor furnizoare de tip 56&7F 2. con$ersia datelor din formatul original n cel adoptat n magazia de dateF 3. cur"irea datelor, care cuprinde func#ii de identificare i corectare a erorilor de conversie i completarea omisiunilorF :. trans/ormarea datelor prin opera#ii de agregare i rezumare. 9nstrumentele de tip 56A7 servesc la manipularea datelor ntr-un mod care e,tinde i fle,i(ilizeaz$ func#iile i maniera de operare a sistemelor de tip E9' descrise n su(capitolul anterior. ntr-un mod intuitiv, func#ionarea 56A7 este sugerat$ de opera#ii de tip 1feliere i decupare de cu(ule#e2 ( ,lice and diceig ,7D ! a (azei de date n scopul de a permite decidentul s$ g$seasc$ acele informa#ii care i permit constatarea unor situa#ii de interes sau verificarea unor ipoteze. .ai multe detalii despre 56A7 vor fi date n capitolul 3. .... De,i!i&ii

++ -onform defini#iei lui 9nmon (+00;!, aparent cea mai r$sp"ndit$ i acceptat$ p"n$ n prezent, o magazie de date este o colec#ie integrat$ de date de tip serii de timp, nevolatile, orientat$ pe un su(iect i care are ca scop spri%inirea proceselor decizionale ale managerilor. Aceast$ defini#ie a celui care este considerat 1p$rintele magaziei de date2 (HraC, +00<! va fi detaliat$ i particularizat$ n urm$toarele dou$ su(capitole (2.2.+. i 2.2.!. ....-. Ca'ac$e'i#$ici 5 magazie de date este n general un lucru scump. Ea poate costa milioane de dolari i stoca volume de date cuprinse ntre ; de Higaocteti i c"#iva &erraocteti (HraC, Katson, +00D!. 7entru ca magazia de date s$ merite investi#ia f$cut$, ea tre(uie s$ serveasc$ necesit$#ile managerilor prin oferirea de r$spunsuri rapide i n conformitate cu cerin#ele de interogare i de prezentare ale acestora. 7entru ca magazia de date s$ merite investi#ia f$cut$, ea tre(uie s$ serveasc$ necesit$#ile managerilor prin oferirea de r$spunsuri rapide i n conformitate cu cerin#ele de interogare i de prezentare ale acestora. 7entru aceasta, o magazie de date tre(uie s$ posede o serie de caracteristici generale (9nmon, +00;F HraC, Katson, +00D!, care se prezint$ mai %os) +. ,epararea /izic de (azele de date opera#ionale. Aceast$ cerin#$ are ca scop pe de o parte, furnizarea operativ$ a informa#iilor necesare procesului decizional i pe de alt$ parte, evitarea pertur($rii aplica#iilor operative, care tre(uie s$ satisfac$ standardele legate de timpul de r$spuns i de siguran#a opera#iilor. 2. Orientarea ctre un su'iect. 'pre deose(ire de (azele de date opera#ionale care sunt centrate pe aplica#ii sau func#ii, magazia de date este organizat$ ca s$ vizeze anumite su(iecte de interes pentru manager precum) clien#i, produse, activit$#i.

+2 3. 1ntegrarea f$r$ e,cep#ii a datelor. Aceasta se traduce prin consisten#a (uniformitatea!) a! conven#iilor folosite n definirea datelor, (! unit$#ilor de m$sur$ utilizate, c! atri(utelor datelor etc. :. Pstrarea seriilor de timp& 'pre deose(ire de datele opera#ionale, care sunt vala(ile numai n momentul accesului, cele con#inute n AK sunt vala(ile oric"nd. Aceasta se traduce prin urm$toarele tr$s$turi derivate) a! orizontul de timp de ;-+ ani (fa#$ de ma,imum c"teva zeci de zile n cazul opera#ional!, (! structura cheii de acces, care con#ine elementul 1timp2 (zi, lun$, an! i c! interzicerea modific$rii datelor stocate corect la un anumit moment discret de timp. ;. 8e$olatilitatea datelor. Aceasta se traduce prin reducerea num$rului de tipuri de opera#ii permise n cazul AK la dou$) a! nc$rcarea ini#ial$ i (! accesul la date, spre deose(ire de cazul opera#ional, n care se efectueaz$ o multitudine de nser$ri, tergeri i actualiz$ri la nivelul unei singure nregistr$ri. -onsecin#ele acestei caracteristici sunt diverse. n primul r"nd, dispare pericolul poten#ial al actualiz$rilor eronate. n al doilea r"nd, se poate realiza proiectarea la nivel fizic pentru a optimiza accesul f$r$ a mai #ine cont de cerin#ele de neredondan#$ i normalizare. n al treilea r"nd, dispare necesitatea folosirii unor tehnici complicate pentru asigurarea integrit$#ii datelor i pentru %urnaliere i recuperare c"t i pentru de(locare din punct mort. ...... Tip%'i de ma/a)ii de da$e &ermenul de magazie de date este destul de general. Gnii autori sau furnizori de produse informatice folosesc diferite denumiri pentru a numi unele cazuri particulare sau componente ale AK. Astfel &ur(an i Aronson (+00=! identific$ urm$toarele 1componente2) a! 'aze de date /izice mari (n care sunt con#inute datele i metadatele c"t i programele de 1cur$#are2, organizare, asam(lare i preprocesare!, (! magazii de date logice (care

+3 cuprind numai metadatele i programele de organizare, asam(lare, preprocesare mpreun$ cu informa#iile necesare pentru a g$si i a avea acces la date indiferent de locul unde sunt stocate! i c! 1t"rguri2 sau compartimente de date (1data mart2!, care reprezint$ su(seturi ale unei AK, necesit$#ile unei p$r#i sau func#ii a ntreprinderii. &"rgurile de date mpreun$ cu leg$turile sta(ilite prin intermediul AK logice constituie componente n dezvoltarea incremental$ a unei AK de ntreprindere (9nmon, +00=!. 5 clasificare recent$ i sistematic$ a tipurilor de magazii de date este propus$ de c$tre Firestone (2 !, care identific$ cinci tipuri de magazii de date. &oate tipurile au n comun faptul c$ sunt 1colec#ii integrate, nevolatile, de date de tip serie de timp care au ca scop asistarea proceselor decizionale manageriale2. -eea ce diferen#iaz$ tipurile de magazii de date este aria de cuprindere a proceselor decizionale, dup$ cum se arat$ mai %os) +. .agazia de date galactic (HAK!, asist$ procesele decizionale manageriale care privesc oricare !i toate procesele de (usiness i compartimentele ntreprinderi c"t i ntreprinderea luat$ ca un ntreg. 2. .agazia de date orientat pe un proces de 'usiness (E7AK! asist$ procesele decizionale care privesc oricare !i toate procesele de (usiness i leg$turile lor reciproce precum i cu mediul lor ncon%ur$tor. 3. .agazia de date departamental (AAK! asist$ procesele decizionale care privesc oricare !i toate compartimentele i interac#iunile lor reciproce precum i cu mediul lor ncon%ur$tor. :. Gn t"rg de date (data mart! de tip proces de 'usiness ((PD ! asist$ procesele decizionale centrate pe un singur proces de (usiness. ;. Gn t"rg de date departamental (AA.! asist$ procesele decizionale centrate pe un singur compartiment. 6egat de aceast$ clasificare, Firestone (2 descretere ! face c"teva o(serva#ii interesante. n primul r"nd el consider$ c$ interesul c$tre HAK este n i c$, E7AK i E7A. sunt mai de dorit datorit$ orient$rii

+: actuale c$tre considerarea proceselor de (usiness, care nu #in seama de grani#ele compartimentelor (Mammer, -hampC, +003!. n acelai timp, Firestone (2 ! mai o(serv$ c$ simpla reuniune a unor AA. nu constituie o magazie de date deoarece nu asigur$ suportul pentru deciziile manageriale care privesc procesele care traverseaz$ grani#ele compartimentelor sau interac#iunile dintre compartimente i pe cele cu mediul ncon%ur$tor. n acelai spirit se arat$ c$, reuniunea unor E7A. nu constituie o magazie de date. &otui autorul citat nu respinge posi(ilitatea distri(uirii la nivel fizic a unei magazii de date care poate fi caracterizat$ la nivel logic aa cum s-a ar$tat la nceputul acestui su(capitol n prima clasificare prezentat$. 0. P'el%c'a'ea a!ali$ic3 ! li!e -onform cu Hlosarul propus de 56A7 -ouncil (+00<!, 1 prelucrarea analitic on line (56A7! desemneaz$ o categorie de instrumente softBare, care permit analitilor, managerilor i directorilor s$ n#eleag$ esen#a datelor printr-un acces rapid, consistent i interactiv la o mare varietate de vederi posi(ile ale informa#iilor, care au fost o(#inute prin transformarea datelor primare, astfel nc"t s$ reflecte dimensiunile reale ale ntreprinderii aa cum o percepe i o n#elege utilizatorul2. Gn ser$er OLAP este, conform aceluiai Hlosar (56A7 -ouncil, +00<! 1un motor de tip multi-utilizator, de mare capacitate pentru manipularea datelor proiectat astfel nc"t s$ poat$ lucra cu structuri de date multidimensionale. 5 structur multidimensional este alc$tuit$ astfel nc"t orice dat$ poate fi localizat$ i accesat$ prin intersec#ia coordonatelor sale dea lungul acelor dimensiuni care definesc amplasarea datei. 7roiectarea serverului i a structurii de date sunt realizate astfel nc"t s$ se poat$ realiza at"t optimizarea reg$sirii ad-hoc a informa#iei c"t i calcule fle,i(ile folosind formule matematice2.

+; 56A7 i magazia de date sunt complementare. Aup$ cum se arat$ n -artea al($ a -onsiliului 56A7 (Forsman, +00<!, este important s$ se fac$ distinc#ia ntre conceptul de magazie de date i 56A7. n timp ce magazia de date acumuleaz$ informa#ii cu caracter tactic ntr-o (az$ de date rela#ional$ specializat$, cu scopul de a furniza r$spunsuri la ntre($ri de tipul 1-ineNO2 i 1-eNO2, 56A7 folosete de o(icei o vedere cu mai multe dimensiuni a unor date agregate pentru a putea a r$spunde la ntre($ri suplimentare de tipul 1Ae ceN.O2 (1KhCNO2! i 1-e se nt"mpl$ dac$NO2 (Khat ifNO2!, tipice pentru sistemele de asistare a deciziei. 0.-. E* l%&ii Aei, dup$ cum arat$ 7endse (2 (!, r$d$cinile 56A7 pot fi identificate cu mul#i ani n urm$ n lim(a%ul A76, adev$rata lansare a termenului a fost prile%uit$ de un articol al lui -odd et all. (+003!. -el care este socotit 1p$rintele (azelor de date rela#ionale a ar$tat c$, datele ar tre(ui folosite pentru o prelucrare analitic$ i c$ n acest scop (azele de date multidimensionale sunt mai adecvate i, n consecin#$, le vor nlocui pe cele rela#ionale. 0.-.-. F%!c&ii *aden (+00;! distinge dou$ tipuri de (az$ de instrumente 56A7) +. 56A7 n sens restr9ns care permite interog$ri interactive ale datelor prin care se poate realiza o analiz$ const"nd din /elieri !i decupri de cu'ule"e (8slice and dice2! ale (azei de date i din /orri (1drill-doBn2! succesive pe niveluri de detaliere, din ce n ce mai pronun#ate. 9nforma#iei i se atri(uie caracteristica de multidimensionalitate i poate fi afiat$ n ta(ele ncruciate, pentru care e,ist$ instrumente specializate pentru a realiza pivotarea a,elor i ta(ularea ncruciat$. &oate opera#iile sunt numai de citire.

+D 2. 56A7 +n sens larg permite opera#ii suplimentare precum) a! actualizare, (! calcule de (az$ de agregare sau consolidare pe una sau mai multe dimensiuni i c! calcule mai avansate de tipul) preduc#ie, analiz$ de trenduri i chiar optimizare. 3. 0.-... Re/%lile l%i C dd "i $e#$%l FASMI -artea al($ propus$ n +003 de -odd et all, intitulat$ 17roviding 56A7 (5n line AnalCtical 7rocessing! to Gser - AnalCst) An 9& .andate2, la comanda firmei Ar(or 'oftBare (7endse, 2 a!, con#inea +2 reguli, a c$ror ndeplinire putea califica un produs softBare ca fiind de tip 56A7. Aceste reguli, au f$cut epoc$ la vremea respectiv$, dei au e,istat suspiciuni c$ ele au fost influen#ate de comanda unui produc$tor de softBare (7endse, 2 (HraC, Katson, +00DF 7endse, 2 a!) a!. *egulile defineau urm$toarele caracteristici ale produselor de tip 56A7 ): 7osi(litatea unor $ederi conceptuale multidimensionale care este asociat$ cu opera#ii de feliere i decupare de cu(uri (1slice and dice2!. ); 4ransparen" pentru utilizator, n sensul c$ acesta putea nici m$car s$ nu ai($ idee de sursele datelor, care puteau fi oric"t de eterogene. )< Accesi'ilitatea, care d$dea motorului 56A7 caracterul de mediator (2middleBare2! ntre sursele eterogene de date i front-end-ul 56A7. )= )aportarea consistent, care cere ca performan#ele rapoartelor s$ nu fie degradate n m$sur$ semnificativ$ prin creterea num$rului de dimensiuni ale (azei de date. )> Arhitectura de tip client prestator (1client 4 server2!, asociat$ cu un grad ridicat de inteligen#$ a instrumentului 56A7, astfel nc"t clien#i noi i diveri s$ poat$ fi ataa#i cu un efort minim de programare. )? 8umr generic de dimensiuni echi$alente at"t n ceea ce privete structura c"t i opera#iile posi(ile. Aceast$ regul$ este cea mai controversat$ din tot setul celor +2 reguli. 7endse (2 a! arat$ c$, n

+< sistemele aplicative, e,ist$ tendin#e de a ignora aceast$ regul$, n timp ce furnizorii de produse informatice declar$ c$ ncearc$ s$ o respecte. )@ .anipularea automat$ a unor matrici rare. Glterior aceasta a fost e,tins$ la aAustarea automat a schemei la ni$el /izic n scopul adapt$rii la tipul de model de date, la volumul i la e,isten#a unor pozi#ii goale n matricea datelor, care poate deveni rar$. )B ,uport multi6utilizator, care e,tindea accesul dincolo de aplica#iile 1numai citire2 (1read onlC2! i permitea acces concurent (inclusiv actualiz$ri! cu facilit$#i de asigurare a integrit$#ii i securit$#ii datelor. )C Efectuarea f$r$ restric#ii de opera#ii ntre dimensiuni care nsemna c$, se putea realiza orice fel de opera#ii folosind datele care aveau coordonatele n dimensiuni diferite. ):D anipularea intuiti$ a datelor, care tre(uia realizat$ prin ac#iunea direct$ asupra celulelor dintr-o vedere f$r$ a recurge la micarea prin meniuri, sau la comenzi multiple. ):: )aportarea /le2i'il, care cerea ca aran%amentul a,elor n rapoarte s$ fie la li(era alegere a utilizatorului. ):; 8umrul nelimitat de dimensiuni !i ni$eluri de agregare , fiind acceptate totui (din motive de capacitate limitat$ a calculatoarelor! valori de minimum +; dimensiuni i fiind recomandate valori de 2 dimensiuni iar, mai de cur"nd, 7endse (2 7endse (2 urmeaz$) +. 4rsturi de 'az, care sunt numerotate de la F+ la F=. Aintre acestea, tr$s$turile F+, F2, F3, F;, FD, F< i F= corespund n ordine regulilor *+, de dimensiuni. Ahar i 'tein (+00<! indic$ o limit$ ma,im$ practic$ de < a! arat$ c$ sunt pu#ine aplica#ii care dep$esc cifre care variaz$ ntre = i + dimensiuni. a! arat$ c$, n +00;, -odd a mai ad$ugat ase reguli i a restructurat ntregul set n patru grupe de trsturi (1features2!, dup$ cum

+= *+ , *3, *;, *2 i respectiv *=. n plus, sunt introduse urm$toarele tr$s$turi noi) E=&02trac"ie pe loturi (-'atch.) $s& de tip interpretor, care se traduce prin posi(ilitatea de a folosi fie propria (az$ de date aran%at$ special, fie de avea acces 1pe viu2, direct de la surse e,terne. E>&Asistarea modelelor de natur de tip OLAP i anume) a! raportarea static$ parametrizat$, (! 1felierea si decuparea de cu(ule#e cu forarea n ad"ncime2, c! analiza de tip 1-e se nt"mpl$ dac$N.O2 (simulare! i d! model de 1urm$rire a unui scop2 (optimizare!. 2. 4rsturile speciale, numerotate cu F0 4 F+2) EC& 4ratarea datelor nenormalizate& E:D& emorarea rezultatelor OLAP i p$strarea lor separat de datele surs$. a! E::& 02tragerea $alorilor care lipsesc , interpretat$ de 7endse (2 prin realizarea distinc#iei acestor valori de valorile nule. E:;& 4ratarea $alorilor care lipsesc, care sunt ignorate de analizorul 56A7, indiferent de provenien#$. 7lec"nd de la constatarea c$, 1+=, sau chiar +2 reguli sunt prea mult2 i ncerc"nd s$ defineasc$, n mod independent de implementare, caracteristicile unei aplica"ii OLAP, 7endse (2 a! propune testul FA'.9 (1Fast AnalCsis of 'hared .ultidimensional 9nformation2 4 Analiza rapid a in/orma"iei multidimensionale partaAate!. -ele patru cuvinte cheie care calific$ un produs ca fiind compliant cu 56A7 sunt descrise mai %os. +. -uv"ntul cheie 1analiz$2 cere ca sistemul de tip 56A7 s$ permit$ efectuarea de c$tre utilizator, ntr-un mod suficient de facil i intuitiv a oric$rei analize logice sau statistice care este relevant$ pentru aplica#ie. Aceasta include, pe l"ng$ func#ii preprogramate i posi(ilitatea de definire a unor calcule ad hoc i furnizarea de rapoarte n orice form$ dorit$ f$r$ a face apel la lim(a%e de programare profesionale.

+0 2. -uv"ntul cheie 1rapid$2, indic$ faptul c$, sistemul tre(uie s$ furnizeze ma%orit$#ii utilizatorilor datele cerute ntr-un interval de timp p"n$ la cinci secunde. 7entru analize simple, cerin#a de timp de r$spuns este de o secund$ i, numai n foarte pu#ine cazuri e,cep#ionale, se admite un timp de r$spuns mai mare de 2 de secunde. 3. -uv"ntul cheie 1informa#ie2 se refer$ la toate datele primare i informa#iile care au fost o(#inute din acestea n m$sura n care ele sunt relevante pentru aplica#ie. .$sura volumului de informa#ie se refer$ la cantitatea de informa#ie care poate fi manipulat i nu la capacitatea de stocare. :. -uv"ntul cheie 1multidimensional$2, care reprezint$ punctul esen#ial al testului FA'.9, arat$ c$ o aplica#ie 56A7 tre(uie s$ poat$ furniza vederi conceptuale ale datelor cu mai multe dimensiuni, f$r$ a fi nevoie s$ se specifice a priori num$rul acestora, care e dependent de aplica#ie. ;. -uv"ntul cheie 1parta%at$2 implic$ cerin#e privind asigurarea confiden#ialit$#ii i de (locare a actualiz$rilor concurente c"nd e cazul unor accese multiple de tip 1nscriere2. 0... Te1! l /ii de impleme!$a'e Aup$ cum s-a ar$tat mai nainte cuv"ntul cheie care definete conceptul de 56A7 (produs sau aplica#ie! este n mod constant multidimensionalitatea vederilor folosite n analiz$. n prezent, coe,ist$ dou$ solu#ii de implementare a multidimensionalit$#ii) a! 'olu#ia 4 OLAP (- ultidimensional OLAP.), care folosete (aze de date multidimensionale (1.ultidimensional Aata Ease2 D(!, sau (aze de date de tip 1hipercu(2 (de fapt, hiperpoliedru! i (! 'olu#ia (azelor de date rela#ionale care asigur$ multidimensionalitatea pentru analiz$, denumite pe scurt )OLAP (1*elational@56A72 sau 156A7 - on *elational2!. 0...-. S l%&ii de $ip ROLAP

2 5 (az$ de date rela#ional$ are dou$ dimensiuni sau a,e (coloane i r"nduri! i presupune e,isten#a unui lim(a% de interogare de tip 'I6 (seJuential JuerC language!. Asigurarea posi(ilit$#ii de a efectua analize multidimensionale folosind o (az$ de date rela#ional$ se realizeaz$ n implement$rile actuale prin folosirea unei scheme de proiectare intitulat$ 1schema stea2, sau 1floarea soarelui2 (9E., +00DF HraC, Katson, +00DF HradC, 2 !. Aceasta creeaz$ dou$ tipuri de ta(ele) a! o 1ta(el$ de fapte2 (care poate avea milioane de r"nduri! i con#ine informa#iile care sunt su(iectul interog$rilor i (! mai multe ta(ele care con#in datele descriptive privind fiecare dimensiune. *aden (+00=! propune c"teva criterii pentru a califica un produs drept *56A7 dintre care amintim) P e,isten#a unui generator 'I6, care poate realiza opera#ii de selectare n mai multe treceriF P posi(ilitatea de a realiza clasific$ri ne(anale, compara#ii i calculul procentelor pe clase) P e,isten#a unui mecanism care descrie modelul datelor prin intermediul metadatelor i care poate folosi metadatele n timp real pentru a realiza interog$riF P posi(ilitatea de a parti#iona aplica#ia ntre clien#i, prestatori i un element mediator care gestioneaz$ irurile de apeluri la (aza de date. 7rimul produs de tip *56A7, denumit .etaphor, a fost lansat n +0=: pentru aplica#iile de marLeting la companiile produc$toare de (unuri de consum. 'uccesul comercial al lui .etaphor (de#inut din anul +00+ de c$tre firma 9E.! a fost destul de limitat. Ae atunci o serie de alte produse au fost lansate, ca de e,emplu, AQ'R' al firmei Advantage, Eeacon al firmei 7rodea sau .eta-u(e al lui 'tanford &echnologC Hroup. Ae asemenea s-au petrecut o serie de fuziuni i achizi#ii de firme din domeniu (*aden, +00;F 7endse, 2 (!.

2+

0..... S l%&ii de $ip MOLAP 5pera#iile primare i tipice pentru aplica#iile 56A7 sunt /elierea !i /orarea. Ele presupun o organizare logic$ a datelor su( forma unui hipercu( (n 4 dimensional! format din celule n care timpul este o dimensiune o(ligatorie (HraC, Katson, +00D! n locul ta(elelor (idimensionale ale (azelor de date rela#ionale. *aden (+00;! identific$ trei etape de proiectare a hipercu(ului) a! alegerea su(iectelor de interes pentru ntreprindere (de e,emplu) v"nz$rile, reclama#iile, sau capacit$#ile de produc#ie!, (! sta(ilirea valorilor care tre(uie culese (de e,emplu volumul lucr$rilor, elementele de cost, sau gradul de nc$rcare i timpii de sta#ionare ai mainilor i instala#iilor! i c! determinarea granularit$#ii datelor sau a nivelului de detaliu. Acelai autor o(serv$ c$, spre deose(ire de (azele de date rela#ionale, .AE nu au nc$ un model acceptat de toat$ lumea i nici o metod$ de acces standard cum era 'I6 n cazul rela#ional. 7rimul instrument informatic pentru .AE a fost E,press, care a fost g"ndit la nceputul anilor /< , pentru aplica#ii cu timp parta%at n mediul academic. n prezent, E,press este de#inut din anul +00; de c$tre firma 5*A-6E (un mare produc$tor de instrumente pentru (azele de date rela#ionale! i i men#ine conceptele ini#iale dei prezint$ noi solu#ii de implementare. Ae atunci, alte produse au fost lansate ca de e,emplu) 'Cstem K al firmei -omshare, sau Ess(asse al firmei Ar(or i 7rodusul &ensor al firmei .icrosoft, care a fost adoptat ca standard industrial chiar nainte a fi lansat. -el mai nou produs al aceleiai firme (.icrosoft!, denumit 7lato, posed$ o arhitectur$ sofisticat$ (*56A7@.56A7@Mi(rid! (7endse, 2 (F *aden, +00;!. !. Aetalii practice practice privind implementarea solutiilor de tip .56A7 sunt date de &homsen(+00<!. 7entru completitudine ta(loului, vom mentiona n treacat dezvoltarea n paralel a solutiei 9mprove a lui 9E. 4 6otus pentru foile de calcul ta(elar electronic.

22 5 compara#ie a solu#iilor de tip *56A7 i .56A7@.AE, folosind mai multe criterii precum) a! func#ionalitatea, (! adecvan#a, c! performan#ele i d! scala(ilitatea mpreun$ cu recomand$ri de a folosi una sau alta dintre cele dou$ solu#ii este data de *aden (+00; 2. Mi!e'i$%l da$el ' ineritul datelor (1Aata .ining2 4 D !, denumit uneori i descoperirea cuno!tin"elor n (azele de date (1SnoBledge AiscoverC in Aata Eases 14 %DD! este cea mai recent$ tehnologie de analiz$ a datelor, asociat$, al$turi de 56A7, cu conceptul de magazie de date. Alte denumiri i n#elesuri cuprinse n conceptul de A.@SAA sunt) 1arheologia datelor2, 1prelucrarea pattern-urilor de date2, 1culesul informa#iilor2 sau 1dragarea datelor2 (&ur(an, Aronson, +00=!. *$d$cinile A.@SAA sunt considerate a fi n principal n statistica matematic$ i n pachetele softBare folosite n tiin#ele sociale (Agosta, 2 i n inteligen#a artificial$ (.o,on, +00D!. 2.-. De,i!i&ii -a i n cazul 56A7, n literatur$ e,ist$ mai multe defini#ii pentru A.@SAA, lucru a(solut e,plica(il n cazul unei tehnologii noi, aflate ntr-o mare efervescen#$. 5 defini#ie mai veche (FraBleC, +00+, citat de .ertens et all, +00D! spune c$, mineritul datelor const$ n 1e,tragerea nu simpl$ i (anal$ a unor informa#ii poten#ial utile, implicite i recunoscute dinainte dintr-o (az$ de date2. HraC i Katson (+00D! arat$ c$, 1mineritul datelor permite analitilor i managerilor s$ g$seasc$ n magazia de date r$spunsuri la pro(lemele ntreprinderii, pe care acetia nici m$car nu i le-au pus2. .o,on (+00D! adopt$ un n#eles mai restr"ns al mineritului datelor pe care l consider$ 1un set de tehnici folosit n a(ordarea automatizat a opera#iilor de e2plorare !

23 e2hausti$ a unor (aze de date foarte mari i de aducere la supra/a" a unor rela#ii comple,e e,istente n acele (aze de date2. ntr-o ntreprindere se acumuleaz$ de-a lungul timpului foarte multe date. Aatele p$strate de mult$ vreme n fiiere pot con#ine informa#ii i cunotin#e ascunse care pot servi la (unul mers al ntreprinderii, dar luate ca atare, nu au mare utilitate dac$ nu sunt nso#ite de mecanisme care s$ permit$ e,plorarea lor i n#elegerea fenomenelor care au guvernat func#ionarea surselor de date. Aup$ cum ar$ta M. 'imon, laureatul 7remiului To(el pentru economie, la -onferin#a 9nterna#ional$ pentru Economie, .anagement i &ehnologia 9nforma#iei (desf$urat$ la &oLio n anul +002!, 19nforma#ia nu lipsete. -eea ce lipsete este timpul managerului de a considera toate informa#iile care sunt disponi(ile2. &ehnologiile de analiz$ a datelor prezentate mai nainte (E9', 56A7! pot fi v$zute ca %uc"nd rolul unor 1a%utoare de verificare2 ale ipotezelor formulate de utilizatori (manageri sau analiti! privind rela#iile care e,ist$ ntre diferitele date acumulate. -heia succesului const$ n intui#ia utilizatorului de a formula cele mai adecvate interog$ri ini#iale i n capacitatea lui de a continua rafinarea analizei pe (aza informa#iilor primite de la sistemul informatic. -ontri(u#ia principal$ a acestuia const$ n facilitarea procesului de analiz$. Aceasta se realiza fie prin uurarea activit$#ii de formulare a interog$rilor i de o(#inere a unor rapoarte care permiteau o vizualizare sugestiv$ (n cazul E9'!, fie prin o(#inerea rapid$ a unor r$spunsuri prin e,plorarea multidimensional$ a unor ierarhii de date agregate, nso#it$ eventual de prelucr$ri statistice (n cazul 56A7!. Aup$ cum se poate o(serva (FaCCad, GthurusamC, +00DF .o,on, +00D!, succesul unei astfel de a(ord$ri poate fi afectat de capacitatea limitat$ a utilizatorului de a intui fenomenele i de ndem"narea sa de a folosi toate posi(ilit$#ile oferite de instrumentul informatic. Eficacitatea procesului poate

2: sc$dea dramatic n cazurile comple,e, n care utilizatorul are de a face cu milioane de situa#ii, fiecare descris$ prin sute de nregistr$ri. n cazul A.@SAA, sistemul informatic are ca misiune investigarea e,haustiv$ a datelor pentru a scoate la lumin$ clasific$ri, asocieri, sau alte modele ale datelor, n timp ce analistului (sau managerului! i revine sarcina de a decide ce s$ fac$ apoi cu aceste rezultate (9E., +00D!. 2... F%!c&ii 7rincipalele func#ii realizate de A.@SAA sunt (.o,on, +00D!) +. 5ruparea (1clustering2!, care este, de cele mai multe ori, prima etap$ n analiza (azat$ pe mineritul datelor. Ea const$ n identificarea grupurilor de nregistr$ri nrudite care pot constitui punctul de plecare pentru e,plorarea n continuare a unor alte rela#ii. 2. 3lasi/icarea, care este cea mai r$sp"ndit$ tehnic$ de minerit al datelor, folosete un set de e,emple n scopul realiz$rii unui model pentru aran%area n clase a mul#imii de nregistr$ri. Alte func#ii pot fi) estimarea (o variant$ a clasific$rii!, asocierea i analiza (azat$ pe secven#e. .ineritul datelor folosete o serie de algoritmi i tehnici de analiz$, care sunt descrii n alte articole ale acestei serii, precum ar(orii de decizie ra#ionamentul (azat pe situa#ii, logica vag$, algoritmii genetici , sau transform$rile (azate pe fractali. 5 list$ (ogat$ i la zi de referin#e privind solu#iile dezvoltate n domeniu este dat$ de FaCCad, 7iatetsLC 4 'hapiro i 'mith (2 ! iar lucrarea recent$ a lui Kitten, FranL i HraC (+000! descrie o serie de tehnici (azate n special pe instruire. n ceea ce privete aplica#iile A.@SAA se pot enumera o serie de realiz$ri (&ur(an, Aronson, +00=F -o,, 2 ! dintre care de interes n n categorii, (! conte,tul acestei lucrari sunt) a! clasificarea clien#ilor

sta(ilirea pre#urilor i pozi#ionarea produselor pe pia#$, c! descoperirea de clien#i poten#iali i p$strarea celor e,isten#i, d! predic#ia i prevenirea

2; situa#iilor de faliment, e! determinarea nivelului de siguran#$ al portofoliului de comenzi i a m$surilor adecvate care tre(uie s$ fie luate etc. &oate aceste aplica#ii se caracterizeaz$ prin aceea c$ datele sunt su( forma numeric$ sau a unor iruri de sim(oluri ordonate ntr-un mod consistent (de o(icei, ta(ele cu r"nduri i coloane n (aze de date rela#ionale sau n foi de calcul ta(elar electronic!. Aceasta permite din capul locului n#elegerea semanticii i a structurii datelor de c$tre utilizator, n timp ce tehnologiei A. i revine rolul de a descoperi paternuri prin e,plorarea e,haustiv$ a (azei de date. n ultima vreme se constat$ o nou$ direc#ie promi#$toare de dezvoltare i anume cea denumit$ 1mineritul te,telor2 cu format li(er (-o,, 2 !. .ineritul datelor este o tehnologie 1n cretere2, care pare s$ fie pe punctul de a deveni o 1tehnologie cheie2. E,ist$ o serie de prototipuri i chiar produse comerciale propuse at"t de firme mici i inovatoare c"t i de marii produc$tori (de e,emplu, 9ntelligent .iner al 9E. lansat n +00=!. 'imptomul cel mai semnificativ care poate fi o(servat este tendin#a multor gigan#i ai pie#ei tehnologiei informa#iei (.icrosoft, 5racle, 9E., T-*, Rahoo, Amazon etc.! de a achizi#iona produse i firme inovatoare n domeniul A.@SAA (Augusta, 2 !. -u toate acestea, dezvoltarea i afirmarea deplin$ a domeniului este condi#ionat$ de rezolvarea adecvat$ a unor pro(leme tehnice (.o,on, +00D! precum) a! sensi(ilitatea fa#$ de datele 1necur$#ate2 i (! capacitatea limitat$ de e,plicare a rezultatelor n termeni inteligi(ili pentru om (cum se nt"mpl$ de altfel n cazul sistemelor e,pert (azate pe reguli. 4. N $e "i c me!$a'ii n acest articol s-a ncercat s$ se prezinte, ntr-un num$r rezona(il de pagini, principalele a(ord$ri privind instrumentele informatice de asistare a deciziilor (azate pe date. Aceste a(ord$ri, care poart$ denumiri cumva insolite pentru un decident, precum magazii i t"rguri de date, mineritul datelor, sau sunt referite prin a(revieri misterioase ca de e,emplu .56A7, *56A7, au

2D cunoscut o dezvoltare impresionant$ ncep"nd cu mi%locul anilor /0 . Aceast$ micare a fost sus#inut$ n principal de interesul marilor firme de pe pia#a tehnologiilor informa#iei i n mai mic$ m$sur$ de lumea academic$. 5 serie de produse comerciale n domeniul AK, 56A7, A.@SAA ela(orate de 9E. i partenerii s$i sunt men#ionate de 9E. (+00D!, iar solutiile furnizate de alte mari firme (T-*,5*A-6E, -omshare, 'eagate 'oftBare! sunt descrise de Katson i HraC (+00<!. -u toate acestea, se pot auzi voci care ndeamn$ la precau#ie. Astfel, 7. Seen (+00<!, o mare autoritate i un pionier n domeniul deciziei asistate de calculator, arat$ c$, 1furnizarea de date nu creeaz$ informa#ie. 9nforma#ia nu conduce automat la cunotin#e. -unotin#ele nu conduc n mod direct la ac#iuni. Ac#iunea n (usiness i impactul s$u tre(uie s$ fie #inta. Este un pericol real ca nmagazionarea de date i domeniul managementului cunotin#elor s$ treac$ uor cu vederea cele de mai sus. &re(uie s$ ncepem cu oamenii, nu cu informa#ia2. -apitolul nu a a(ordat unele su(iecte care, de multe ori, sunt descrise n literatur$ n conte,tul instrumentelor informatice care asist$ decizia (azat$ pe analiza datelor precum sistemele centrate pe date spa"iale*geogra/ice (Heographic 9nformation 'Cstems - H9'!, sau ncerc$rile de folosire a a(ord$rii o(iectuale n magaziile de date. -ititorului interesat de aceste su(iecte i se recomand$ adresele) +. http)@@mis.ucd.ie@isBsdss@sdss.html , unde se poate g$si pagina lui 7.Seenan referitoare la sisteme de asistare a deciziilor (azate pe date spa#iale i 2. http)@@BBB.dLms.com@55AK2.html , unde se poate g$si -artea al($ nr.; a -onsiliului 56A7, din august +00< privind magaziile de date orientate pe o(iecte. Aup$ cum o(serv$ HraC (+00<!, 1anul +00D a fost anul magaziei de date2 (n ceea ce privete pu(licarea de lucr$ri n domeniu!. Aintre lucr$rile

2< ap$rute n acest an, se recomand$ studierea mpreun$ a c$r#ilor scrise de 9nmon (+00D!, 9nmon i MacLarthorn (+00D! i Sim(all (+00D!, care dau o imagine aproape complet$ asupra construirii i utiliz$rii magaziilor de date i respectiv, a unor studii de caz din diferite domenii aplicative. 5 (un$ prezentare intuitiv$ a conceptelor AK, 56A7 i A.@SAA se g$sete n capitolul : al c$r#ii lui Ahar i 'tein (+00<!. -om(inarea recent$ a AK cu tehnologia Be( este prezentat$ de Sim(all i .erz (2 conceptul promi#$tor de 1Aata Ke(house2. -"teva adrese 9nternet recomandate pentru aprofundarea studiului i urm$rirea dezvolt$rilor din domeniu sunt) -. http)@@dssresources.com@dsstCpes@ddss.html, care reprezint$ o (un$ 1poart$ de intrare2 pentru materialele disponi(ile pe 9nternet n domeniul asist$rii deciziei (azate pe date. 5 (un$ parte dintre lucr$rile referite n acest capitol au putut fi g$site plec"nd de la aceast$ pagin$F 2. http)@@dssresources.com@dss(ooL, care con#ine capitolul < al hiperc$r#ii lui Aaniel 7oBer (2 ! dedicat asist$rii deciziei (azate pe dateF 3. http)@@BBB.dataBarehousing.com@papers.asp, a lui Aata Karehousing -enter, de unde se poate ncepe e,plorarea unor articole interesanteF :. http)@@BBB.dLms.com@BhiteU7apers.htm, de la care se pot e,plora o serie de -$r#i al(e n domeniul magaziilor de date, 56A7 i mineritului datelor. N $a. Autorul multumeste domnului profesor Moratiu Aragomirescu pentru o serie de materiale documentare i adrese furnizate. 2.4. 5i6li /'a,ie Agosta, 6. (2 !. From data to insight) the critical path to data mining, a short historC of data mining. PC7AI, 'ept@5ct, +D-2+. Alter, '. (+0<<!. A ta,onomC of Aecision 'upport 'Cstems. Sl a! Ma!a/eme!$ Re*ie8, Fall, 30-;D. Alter, '. (+0= !. Deci#i ! S%pp '$ S9#$em#; C%''e!$ P'ac$ice# a!d C !$i!%i!/ C1alle!/e#. Addison 4 KesleC, *eading .A. ! care introduc

2= -odd, E.F., '.E. -odd, &.'. -linch (+003!. EeCond decision support. C mp%$e'8 'ld, 2D VulC. -o,, E. (2 !. Free 4 form te,t data mining integrating fizzC sCstems, self 4 organizing neural nets and rule-(ased LnoBledge (ases. PC7AI, 'ept.5ct., 22-2;. Aate. -.V. (+0=D!. A! I!$' d%c$i ! $ Da$a6a#e S9#$em# . Fourth Edition, Addison 4 KesleC 7u(lishing -o., *eading .A. Ahar, W., *. 'tein (+00<!. I!$elli/e!$ Deci#i ! S%pp '$ Me$1 d#; $1e Scie!ce , :! 8led/e ; '<. 7rentice Mall, Gpper 'addle *iver, TeB VerseC. AS.' (2 !. ;1i$e Pape'#. Rep '$#, ; '<i!/ Pape'#, a!d D:MS 5'ie,#. E,ecutive 9nformation 'Cstems 9nc http)@@BBB.dLms.com@ Bhite=7apers.htm!. AK- 4 Aata Karehousing -enter. Pape' a!d A'$icle# (BBB.dataBarehousing.com@papers!. FaCCad, G. (+00D!. Aata mining and LnoBledge discoverC in data (ases. C mm%!ica$i !# , $1e ACM, >Special I##%e?, 0@ (++!. FaCCad, G., H. 7iatetsLC - 'hapiro, 7. 'mith (2 !. E,panded references. &he SAA process for e,tracting useful LnoBledge from volumes of data (http)@@BBB.research.microsoft.com@research@dataBare@ -A-.-A.refs@faCCad-intrs.htm!. Filip, F. H. (2 !. Aecizie asistata de calculatorF metode i tehnici de asistare a deciziilor centrate pe %udecata umana . I!, 'ma$ica ec ! mica, IA (3!, + -22. Filip, F.H., E. Ear(at (+000!. I!, 'ma$ica aplica$3; ! i pa'adi/me "i aplica&ii. Editura &ehnic$, Eucureti. Firestone, V... (+00<!. O6Bec$ O'ie!$ed Da$a ;a'e1 %#i!/. Khite 7aper To. Five. E,ecutive 9nformation 'Cstems, 9nc. (http)@@BBB.dlms.com@ AK2.html!. Firestone, V... (2 !. AS.' Erief To. 'i,) Da$a ;a'e1 %#e#, Da$a Ma'$#, a!d Da$a ;a'e1 %#i!/C Ne8 De,i!i$i !# a!d Ne8 C !cep$# (http)@@BBB.dLms.com@AKA.EA.html!. Forsman, 'arah (+00<!. OLAP C %!cil ;1i$e Pape' (http)@@BBB.olapcouncil.org@research@Bhtpapco.htm!. FraBleC V. F., H. 7iatetsLC 4 'hapiro, H.V. .atheus (+00+!. SnoBledge discoverC in data (ases) an overvieB. A.I. Ma/a)i!e, 0 (+3!, ;<-< . HrandC, -heril (2 !. 5'ea<$1' %/1 Pe', 'ma!ce , ' S$a' Sc1ema# D A Da$a ;a'e1 %#i!/ S l%$i !#. A ;1i$e Pape' . ACnamic 9nformation 'Cstems -orporation (http)@@BBB.disc.com.@dBhpaper.html!. HraC, 7. (+00<!. Aata BarehousingF revieB of 1Euilding the Aata Karehouse2 ((C K.M. 9nmon!. E %'!al , I!, 'ma$i ! S9#$em# Ma!a/eme!$, -2(+! (http)@@dss.c(a.uni.edu@(ooLs@revieB+.html!

20 HraC,7. M.V. Katson (+00D!. &he neB A'') Aata Karehouses, 56A7, .AA, and SAA. (http)@@hs(.(aClor.edu@ramsoBer@ais.ac.0D@papers@ graCBats. htm!. Mammer, ..V. -hampC (+003!. Ree!/i!ee'i!/ $1e C 'p 'a$i !. A Ma!i,e#$ , ' 5%#i!e## Re* l%$i !. Marper Eusiness, TeB RorL. 9E.(+00D!. Aata Karehousing -oncepts for A'@: (http)@@BBB. as: .i(m.com@d(2@dataBare.htm!. 9nmon, K.M. (+003!. 5%ildi!/ Da$a ;a'e1 %#e. Vohn KileC X 'ons. TeB RorL. 9nmon, K.M. (+00;!. ;1a$ i# a Da$a ;a'e1 %#eO (http)@@BBB.cait.Bvstl.edu@cait@papers@prism@vol+=no+@su(%ect@home.html!. 9nmon, K.M., -laudia 9mhoff, *. 'ousa (+00=!. C 'p 'a$e I!, 'ma$i ! Fac$ '9. Vohn KileC X 'ons, TeB RorL. 9nmon, K.M., *.A. MacLathorn (+00:!. U#i!/ $1e Da$a ;a'e1 %#e. Vohn KileC X 'ons. TeB RorL. Seen, 7.H.K. (+00<!. 6et/s focus on action not info. C mp%$e'8 'ld. +< Tovem(er. (http)@@BBB2.-omputerBorld.com@home@ print0:0<.nsf@A99@'6:DLeen+DF 2!. Sim(all, *. (+00D!. T1e Da$a ;a'e1 %#e T l<i$ . Vohn KileC X 'ons. TeB RorL. Sim(all, *. .erz (2 !. T1e Da$a ;e6 1 %#e T l<i$ C 5%ildi!/ $1e ;e6(E!a6led Da$a ;a'e1 %#e. Vohn KileC X 'ons, TeB RorL. .ertens, 7., V. Magedorn, ..Fischer, T.Eissantz, ..Maase (+00D!. &oBards active management sCstems. 9n 7. MumphreC, 6. Eannon, A. .c-osh, 7..igliarese, V.-h. 7omerol (Eds.!. Impleme!$i!/ S9#$em# , ' Ma!a/eme!$ Deci#i !#; C !cep$#, Me$1 d# a!d EFpe'ie!ce. -hapman X Mall, p.3 ;-32;. 56A7 -ouncil (+00<!. OLAPC O! ( Li!e A!al9$ical P' ce##i!/ (http)@@dssresources.com@glossarC@olaptrms.html!. 7endse, T. (2 a! Khat is 56A7O An analCsis of Bhat the increasinglC misused 56A7 term is supposed to mean. OLAP Rep '$ (http)@@BBB.olapreport.com@FA'.9.M&.!. 7endse, T. (2 (!. &he origins of todaC/s 56A7 products. T1e OLAP Rep '$. (http)@@BBB.olapreport.com@origins.htm!. 7endse, T. (2 c! Khat/s in a nameO &he 56A7 *eport (http)@@BBB.olapreport.com@name.html!. 7oe, W. (+00D!. 5%ildi!/ a Da$a ;a'e1 %#e , ' Deci#i ! S%pp '$ . 7rentice Mall, Gpper 'addle *iver, TeB VerseC. 7oBer, A. (2 !. Deci#i ! S%pp '$ S9#$em#C C !cep$# a!d Re# %'ce#. -edar Falls, 9.A.) A'' *esources. -5., prepu(lication 7AF version (http)@@dssresources.com@dss(ooL!. *aden, T. (+00;!. Aata, data everCBhere. I!, 'ma$i ! ;e6, 5ct.3 >http)@@BBB.mem(ers.aol.com@nraden@iB=mct +.htm!.

3 *oBleC, Vennifer (+00=!. Khat is informationO I!, 'ma$i ! Se'*ice# G U#e, -H>:!, 2:3-2;;. &homsen, E. (+00<?. OLAP S l%$i !#C 5%ildi!/ M%l$idime!#i !al I!, 'ma$i ! S9#$em#. Vohn KileC X 'ons, TeB RorL. &ur(an, E., V.E. Aronson (+00=!. Deci#i ! S%pp '$ S9#$em# a!d I!$elli/e!$ S9#$em#. (Fifth Edition!. 7rentice Mall, Gpper 'addle *iver, TeB VerseC. Glman, V.A. (+0=2!. P'i!ciple# , Da$a6a#e S9#$em# . -omputer 'cience 7ress, ..A. Katson, M.V., 7. HraC (+00<!. Deci#i ! S%pp '$ +! $1e Da$a ;a'e1 %#e. 7rentice Mall, EnghleBood -liffs, TeB VerseC. Kitten, 9.M., E. FranL, V. HraC (editors!. (2 !. Da$a Mi!i!/C P'ac$ical Mac1i!e Lea'!i!/ T l# a!d Tec1!iI%e# 8i$1 Ea*a Impleme!$a$i !#. .organ Saufmann 7u(lishers. Publicat in INFORMATICA ECONOMICA IV (4),8-22

S-ar putea să vă placă și