Documente Academic
Documente Profesional
Documente Cultură
Sisteme Informatice Pentru Asistarea Deciziei PDF
Sisteme Informatice Pentru Asistarea Deciziei PDF
Codul cursului:
Denumirea cursului: Sisteme informatice pentru asistarea deciziei
Tip curs: obligatoriu
Durata cursului / Nr. credite: un semestru /
Perioada de accesare a cursului: prelegeri 25 febr. 2008- iunie 2008
laboratoare
consultaii
Manuale recomandate:
1. Gherasim, Z., Fusaru, D., Andronie, M. Sisteme informatice pentru asistarea deciziei
economice, Editura Fundaiei Romnia de Mine, Bucureti, 2008.
2. Fusaru, D., Cocianu, C.L., Gherasim, Z., Andronie, M. Sisteme expert i Sisteme
informatice pentru asistarea deciziei, Teste gril, Editura Fundaiei Romnia de Mine,
Bucureti, 2006.
3. Zaharie, D., Albescu, F., Bojan, F., Ivancenco, V., Vasilescu, C. Sisteme informatice
pentru asistarea deciziei, Editura Dual Tech, Bucureti, 2001.
4. Filip, Fl.Gh. Decizie asistat de calculator. Decizii, decideni. Metode i instrumente de
baz, Editura Tehnic i Editura Expert, Bucureti, 2002.
5. Filip, Fl.Gh. Sisteme suport pentru decizii, Editura Tehnic, Bucureti, 2004.
6. Oancea, M. Sisteme informatice pentru asistarea deciziei bancare, Editura ASE,
Bucureti, 2005.
Obiectivele cursului:
Obiectivele cursului de Sisteme informatice pentru asistarea deciziei (SIAD) sunt:
revederea i fixarea noiunilor de baz din teoria sistemelor economice integrate i teoria deciziei
n general, i a sistemelor informatice integrate, n special; definirea conceptelor fundamentale
specifice SIAD; tratarea celor trei tipuri de SIAD-uri: bazate pe modele, bazate pe analiza i
sinteza datelor (tehnica OLAP) i Data Mining; ctigarea unor deprinderi n folosirea
componentelor de asistare a deciziei din produsul informatic Microsoft Excel, din instrumentul
informatic QM i din Microsoft SQL Server 2005 (Analyses Services, Data Mining).
Modul de stabilire a notei finale: nota este cea care rezult din evaluarea prin teste
gril, pe platforma BlackBoard.
Consultaii pentru studeni: n fiecare mari de la ora 10 - 12 pe perioada cursurilor.
Adresa e-mail responsabil pentru contactul cu studenii:zgherasim.mfc@spiruharet.ro
Titularul / titularii cursului / serie:Prof.univ dr. Zenovic GHERASIM
zgherasim.mfc@spiruharet.ro sau
zenovic.gherasim@yahoo.com
Str. Splaiul Independenei nr. 313, 3169785/110
Consultaii: n fiecare marti orele 10.00-12.00
pe perioada cursurilor.
Asistent seminarii-laboratoare: Asist.univ. mat. Mriua TUDOR,
t_mariuta@yahoo.com
Asist.univ. Alexandru DUMITRU
alexd@ines.ro
Tematica disciplinei:
Cuvinte-cheie: SIAD, DSS, OLAP, modelare, depozite de date, Data Warehouse, Data Mining.
General Manager
Management
operaional TPS, Transaction
(de exploatare) Processing Systems
1
Oancea, M. Sisteme informatice pentru asistarea deciziei financiare, Editura ASE, Bucureti, 2005.
2
Lungu, I., Sabu, Gh., Velicanu, M., Muntean, M., Ionescu, S., Posdarie., E., Sandu, D, - Sisteme informatice.
Analiz, proiectare i implementare, Editura Economic, Bucureti, 2003.
5. realizeaz interactivitatea sistem-decident.
Sistemele informatice pentru asistarea deciziei, SIAD implic folosirea elementelor
aplicative din discipline diverse cum sunt statistica, economia, cercetrile operaionale,
tehnologiile informaiei i ale comunicaiilor IT&C, inteligena artificial, psihologia cognitiv
etc.
Sistemul informaional economic reprezint un cumul de resurse umane i capital investit
ntr-o organizaie economic pentru colectarea i prelucrarea datelor necesare obinerii
informaiilor care vor fi utilizate la toate nivelurile de decizie ale conducerii i controlului
activitii acelei organizaii.
Informaie devine n felul acesta centrul n jurul cruia basculeaz ntreaga activitate a unei
organizaii economice.
Informaia este vzut de DeMarco (1982) ca fiind abordabil din trei perspective specifice
sistemelor informaionale i anume:
1) Datele care sunt vzute sub form de atribute i care reflect structura static a
sistemului informaional.
2) Funciile scot n eviden ceea ce face sistemul. Ele pot fi vzute i ca procese,
deoarece elementele sistemului care stocheaz datele sunt supuse transformrilor
funcionale prin intermediul proceselor.
3) Comportamentul reflect de fapt strile prin care trece sistemul la apariia diverselor
evenimente care au impact asupra lui i care i confer un statut dinamic.
Reenginering-ul organizaiei economice semnific regndirea din temelii i reproiectarea
radical a proceselor de afaceri cu scopul de a obine o mbuntire semnificativ a indicatorilor
critici de performan ai acestei organizaii economice (costuri, calitate, vitez, service etc). n
reingineria proceselor de afaceri, BPR (Business Process Reengineering), IT&C joac un rol
determinant.
3
Acad. Florin Gheorghe FILIP, Decizie asistat de calculator, decizii, decideni, metode i instrumente de baz,
Editura Tehnic i Editura Expert, Bucureti, 2002.
(stabilite de nivelul de management strategic), n mod curent i pe termen scurt; se folosesc date
i informaii mediu agregate provenite att din surse interne ct i din surse externe organizaiei;
c) decizii de conducere (control) operaional care determin modul n care sunt duse la
ndeplinire sarcinile primite de la nivelele de management superioare; orizontul de timp este de
sptmni i zile; se folosesc date i informaii provenite, n principal, din surse interne
organizaiei;
n unele lucrri de specialitate, la acest criteriu de clasificare a deciziilor sunt cuprinse
i:
d) decizii n ceea ce privete cunotinele, acestea fiind indisolubil legate de ideile care
se refer la noi produse i servicii, metode de rspndire a acestor cunotine i de difuzare a
datelor i informaiior n cadrul organizaiei. Sunt satisfcute astfel toate nivelurile de
management ale organizaiei economice prezentate n fig.1.1.
Clasificarea deciziilor n funcie de gradul de structurare este:
a) decizii structurate sau programabile adic decizii uzuale pentru care exist proceduri
realizate. Acest tip de decizii intervin n momentul n care apare un proces cunoscut. Dac
decizia este supus procesului de informatizare, ea este descris printr-un program a crui
execuie este fix, deci nu pot exista reveniri, iar calea raionamentelor nu este schimbat nici
prin program i nici de utilizatori.
b) decizii nestructurate (neprogramabile) sunt cele care se bazeaz pe flerul i modul de
judecat al decidentului care analizeaz problema. Acest tip de decizie se refer la tipuri de
probleme atipice pentru organizaie, pentru care nu exist proceduri prestabilite. O decizie este
considerat nestructurat atunci cnd elementele sale sunt de tip calitativ, obiectivele i
finalitatea nu sunt precise i nu exist un algoritm cunoscut pentru rezolvarea lor;
c) decizii semistructurate sunt cunoscute ca decizii care pot fi rezolvate parial cu
proceduri cunoscute, ntruct acestea au elemente predominant cantitative, scopurile nu sunt
precise, iar procedura de rezolvare nu asigur ansamblul elementelor problemei. Gradul de
structurabilitate a deciziei depinde de experiena acumulat de decident precum i de nivelul i
importana ei. Conform terminologiei lui H. Simon, n cazul proceselor semistructurate apare
nevoia unui asistent, de fapt de asistare a deciziei. Acest termen de asistare a deciziei
trebuie definit la modul general ca fiind o serie de operaii cum sunt sortarea clasificarea,
selectarea, evaluarea ce au ca scop final organizarea informaiei, reducerea incertitudinii i
obinerea de variante de rezolvare. Dac se consider evoluia n timp a acestui termen, atunci se
poate constata c acesta s-a dezvoltat prin folosirea metodelor cercetrii operaionale, dar sunt
greu de aplicat. De aceea a aprut un alt nivel de abordare a asistrii deciziei i anume asistarea
interactiv. Pe baza acesteia au aprut sistemele informatice de asistare a deciziei sau Decision
Support Systems (DSS), situate generic pe nivelul de management mediu.
O alt clasificare a deciziilor poate fi fcut n funcie de cunotinele de care dispune
decidentul referitoare la evoluia problemei pe care o are de rezolvat. n funcie de acest criteriu,
deciziile sunt:
1. decizii n condiii de certitudine ce presupun o cunoatere a evoluiei fenomenelor
viitoare, ceea ce se petrece mai rar n realitatea economic. O astfel de decizie se bazeaz pe
criteriul costului minim de funcionare;
2. decizii n condiii de incertitudine ce presupun cunoaterea evoluiei anterioare a
fenomenului economic. Acest mod de cunoatere va permite o previziune i o alegere ct de ct
corect a variantei de decizie. Acest tip de decizie face parte din clasa general a deciziilor de
orientare n care alegerea unei variante se face n funcie de previziunile viitoare ale decidentului
precum i de criterii obiective care presupun raionament logic;
3. decizii n condiii de risc ce presupun c decidentul cunoate aproximativ evoluia
viitoare a fenomenului, posibilul trend al variabilelor necontrolabile i chiar ce rezultate are
fiecare strategie analizat pe baza criteriului speranei matematice. n acest caz procesul de
decizie va avea o multitudine de consecine, iar fiecreia i se va asocia o probabilitate. Se obine
o distribuie a probabilitilor din care se va alege varianta cu sperana matematic cea mai bun.
Dac exist variante de decizie care au aceeai speran matematic, atunci se va calcula
intervalul de variaie i abaterea standard. Ca variant optim se va alege aceea care are cea mai
mic abatere standard.
Dup modul de abordare, deciziile se clasific astfel4:
1. decizii rezultate ale activitilor de management desfurate la ntmplare;
2. decizii rezultate ale activitilor de management bazate pe rutin; se folosesc abloane
ale activitilor din trecut;
3. decizii rezultate ale activitilor de management bazate pe instruire (invare); modelele
de decizii din trecut sunt modificate n funcie de dobndirea de cunotine, experiene i tehnici
noi;
4. decizii rezultate ale activitilor de management paradigmatice; modelele de decizii de
succes din trecut sunt preluate ca exemple pentru situaia actual;
5. decizii bazate pe analiza deciziilor (analiza i modelarea sistemic i previzional);
analiza deciziilor, ca abordare prescriptiv, asist decidentul n nelegerea problemelor
decizionale i n pregtirea acestuia pentru a face fa situaiilor neateptate i nefavorabile;
analiza deciziilor nu poate influena hazardul i nu poate provoca manifestarea norocului.
Deciziile rezultate ale activitilor de management bazate pe instruire, precum i cele
paradigmatice fac obiectul tehnicilor de inteligen artificial (sisteme expert, reele neuronale
artificiale, sisteme bazate pe cazuri etc.).
Dup gradul de urgen, deciziile sunt:
decizii luate strict n timp real; sunt adoptate pentru managementul situaiilor de criz (de
exemplu, pentru conducerea unor instalaii industriale, pentru gestionarea efectelor unor
calamiti naturale inundaii, cutremure, incendii etc.); acest tip de decizii pot fi asistate de
tehnici de inteligen artificial;
decizii luate aproape n timp real; sunt adoptate pentru gestionarea unor situaii
decizionale importante pentru organizaie cum sunt, de exemplu, oportunitile de afaceri,
lansarea unui produs nou, prefalimentul firmei etc;
decizii care nu sunt urgente; timpul la dispoziia decidentului este suficient pentru
asiguraarea desfurrii unei analize detaliate i obinerea unei rezolvri optime a problemei
decizionale.
Dup criteriul de secvenialitate a deciziilor5, se deosebesc:
a) decizii independente, n situaia n care decidentul ia o decizie complet
implementabil;
b) decizii dependent-secveniale sau n cascad (o decizie dup alta);
4
G. Boldur-Lescu - Logica decizional i conducerea sistemelor, Editura Academiei Romne, Bucureti, 1992.
5
Acad. Florin Gheorghe FILIP, Sisteme suport pentru decizii, Editura Expert, 2004.
c) decizii interdependente, adic decizii independente (n prima faz) sunt agregate (n
faza a doua).
1.3. Decidenii
7
Acad. Florin Gheorghe FILIP, op.cit.ant..
externe sistemului, cum sunt abaterile intolerabile ale strii subsistemului condus fa de o stare
prestabilit, strile noi ale sistemului, precum i modificrile sistemului economic observate n
mediul socioeconomic extern. De exemplu, contul de profit i pierdere al unei firme semnaleaz
celorlali actori de pe pia starea de profitabilitate sau de faliment pentru acea firm, iar bilanul
firmei indic modificri intervenite n anul curent fa de anul precedent. Achiziionarea de ctre
o societate comercial de producie unui utilaj performant n locul muncii manuale asigur
creterea productivitii muncii, determinnd astfel o stare nou a sistemului economic. O
abatere intolerabil la o banc comercial este depirea limitei de creditare impus i
supravegheat de Banca Central. Situaiile decizionale forate determin decizii corective i
reactive n raport cu abaterile intolerabile, strile noi sau modificrile intervenite n sistemul
economic. Un stimulent pentru o situaie decizional forat i o decizie reactiv poate fi
observarea existenei unei oportuniti de afaceri pentru firm.
Situaiile decizionale neforate (subiective sau neprovocate) reprezint situaiile
decizionale, determinate de voina decidentului, care se refer la luarea din timp a unor msuri
preventive pentru situaii ca producerea unor accidente de munc sau boli profesionale la
angajaii firmei, producerea unui incendiu, pierderea avansului competiional al societii etc.
Situaiile decizionale neforate determin decizii proactive ca rezolvri ale problemelor de
explorare i exploatare a oportunitilor.
Procesul decizional este ansamblul de activiti executat de o persoan sau grup de
persoane (decident) care sunt puse n faa unui fenomen care poate genera mai multe variante de
aciune i avnd drept obiectiv alegerea uneia dintre ele care s rspund cel mai bine sistemului
de valori ale persoanei, grupului de persoane sau organizaiei n ansamblul su.
Decidentul uman, ca element fundamental al procesului decizional, prezint mai multe
limite care determin necesitatea i oportunitatea asistrii informatizate a deciziilor. Astfel, se
deosebesc limite cognitive (se refer la capacitatea limitat a omului de a memora i prelucra
date, informaii i cunotine), limite de timp (multe decizii trebuiesc adoptate de decidentul
uman sub presiunea timpului la dispoziie extrem de mic; ca urmare, aceste decizii pot fi eronate
n raport cu problema decizional) i limite economice (sunt determinate de costurile obinerii,
stocrii, prelucrrii, transmiterii i diseminrii datelor, informaiilor i cunotinelor ctre toi
membrii echipelor manageriale).
Procesul de adoptare a deciziilor este constituit din urmtoarele etape sau faze ale
procesului decizional (cu caracter generic):
1. Informarea general (sau intelligence, dup H.Simon), etap n care sunt analizate
evenimentele aprute n organizaia economic i depistate cauzele lor de apariie. Aceast
etap conine subetapele de stabilire a obiectivelor, de identificare a problemei, de
descompunerea a ei, de stabilire a responsabilitilor i are ca rezultat descrierea formal a
problemei decizionale, a categoriei din care aceasta face parte i a tuturor responsabilitilor
care decurg de aici.
2. Design-ul (proiectarea) sau modul de concepere al procesului de asistare a deciziei
presupune alegerea sau construcia unui model pentru asistarea deciziei precum i subetapele
de testare i validare. Una din subetapele design-ului este modelarea ce implic modul de
concepere a problemei precum i abstractizarea ei cantitativ i/sau calitativ. Experiena
decidentului i pune amprenta pe modul de alegere a modelului dintr-o multitudine
existent, dezvolt proceduri mentale care ajut la ncadrarea problemei de rezolvat ntr-o
anume clas de modele existente.
3. Alegerea (sau choice) este etapa de baz pentru adoptarea deciziei deoarece n cadrul ei se
concretizeaz rezultatele obinute n celelalte etape. Decidentul alege o singur aciune din
multitudinea existent n funcie de criteriul de selecie propus i de modelul decizional pe
care l-a ales (din clasa de modele la dispoziie). Decidentul alege ntre posibilitile n funcie
de soluionarea definitiv a modelului, de selectarea celei mai adecvate alternative i tot el
selecteaz planul pentru implementare. Pentru alegere sunt evideniate mai multe metode de
cutare ca de exemplu: tehnici analitice, metode de cutare exhaustive prin care rezultatele
obinute de fiecare alternativ sunt comparate, metode euristice care sunt aplicabile n
metodele descriptive.
Metodele analitice sunt utilizate datorit utilizrii formulelor matematice pentru a gsi
soluia optim. Utilizarea lor este restricionat de natura problemelor, iar acestea trebuie s fie
structurate. Se pot aplica astfel de metode pentru probleme de gestiune a stocurilor sau de
alocare a resurselor. Algoritmii stau la baza acestor metode i conduc la obinerea unor soluii
viabile pentru modelul ales.
Metodele de cutare exhaustiv sunt utilizate n genere la luarea n considerare a tuturor
cilor de aciune pentru a ajunge la scopul propus. Aceste metode au la baz un proces neghidat,
proces n urma cruia se alege soluia optim. Cutarea de obicei este incomplet ntruct
posibilitile de cutare sunt limitate de timp, spaiu de memorie i el se va opri cnd se va gsi o
soluie apropiat de cea optim (numit suboptim).
Metodele de cutare euristice se bazeaz pe o riguroas analiz a problemei sau printr-o
cutare prin ncercri succesive a spaiului soluiilor. Raionamentul fcut prin parcurgerea
spaiului de cutare a soluiri permite trecerea prin toate stadiile intermediare ctre o stare final
care poate fi un rezultat satisfctor sau o nereuit (eec). Se precizeaz c metoda de cutare
care este implementat de un sistem de asistare a deciziilor este o metod euristic.
Ca ultim etap n adoptarea deciziei este evaluarea rezultatelor soluiei.
4. Implementarea (sau review) este etapa n care se face declanarea aciunii alese (propuse)
de decident.
De obicei, aceast etap este o mare consumatoare de timp, resurse i n cursul ei pot apare
diverse probleme de rezolvat, ca de exemplu gradul de suport al nivelurilor superioare
decizionale.
Analiza deciziilor asigur un cadru sistematic de abordare, structurare, descompunere i
rezolvare a problemelor decizionale, ajutndu-l i stimulndu-l pe decident s gndeasc i s
preia critic alternativele propuse de echipa managerial sau de ctre un sistem informatic de
asistare a deciziei. Analiza deciziilor este sprijinit de metode, tehnici i instrumente informatice
specifice sau preluate din alte discipline (cercetri operaionale, statistic, probabiliti, simulare
etc.).
Pentru procesul decizional structurat i pentru cel semistructurat se pot folosi modelele
cantitative bazate pe metode i modele ale cercetrii operaionale. Aceast abordare presupune
automatizarea total sau parial a procesului de adoptare a deciziei i const n urmtorii pai:
a) descrierea i definirea problemei;
b) gsirea categoriei din care face parte problema;
c) elaborarea unui model matematic care s se plieze cel mai bine pe descrierea problemei;
d) alegerea soluiei.
Modelele cercetrii operaionale se obin prin metodele acestei cercetri. Metodele
cercetrii operaionale, utilizate la fundamentarea procesului decizional, sunt programarea
matematic (liniar, neliniar, ptratic), teoria stocurilor, teoria jocurilor, teoria grafurilor, teria
echipamentelor etc. Se obin astfel soluii optimale pentru problema decizional de rezolvat.
Procesul decizional care poate fi modelat presupune c situaia real se poate configura
pe un model. S-au implementat o serie de metodologii automate care permit obinerea soluiilor
pentru un model cunoscut.
Calculatorul electronic poate primi modelul pentru decizii structurate i tot el poate fi
decidentul. Spre exemplu, el poate decide cnd s se fac reaprovizionarea stocului cu materii
prime i materiale al societii comerciale i, n acest caz, libertatea de a alege n afara soluiei
optime, dispare.
n cazul n care exist decizii mai puin structurate se va utiliza un gen de modelare local
sau personalizat care presupune utilizarea mai multor modele sau chiar construirea altora
proprii. Modelarea personalizat este un proces interactiv i a dat i numele primelor sisteme:
sisteme interactive de asistare a deciziei. Acestea reprezint, n esen, sisteme informatice de
asistare a deciziei orientate pe modele.
Sistemele de asistare a deciziei orientate pe date prelucreaz date ce se gsesc n
depozitul de date al organizaiei. Aceste sisteme funcioneaz pe baza analizei i agregrii datelor
i au ca funcii accesul imediat la date, dispun de un mecanism pentru analiza imediat a datelor,
creeaz statistici. Acest tip de sisteme este rezultatul crerii unor tehnologii speciale cum sunt:
depozitarea unor volume enorme de date istorice ale organizaiei (Data Warehousing);
exploatarea acestor depozite prin procesare analitic on-line (OLAP, OnLine Analytical
Processing).
Adoptarea deciziilor constituie un proces care pe lng suportul tehnic are nevoie de un
suport cognitiv care este asigurat de partea uman component integrant a sistemului
decizional. Suportul cognitiv nglobeaz cunotinele i experiena decidentului precum i
capacitatea acestuia de raionament. Suportul cognitiv este sprijinit i marcat n ultimele decenii
de apariia sistemelor informatice de lucru cu cunotine, KWS (Knowledge Work System) care
se ocup de probleme de stocare, clasificare, meninere i calitate a cunotinelor.
Dac n sistemele informatice de asistare a deciziei se includ i bazele de cunotine, se
definesc astfel sisteme informatice de asistare a deciziei orientate pe cunotine sau aa numitele
sisteme informatice de asistare inteligent a deciziei.
Dup clasificarea lui Schneider (1994), exist patru categorii de probleme decizionale:
a) decizia de tip alegere (se pornete de la o mulime de alternative din care se alege o
singur alternativ);
b) decizia simpl (se pornete cu problema bine formulat i cu o mulime de activiti
de rezolvare a problemei i se finalizeaz cu soluionarea problemei prin realizarea unui plan de
aciune);
c) decizia complex (problema de rezolvat se descompune n mai multe probleme simple
sau subprobleme care se soluioneaz cu decizii simple);
d) decizia de tip proces (este o decizie de tip secvenial).
Procesul decizional este puternic influenat de caracteristicile mediului socio-economic
n care-i desfoar activitatea organizaia economic, cum sunt:
1. existena competiiei pe pia, din ce n ce mai acerb i mai evoluat; produsele i
serviciile oferite pieii sunt apreciate n conformitate cu un ansamblu de criterii (pre, calitate,
nivel tehnologic ncorporat, termen de livrare, durata de via sau existen pe pia);
2. ritmul schimbrilor tehnologice (se reamintete aici, deja celebra lege a lui Moll,
conform creia, n domeniul tehnologiilor informaiei i ale comunicaiilor, IT&C, fiecare
generaie tehnologic asociat, de regul, cu microprocesorul structurii de calcul, se modific la
fiecare 18 luni) i de alte tipuri (politice, legislative, sociale) care determin creterea numrului
de alternative ce constituie input-uri ale procesului decizional;
3. modificarea modului de organizare i de funcionare a organizaiei economice (ca, de
exemplu, apariia i dezvoltarea organizaiei virtuale) ce determin mrirea ponderii decidenilor
de tip multiparticipant asociai n echipe virtuale; prin reingineria proceselor de afaceri, BPR
(Business Process Reengineering) sunt gestionate toate aceste modificri organizaionale;
4. creterea continu i diversificarea surselor externe de date, informaii i cunotine;
5. creterea continu a preteniilor acionarilor fa de performanele organizaiei
economice, dar i a aspiraiilor personale ale angajailor acesteia i ale candidailor la angajare
provenii din mediul socioeconomic.
1
Zaharie D, Albescu F, colectiv Sisteme informatice pentru asistarea deciziei, Editura Dual Tech, Bucureti,
2001.
a) SIAD-uri organizaionale, adic acele SIAD-uri integrate n sistemul informatic total
(integrat) al organizaiei economice care prezint obiective precise pentru asistarea deciziilor ce
posed caracter de repetabilitate; sunt puse la punct i utilizate pe perioade mari de timp;
b) SIAD-uri ad-hoc, adic acele SIAD-uri care rezolv probleme unicat de asistare a
deciziei; prezint costuri ridicate de dezvoltare.
n ultimii ani au aprut SIAD de grup (Groupware) ca tip de suport al deciziilor pentru
un grup de decideni ale cror decizii au o pondere nsemnat n luarea deciziilor ntr-o
organizaie. Scopul utilizrii unor astfel SIAD-uri este creterea calitii procesului decizional
datorit lucrului n echip precum i creterea gradului de creativitate al grupului.
La realizarea SIAD-urilor (i nu numai), este avut n vedere un ansamblu de
caracteristici. Dintre aceste caracteristici, cele mai importante sunt:
- s fie flexibile i s furnizeze mai multe opiuni pentru gestionarea datelor i
evaluarea lor intermediar i final;
- s fie capabile s suporte o mare varietate de stiluri, calificri i clasificri;
- s se bazeze pe mai multe modele analitice i intuitive pentru evaluarea datelor i s
dispun de capacitatea de a urmri mai multe alternative i consecine;
- s reflecte nelegerea grupurilor i proceselor organizaionale de luare a deciziilor;
- s fie sensibile la birocraia i cerinele politicilor organizaionale;
- s reflecte i s contientizeze limitele sistemelor informatice.
Aa cum s-a artat deja, SIAD-urile sunt ncorporate n cadrul sistemelor informatice
integrate (la nivelul organizaiei economice), asimilate dup unele lucrri, cu sistemele de
planificare a resurselor ntreprinderii, ERP (Enterprise Resource Planning).
Ca i alte tipuri de sisteme informatice, SIAD-urile au ca baz un suport soft care le ofer
un mediu de ntreinere, dezvoltare i funcionalitate, ele funcionnd ntr-un mediu creat de
sisteme suport de asistare a deciziei (SSAD).
Funciile unui SIAD sunt: gestiunea datelor, gestiunea modelelor, gestiunea cunotinelor
i gestiunea comunicrii ntre utilizator i sistem i ntre date i modele, cunotine.
Un sistem suport pentru SIAD (SSAD) prezint n arhitectura sa urmtoarele subsisteme:
subsistemul de gestiune a datelor; subsistemul de gestiune a modelelor; subsistemul de gestiune
a cunotinelor; subsistemul de gestiune a dialogului (sau interfaa cu utilizatorul).
1
Zaharie D, Albescu F, colectiv Oper citat
Modelul se poate defini ca o reprezentare abstract i simplificat a unui proces
economic. Metoda modelrii este astfel un instrument al cunoaterii tiinifice i are drept obiect
construirea unor reprezentri care s permit o cunoatere pertinent a diverselor domenii. n
esen metoda modelrii const n substituirea procesului real studiat cu un model care este mai
accesibil studiului.
Rezultatele obinute prin modelare se pot extrapola ctre procesul modelat, cu condiia ca
modelul s reprezinte proprietile, structura i particularitile acestuia. De aceea trebuie inut
cont de faptul c indiferent de modelul economico-matematic ales, el va reprezenta fidel un
anume fenomen, numai n msura n care acesta are la baz teoria economic, teorie care descrie
categoriile, conceptele i legile obiective ale realitii economice. Modelele se pot grupa pe
categorii n funcie de anumite criterii.
1. Dup sfera de cuprindere a problematicii economice sunt:
- modele macroeconomice care sunt definite ca modele de ansamblu ale economiei;
- modele mezoeconomice care au ca domeniu de reflectare nivelel regional, teritorial;
- modele microeconomice care au un domeniu mai restrns i se refer la nivelul firmelor.
2. Dup domeniul de provenien i concepie :
- modele cibernetico-economice, care se bazeaz pe relaii I/O cu evidenierea fenomenelor
de reglare;
- modele econometrice n care elementele numerice sunt determinate statistic i identific
tendine sau periodiciti;
- modele ale cercetrii operaionale care permit obinerea soluiei optime sau apropiate de
optim pentru un anume fenomen supus studiului;
- modele din teoria deciziei;
- modele de simulare prin care se poate stabili modul de funcionare al unui sistem micro sau
macroeconomic prin combinaii aleatoare de valori pentru variabilele independente
- modele specifice de marketing.
3. Dup caraterul variabilelor modelele sunt:
- modele deterministe cu mrimi cunoscute;
- modele stochastice sau probabiliste n care intervin mrimi a cror valoare este permanent
nsoit de o probabilitate.
4. Dup factorul timp modelele sunt statice i dinamice.
5. Dup orizontul de timp considerat sunt modele discrete sau secveniale i modele
continue.
6. Dup structura proceselor modelate sunt:
- modele cu profil tehnologic;
- modele informaional-decizionale;
- modele ale relaiilor umane;
- modele informatice.
n cadrul celor ase grupe, modelele mai pot fi caracterizate ca fiind:
- descriptive pentru c realizeaz o cunoatere direct a procesului studiat;
- normative deoarece permit realizarea unui comportament viitor cerut de factorii de
decizie.
Metodele folosie pentru rezolvare constau dintr-o succesiune de operaii logice i
aritmetice care sunt denumite algoritmi.
Se poate afirma c algoritmii pot fi exaci (riguroi), aproximativi i euristici.
Pentru ca un algorim s rspund cerinelor opentru care a fost construit, el va trebui s
satisfac urmtoarele cerine:
- universalitatea, adic s asigure prelucrarea unui numr mare de date de intrare;
- finitudinea, adic timpul de obinere a rezultatelor s fie de ordinul ore, iar necesarul de
memorie s fie minim;
- determinismul.
Adaptrile modelrii matematice la fenomene economice au la baz i concepia asupra
mrimilor care intervin n procesul de fundamentare corect a deciziilor. De menionat este
faptul c aceste mrimi care intervin implic observri, anchete, raportri care permit o msurare
a lor cu diferite grade de precizie. Conform cu gradul de precizie mrimile care caracterizeaz
procesele economice se pot clasifica n:
- mrimi deterministe care sunt bine definite i au o valoare unic;
- mrimi stochastice sau aleatoare ce dein o multitudine de valori crora li se asociaz o
probabilitate;
- mrimi fuzzy care nu au valoare unic, ci dispun de o mulime de valori crora li se asociaz
un grad de apartenen la o anume proprietate.
Conform cu clasificarea mrimilor ce caracterizeaz procesele economice se ajunge la o
similar clasificare a metodelor de prelucrare pentru adoptarea deciziilor.
Astfel se poate afirma c sunt metode deterministe, metode stochastice i metode fuzzy.
Se poate face o clasificare care are la baz criteriul exactitii i astfel metodele pot fi: exacte,
aproximative i euristice.
Metodele exacte permit ca pentru o problem de decizie economic s se obin o soluie
S care ndeplinete fr nici un dubiu restriciile impuse i/sau condiiile de optim, condiii cerute
de criteriile de eficien. Dac se face notaia S1 pentru vectorul soluiilor adevrate i notaia S
vectorul soluiei efectiv adoptate, atunci: S-S1=0.
Metode aproximative permit obinerea unei soluii S diferit de soluia adevrat S1
printr-un vector dominat de un alt vector dinainte stabilit astfel c vom avea:
S-S1= (1)
Metode euristice sunt utilizate n cazul unor probleme complexe pentru c ntr-un timp
relativ scurt, comparativ cu alte metode, se obine o soluie acceptabil din punct de vedere
practic, S care nu prezint garanii asupra rigurozitii rezolvrii.
Este dat vectorul erorii admisibile , dar metodele euristice nu pot totdeauna s duc la o
soluie S care s ndeplineasc proprietatea (1). Sunt ns cazuri cnd metodele euristice reuesc
s asigure respectarea relaiei (1), cu o anumit probabilitate. Acest tip de metode sunt
considerate a fi o succesiune de ncercri sau tatonri a cror alegere este de fiecare dat legat
de natura problemei care se rezolv i de analistul de sistem.
Actul de decizie care presupune un numr relativ finit i rezonabil de alternative se poate
modela prin analiza decizional. Aceasta presupune ataarea unor valori estimate (cu
probabilitile aferente) pentru fiecare alternativ i care se vor nscrie ntr-un tabel sau un graf.
Modul de alegere a deciziei se face prin a vedea care dintre alternative este cea mai bun.
Aceast metod utilizeaz tabelele de decizie care caracterizeaz aciunea decizional i conine:
stri generale care sunt date de totalitatea condiiilor n care se desfoar evenimentul de
analizat; alternative decizionale ce determin modul de realizare a unei aciuni independente de
voina decidentului; consecine decizionale ce sunt rezultatul aciunii conjugate a strii generale,
criteriilor decizionale i alternativelor. Condiia este ca numrul de consecine s fie mai mare
sau egal cu numrul de criterii.
n cazul problemelor de decizie multicriterial n condiii de risc, n care se cunosc
probabilitile de realizare a fiecrei stri, soluia optim este dat de (p probabilitatea, u
utilitatea):
n
Sopt = max i p ij * u ( x j )
j =1
Problemele manageriale n care decidentul poate aloca doar o cantitate limitat de resurse
mai multor activiti se pot rezolva cu setul de instrumente i metode puse la dispoziie de
programarea matematic, din care cea mai utilizat este programarea liniar. Aceasta din urm
impune anumite reguli pe care decidentul trebuie s le respecte: existena unui set de variabile
msurabile pentru care se caut valoarea optim; construirea unui set de restricii cu aceste
variabile care, n cazul decizional, sunt variabile de decizie, care sunt de fapt relaii de egalitate
sau inegalitate fa de anumite valori; o funcie obiectiv care reprezint o relaie matemetic
liniar ntre variabilele de decizie i rezultatul scontat a crei valoare trebuie minimizat sau
maximizat; crearea legturilor ntre elemente realizat cu ajutorul relaiilor matematice numite
ecuaii, n care apar i coeficieni.
Modelul unei probleme de programare liniar devine astfel: determinarea unui min sau
max pentru funcia obiectiv care depinde de una sau mai multe variabile care satisfac restriciile
modelului (condiii implicite) sau care se refer la valorile ce pot fi luate de variabile (condiii
explicite); problemele de programare liniar au restricii de tip inegaliti i condiii explicite
puse unora dintre variabile.
Modelul de programare liniar are forma:
max (min ) f ( x 1, x 2 ,..., x n ) = c 1 * x 1 + c 2 * x 2 + ... + c n * x n
a 11 * x 1 + a 12 * x 2 + ... + a 1 n * x n b 1
a 21 * x 1 + a 22 * x 2 + ... + a 2 n * x n b 2
n forma standard toate restriciile sunt ecuaii, iar variabilele sunt >=0:
max (min ) f (x ) = cx
Ax = B
x 0
max f ( x ) = cx min f ( x ) = cx
Ax B Ax > B
x 0 x 0
Aceste probleme se rezolv cu algoritmul SIMPLEX (Dantzing, 1951) care este de fapt
iterativ, la fiecare pas se obine o mbuntire a soluiei, oferind:
- soluia admisibil ce satisface doar condiiile explicite sau
- soluia optim.
Programul Excel prin componenta sa Solver rezolv problema de programare liniar. n
ultimul timp majoritatea problemelor sunt de programare liniar multidimensional, ca de
exemplu: metoda utilitii globale n care problema de programare liniar este luat drept o
problem de decizie multidimensional. n acest caz, funcia obiectiv este nlocuit cu funcia de
utilitate; metoda P.O.P. algoritmul care descrie aceast metod presupune o ordonare a
soluiilor n funcie de criterii de preferin definite de decident; metoda STEM ce const n
definirea unei funcii obiectiv de sintez cu coeficieni care vor fi ataai fiecrui criteriu.
2.5 Simularea
Aceast etap const n stabilirea n mod detaliat a tuturor aspectelor legate de problema
pus n studiu, chiar dac uneori tinde ctre o rezolvare analitic. n aceast etap se precizeaz:
ipotezele care se vot testa;
efectele probabile care urmeaz s apar;
schimbrile caracteristicilor operative asupra variabilelor i parametrilor de ieire;
studiul efectelor asupra variabilelor i parametrilor de intrare;
intervalul admisibil pentru variabilele i parametrii de stare,
strategiile luate n calcul la eventuale apariii a evenimentelor perturbatoare i a
costurilor corespunztoare fiecrei strategii;
strategiile de urmat pentru modificarea parametrilor de stare n cazul n care au fost
depite limitele admisibile ale altor parametri de stare;
vectorul iniial al probabilitilor de prevenire a apariiei evenimentelor perturbatoare sau
de modificare a mrimii parametrilor de stare;
tehnici de reducere a datelor i de analz a rezultatelor;
forma ecuaiilor matematice;
ecuaiile suprafeei de rspuns etc.
Un loc important l are colectarea i prelucrarea primar a datelor, faz n care se
stabilesc datele necesare, cum se obin ele i mai ales cum sunt introduse n model.
Datele se vor organiza n fiiere, tabele, rapoarte i se prelucreaz pentru a intra n
prelucrare numai cele care sunt necesare. Un alt obieciv l reprezint stabilirea modelului
potenial, pentru care se va lua n considerare fenomenul aa cum se produce el n realitate.
Pentru aceast etap este necesar a se stabili :
1. ce funcii trebuie s realzeze sistemul;
2. care sunt funciile care se vor modela;
3. care sunt funciile deterministe;
4. care sunt factorii de mediu care influeneaz performanele sistemului;
5. cum se face aproximarea efectelor factorilor de mediu asupra sistemului;
6. ce interaciuni intervin ntre om, sistem i mediu i cum se evalueaz.
Avnd rspunsurile la aceste ntrebri se poate obine o prim form a modelului, se pot
defini parametrii i variabilele. De remarcat este faptul c parametrii modelului sunt: de sistem
sau auxiliari. Parametrii sistemului sunt direct legai de sistemul care va fi simulat, iar parametrii
auxiliari nu sunt asociai direct cu sistemul, ns au efect asupra performanelor acestuia. Exist
parametri cinematici care sunt asociai cu micarea n sistem sau n mediu, iar cei dinamici dein
valori care sunt influenate de ali parametri sau variabile. Exist i o categorie de parametri care
sunt denumii statici i care prin valorile lor influeneaz stochasic procesele i schimb
elementele n sistem. Parametrii de mediu sunt asociai mediului din care face parte sistemul i-i
pot influena performanele.
n model exist i variabile aleatoare, adic valorile lor sunt necunoscute, dar pot apare
n condiii datorate ntmplrii cu probabiliti determinate. O alt categorie de variabile sunt
cele controlabile ale cror valori sunt msurabile printr-o anumit procedur i sunt i variabile
necontrolabile.
O alt clasificare a variabilelor este aceea c acestea pot fi de intrare (mrime exogen
controlabil), perturbatoare (mrime exogen necontrolabil), intermediare (variabile de stare a
unei componente a sistemului), de ieire (variabile exogene).
Variabilele de intrare sunt deterministe sau stochastice. Variabilele deterministe sunt
date pe supori de informaii ori determinate de reguli precise. Variabilele stochastice sunt
generate prin algoritmi corespunztori pe calculator. Dac cel puin una dintre variabile de
intrare este stochastic, rezult c cel puin una dintre variabilele de ieire este stochastic, iar
parametrii ei devin parametrii de ieire. n model fiecare parametru i variabil a modelului se
specific prin: simbol, definiie, descriere, unitate de msur, ordin de mrime pentru valori,
caracteristici, locul n model, sursa.
De remarcat este faptul c variabilele se modific ntr-un ciclu de simulare ct i de la o
variant de evoluie simulat la alta. Dac variabila nu se modific de la o variant la alta atunci
putem afirma c ea devine parametru. Caracteristica parametrilor este aceea c ei rmn
constani n cadrul aceleiai variante, dar se pot schimba de la o variant la alta. O clasificare a
parametrilor d posibilitatea gruprii lor n:
parametrii cei mai importani i pentru care se iau n considerare toate valorile provenite
din msurtori ;
parametri de importan medie, pentru care se iau n considerare numai trei valori
caracteristice : maxim, medie i minim ;
parametri de mic importan pentru care se ia n considerare doar o singur valoare
caracterisic care poate fi valoarea medie sau valoarea cea mai probabil.
Simularea unui sistem economic pornete de la definirea evenimentelor care survin n
derularea procesului economic supus analizei i de la specificarea legturilor existente ntre
evenimente. Evenimentele care intervin n procesul de simulare se clasific n funcie de
anumite criterii i anume :
1. Dup natura evenimentelor acestea pot fi:
Evenimente sistem;
Evenimente program, care sunt asociate programului de prelucrare a datelor.
2. Dup natura condiionrilor dintre evenimente:
evenimente noncontingente n care apariia unor evenimente nu depinde de
apariia sau existena altor evenimente n sistem :
evenimente contingente la care apariia este influenat sau condiionat de
apariia altor evenimente.
3. Dup modul de prelucrare care este asociat evenimentului:
evenimente care nu apar n urma unor decizii :
evenimente cu decizii.
Conform caracterului deciziei, evenimentele au la baz decizii deterministe, adic decizia
se adopt dup reguli de natur algoritmic sau euristic ; sau au la baz decizii probabiliste,
unde decizia este adoptat cu o anumit probabilitate.
4. Dup probabilitile de prevedere evenimentele se clasific n:
previzibile, adic apariia lor este planificat;
perturbatoare, adic apariia lor nu se poate stabili anticipat i sunt cele care
influeneaz defavorabil evoluia sistemului.
5. Dup aciunea asupra parametrilor de stare:
cu aciune imediat, ele modific parametrii de stare ai unor componente
chiar din momentul n care apar;
cu aciune ntrziat, ele modificnd componentele sistemului dup o
anumit perioad de timp.
La elaborarea modelului se are n vedere relaiile funcionale dintre variabile, care dac
nu au date suficiente, ele se pot obine recurgd la metoda analogiilor. Cnd se simuleaz un
model complex este eficient formularea unor submodele specializate n rezolvarea unor funcii
precise i mai apoi acestea vor fi agregate ntr-un model general pe baza relaiilor logice dintre
ele.
O astfel de operaie este denumit integrare i are la baz construcia modular a
modelului. Modulele sunt de dou tipuri : de sistem i auxiliare.
Modulele de sistem simuleaz o funcie sau o operaie logic n sistem, iar cele auxiliare
constituie o parte a modelului dar nu sunt o funcie direct a sistemului. De exemplu, generatorul
de numere aleatoare este utilizat n orice tip de model fr a avea legtur cu problema de
rezolvat.
Se cunoate c n model exist variabile i parametri care vor trebui explicitai prin
limite accesibile minime i maxime. Aceste limite nu pot fi depite n cazul modelelor
deterministe, iar pentru celelalte tipuri de modele se vor stabili aa numitele penalizri dac
limitele se vor depi. Simularea presupune evoluia n timp a sistemului simulat, ceea ce
provoac apariia succesiv a unor evenimente care dau de fapt schimbrile din sistem. Apare
astfel pericolul ca diverse variabile s parcurg intervale de timp diferite. Pentru meninerea
ordinii evenimentelor care ori schimb ori menin starea sistemului, se introduce n algoritmul
simulrii o variabil care va msura scurgerea timpului real n care se execut simularea.
Aceast variabil poart numele de ceasul simulrii i are posibilitatea de a preciza dup
fiecare pas al simulrii, care este intervalul de timp care a trecut de la un pas la altul al simulrii
i cnd aceasta se poate opri. Iniial variabila ceas este zero, ca mai apoi s se modifice ntr-un
numr finit de pai, pas care poate fi constant sau variabil.
Ceasul cu incrementare finit genereaz pe parcursul procesului de simulare o cretere
constant T>0.
Programul de simulare permite determinarea tuturor evenimentelor posibile care se
produc n intervalul T, precum i efectele asupra strii sistemului i deciziile ce se vor adopta.
Ceasul cu cretere variabil are la baz tehnica sau regula evenimentului urmtor, deoarece
mrimea cu care este incrementat ceasul este egal cu intervalul de timp de trecere de la o stare
notat Si la starea determinat de apariia celui mai apropiat eveniment notat cu Si+1. Se poate
afirma c un model de simulare se construiete prin discretizarea timpului cu cretere constant
sau variabil.
Timpul simulat se scurge perioad cu perioad, iar calculatorul va executa toate
tranzaciile care au loc pas cu pas pn la expirarea orizontului de simulare. Sunt cazuri n care
perioadele vor fi relativ scurte pentru c pot apare prea multe evenimente n cazul perioadelor
lungi i aceasta face ca programul s fie greu de executat. Exist i situaia n care perioadele
sunt prea scurte i atunci apare riscul s nu apar nici o tranzacie.
Remedierea acestei deficiene se face prin mrirea perioadei sau prin utilizarea ceasului
cu increment variabil.
Fiecrui tip de sistem simulat i corespunde un anumit tip de funcie obiectiv.
Dup aceast etap se verific validitatea modelului prin utilizarea testelor statistice care
vor arta dac parametrii de intrare au fost corect estimai. Se verific apoi i dac modelul
conine toate variabilele eseniale iar relaiile dintre variabile i parametri sunt cele corecte. Dup
ce modelul a fost scris ntr-un limbaj natural el va fi transformat ntr-un model scris n limbaj de
simulare.
Ca exemplificare se vor da cteva detalii despre cea mai cunoscut metod de simulare a
proceselor economice i anume metoda Monte Carlo.
Metoda Monte Carlo st la baza procedeelor de generare a proceselor stochastice sau de
cutare a unor puncte n domeniu. Rezultatele obinute prin utilizarea acestei metode se refer la
evaluri i ierarhizri care fundamenteaz o decizie economic.
Domeniile n care se aplic aceast metod sunt:
Procese de stocare complexe, unde ritmul de aprovizionare este aleator sau sezonier,
suprafaa de depozitare este limitat, sunt penalizri pentru lipsa de stoc sau n condiiile
n care nu este posibil o modelare clasic prin teoria stocurilor;
Procese de ateptare n care evenimentele se intercondiioneeaz, iar rezolvarea lor prin
modele de ateptare este practic imposibil;
Procese de repartiie care se analizeaz n legtur cu activitatea de producie i cu cea
de investiii.
Dac se dispune de structura graficului reea i de repartiia duratelor, simularea va consta
n aplicarea algoritmului de calcul al drumului critic pentru un numr suficient de mare de
generri ale duratelor activitilor n concordan cu repartiia stabilit.
Simularea are ca rezultat estimarea parametrilor repartiiei duratei totale i poate da i
determinarea frecvenei caracterului critic pentru orice activitate n parte.
Procese de munc complexe care se refer la deciziile legate de programarea operativ a
produciei (ca de exemplu ncrcarea utilajelor, lansarea n fabricaie, urmrirea realizrii
produciei), de la locul de munc la atelier sau secie.
Tabelul de simulare
Tabelul de simulare din Excel este un instrument informatic dedicat din categoria
analizei datelor i rezolvrii problemelor complexe de asistare a deciziei economico-financiare.
Tabelul de simulare din Excel reprezint o zon de celule ce indic rezultate obinute ca urmare a
substituirii unor valori din formule definite n prealabil de utilizator. Se pot obine:
Tabele de simulare cu o singur variabil de intrare;
Tabele de simulare cu dou variabile de intrare.
n cazul tabelelor de simulare cu o singur variabil de intrare, dac se introduce un
set de valori pentru variabila de intrare, se poate astfel pune n eviden influena pe care o are
aceast modificare de valori ntr-una sau mai multe formule.
n cazul tabelelor de simulare cu dou variabile de intrare, se aplic seturi de valori
pentru cele dou variabile i se pune n eviden efectul modificrilor asupra unei singure
formule.
Scenariul
Scenariul servete pentru realizarea previziunilor asupra unui proces economic prin
compararea seturilor de valori care conduc la rezultate diferite. Practic, n instrumentul
Microsoft Excel, scenariul (Scenario) reprezint o mulime de valori pe care acesta le poate
substitui automat ntr-o foaie de calcul. Cu ajutorul scenariului se obin simulri ale mai multor
variante ale unui proiect, variante care au valori diferite ale parametrilor i rezultate diferite.
2.6.Teoria jocurilor
La baza lurii deciziilor de obicei intervin condiiile care influeneaz asupra diverselor
alternative. Condiiile sunt legate de aciunea omului sau pot reprezenta complexul factorilor
naturali n care se desfoar evenimentele.
Modelarea matematic a procesului de decizie se face cu ajutorul conceptului de joc
strategic. Jocul se poate defini ca fiind acel proces competitiv care se desfoar ntre mai muli
participani , care se numesc juctori, dintre care unul este inteligent i prudent, adic poate
analiza situaia creat i poate lua decizii asupra aciunilor ce vor urma. Ca noiune apare partida
care este dat de un set de reguli dup care juctorii i desfoar aciunile. Partida se
caracterizeaz printr-o stare denumit iniial i o stare final, aceasta din urm fiind determinat
de regulile jocului.
Strategia este definit n contextul jocului ca fiind o succesiune de aciuni ale unui
juctor, fiecare succesiune este astfel pregtit n aa fel nct s fac fa strategiei adversarului
de joc, pentru atingerea scopului propus. n acest fel se atinge acea stare final n care regulilor
jocului li se asociaz maximum de ctig posibil de realizat. Un joc n care intervin doar doi
parteneri se poate reprezenta matriceal astfel:
J/N N1 N2 ........ Nn
J1 c11 c12 .... c1n
J2 c21 c22 ...... c2n
.............. .... .... .... ....
Jm cm1 cm2 .... cmn
unde s-a notat cu:
J juctorul;
N adversarul din cadrul jocului;
Ji = {J1,J2,..,Jm}este mulimea strategiilor lui J;
Nj = {N1,N2 ,,Nn}mulimea strategiilor lui N;
Ci,j{i=1,m; j=1,n}este consecina adoptrii strategiei Ji de ctre J i a strategiei Nj de ctre
N;
Cnd se pune problema alegerii uneia sau alteia dintre strategii, n procesul de adoptare a
deciziei, se iau n considerare utilitile fiecrei consecine.
Jocurile sunt cu punct a i fr punct a. Jocurile cu punct a presupun c cei doi juctori
se supun unui raionament corect care conduce la alegerea strategiei optime (fiecare dintre
juctori i va alege propria strategie optim). Astfel cele dou strategii optime alese de fiecare
juctor va constitui soluia jocului.
Cazul general al problemei generate de jocul cu punct a are ca principiu de baz principiul
maxim. Fie un joc de ordinul m*n are asociat urmtoarea matrice:
a11 .... a1n
... ... ...
am1 ... amn
Principiul maximului presupune c primul juctor alege acea strategie care are ctigul
minim.
V1= max(min aij); 1 i m, 1 j n
i j
Pentru determinarea valorii V1 se vor determina toate valorile minime pe linii (minj ai,j), iar
dintre acestea se va lua valoarea maxim (maxi ai,j). Juctorul doi va proceda n mod similar:
V2= min (max aij); 1 i m, 1 j n
j i
Valoarea V2 precum i strategia care i corespunde se vor afla prin alegerea tuturor
maximelor pe coloan (maxi aij) i lund pe cel mai mic dintre ele (minj maxi).
V=V1=V2=maxi(minj aij)=min j(max i aij); V1= max(min ai,j); 1 i m, 1 j n
Jocurile fr punct a au ca fundament un raionament, care orict de riguros ar fi, nu l
va conduce pe juctor la alegerea unei perechi de strategii, aa cum se ntmpl n cazul jocurilor
cu punct a. Soluia unei astfel de probleme este dat de determinarea strategiilor mixte optime
ale celor doi parteneri, prin metode algebrice, geometrice sau iterative. Jocurile cu doi parteneri
se modeleaz n situaii conflictuale ntre dou sau mai multe pri care se reduc tot la jocuri cu
doi participani, prin formarea de coaliii. Fiecare dintre pri urmrete alegerea unei strategii
care s asigure un rezultat avantajos n detrimentul adversarului sau adversarilor.
Modele asemntoare sunt utilizate n probleme de decizie n care este doar un singur
participant care trebuie s aleag strategia optim, care n acest caz se numesc stri ale naturii.
Astfel se poate afirma c natura nu acioneaz ca un adversar inteligent care urmrete un
beneficiu ct mai mare din partea adversarului i n consecin nu se pot stabili reguli de
comportare a ei. Se pot ns culege informaii statistice i se pot face previziuni probabilistice.
Deciziile n cazul jocurilor contra naturii se clasific n:
decizii n condiii de certitudine, adic exist informaii certe despre evoluia
viitoare;
decizii n condiiide risc, n care se cunosc doar probabilitile de realizare a
strilor naturii;
decizii n condiii de incertitudine, nu exist informaii privind probabilitile de
realizare a strilor naturii.
Referitor la deciziile n condiii de risc se poate afirma c n procesul managerial,
decidenii sunt pui n faa unor situaii deosebite deoarece trebuie s aleag dintr-o multitudine
de strategii.
Elementele unui model de decizie sunt:
decidentul;
stabilirea i formularea problemei;
totalitatea variantelor sau alternativelor posibile care definesc o situaie
decizional;
mulimea tuturor consecinelor anticipate pentru fiecare variant;
totalitatea criteriilor de decizie ale decidentului;
obiectivele propuse de decident;
strile naturii, factori independeni de decideni i care sunt de tip conjunctural.
Din multitudinea de variante posibile, decidentul urmeaz s aleag drept soluie
convenabil, doar una. n acest proces apare necesitatea de a se compara variantele decizionale
ntre ele prin efectul consecinelor i astfel apare conceptul de utilitate. Utilitatea este de fapt
unitatea comun de msur a consecinelor multitudinii de alternative decizionale.
Teooria jocurilor este utilizat pentru simularea diverselor procese economice.
Jocurile de ntreprindere (Business Games) faciliteaz simularea dinamic a unor
decizii secveniale. Utilizarea jocurilor de ntreprindere are ca scop formarea deprinderilor de a
rezolva diverse situaii limit la factorii de conducere, precum i dezvoltarea de aptitudini de
abordare complex i sistemic a procesului simulat. Cu ajutorul unor astfel de jocuri, specialitii
pot testa ipoteze referitoare la natura deciziilor pe care urmeaz s le adopte cu identificarea
efectelor probabile ale diverselor decizii. De aceea se poate afirma c jocul ofer posibilitatea
acumulrii de experien n problem, nainte ca procesul economic s se fi petrecut i permite
anticiparea acelor consecine referitoare la resurse.
Jocurile se pot clasifica dup anumite criterii i anume:
dup sfera de aciune sunt:
a. jocuri pentru ntreaga ntreprindere prin care se simuleaz funciile principale ale
ntreprinderii n aa fel nct participanii la joc s neleag legitile unitii economice n
ansamblu, n condiiile influenei reciproce dintre subsistemele interne sau dintre acestea i un
sistem exterior.
b. jocul funcional, se refer doar la o funcie specific a ntreprinderii analizate, participanii la
joc exprimmnd decizii n cadrul compartimentului care ndeplinete funcia simulat i pot
estima eventuale consecine pentru alte compartimente cu care acesta acioneaz n legtur
strns.
c. jocuri complexe. Acestea au ca scop analiza mai multor funcii ale ntreprinderii i relaiile
principale cu alte compartimente sau cu exteriorul. n acest tip de joc, particupanii trebuie s
estimeze implicaiile unei decizii adoptate ntr-un compartiment asupra altor compartimente ale
aceleiai ntreprinderi. Se evalueaz n acest caz efectele unor perturbaii asupra
compartimentului luat n studiu chiar dac aceste perturbaii au aprut n compartimente din
afar dar legate de cel studiat.
d. jocuri pentru alte zone de specialitate.
Dup elementul competiv, jocurile sunt:
a. jocuri concureniale n care fiecare participant adopt decizii n aa fel nct s-i depeasc
adversarul. Acestea pot fi jocuri independente i jocuri interdependente.
- jocurile interdependente au drept caracteristic faptul c succesul unui participant este
dependent de propriile decizii ct i de deciziile concureniale.
- jocurile independente se caracterizeaz prin aceea c fiecare juctor realizeaz mbuntirea
propriilor performane economice, fr a aciona asupra celorlali juctori. n cadrul coaliiilor de
juctori se consider c un joc este independent, atunci cnd juctorii din coaliie se ajut
reciproc.
b. jocurile cooperative presupun existena a doi parteneri care convin c n privina anumitor
clase de decizii i aciuni, acestea s nu fie ndreptate mpotriva intereselor celuilalt partener. n
economia de pia pentru anumite tipuri de produse, acetia i mpart piaa.
c. jocurile contra naturii au nevoie de un decident real sau o coaliie de decideni care se
coalizeaz mpotriva unui prtener fictiv, care este de fapt mediul ambiant.
Dup criteriul prelucrarea rezultatelor, jocurile sunt pe calculator sau manuale.
Dup scopul urmrit sunt jocurii de instruire, jocuri de ntreprindere sau pentru
fundamentarea deciziilor operative.
Jocurile de instruire permit celor care particip la ele s poat s adopte decizii optime n
condiiile unor situaii ipotetice, dar posibile n practica economic.
Jocuri de ntreprindere sau pentru fundamentarea deciziilor operative permit
specialitilor s adopte decizii pertinente n condiiile reale existente n ntreprinderele pe care le
conduc sau le organizeaz. Astfel de jocuri necesit utilizarea calculatorului electronic, ntruct
deciziile se adopt pe baza unui algoritm complex, care analizeaz efectele economice ale mai
multor soluii. n acest caz decidentul poate cunoate consecinele asupra performanelor
economice att ale soluiilor optime ct i ale soluiilor ineficiente.
Principalele etape de desfurare a unui joc de ntreprindere sunt urmtoarele:
Etapa de instruire a participanilor;
Adoptare deciziilor de ctre participani. n aceast etap exist un arbitru care
adopt deciziile considerate cele mai bune pentru participani. Arbitrul nu pune la dispoziia
juctorilor nici un algoritm pentru ca acetia s gseasc soluia cea mai bun. Astfel, juctorii
trebuie s adopte decizia fie pe baza competenei, fie pe baza unui algoritm euristic elaborat n
timpul participrii la joc, sau alegnd la ntmplare valori numerice ale parametrilor economici.
Se poate modifica algoritmul ales la urmtoarea iteraie. Dac juctorul adopt decizii la
ntmplare, el le poate perfeciona pe parcursul jocului, ajungnd fie la un algoritm, fie la o
procedur de cutare aleatoare, dar accelerat. Fiecare etap de adoptare a deciziilor constituie o
iteraie a jocului, care corespunde unei perioade de timp de obicei urmtoare. N, numrul maxim
de iteraii pentru un joc este stabilit n prima etap de arbitru. n timpul jocului , consilierii de
joc, precizeaz arbitrului perturbaiile care au avut loc n timpul n care juctorii au adoptat
decizii.
Arbitrul efectueaz calculele prin evaluare consecinelor aprute dup primirea de la
participani a deciziilor adoptate i a perturbaiilor de la consilieri, de obicei cu ajutorul unui
program pe calculator.
Arbitrul public o informare asupra rezultatelor obinute, n urma crora juctorii fac
la rndul lor o analiz rezultatelor. Se remarc faptul c n situaia n care numrul de iteraii nu
este suficient de mare, exist riscul ca unii juctori s obin rezultate bune din pur ntmplare.
Dup dezbaterea rezultatelor care s-au obinut i dup analiza regulilor aplicate, arbitrul creaz
condiii juctorilor pentru pregtire accelerat n adoptarea deciziilor.
Efectuarea unui test de continuare sau de ncetare a jocului de ctre arbitru. Testul
const n compararea iteraiei I la care se afl jocul cu numrul maxim N de iteraii. Dac I < N,
atunci jocul trece la iteraia urmtoatre I+1, iar dac I=N, atunci se trece la etapa urmtoare.
Se anun sfritul jocului i a rezultatelor finale. Arbitrul decide ncetarea jocului,
iar dup parcurgerea celor N iteraii se evalueaz rezultatele jocului. Pentru aceasta arbitrul
calculeaz funcii de performan care permit acordarea unui calificativ global fiecrui
participant la joc. n acest fel se face ordonarea participanilor la joc din punct de vedere al
aptitudinilor de conductori i organizatori.
Aceast metod conduce la generarea unei soluii aproximate pentru probleme complexe
de obicei nestructurate. Pentru astfel de probleme nu se poate descrie un algoritm care nu poate
oferi soluii optime ntr-un numr finit de pai.
Programarea euristic se poate utiliza i pentru probleme complexe structurale ntruct
poate conduce la opiunea mai rapid a soluiilor fa de un algoritm de optimizare (de exemplu
sunt problemele combinatoriale cu extrem de multe soluii posibile).
De remarcat este faptul c procesul decizional se caracterizeaz printr-o formalizare a
spaiului strilor i presupune o explorare atent i pertinent a acestuia. n cazul acestei
programri euristice, spaiul de rezolvare a problemelor implic: spaiul strilor, spaiul
operatorilor, starea iniial, starea sau strile finale precum i informaia asociat fiecrei stri.
Soluia final obinut prin programarea eurstic poate fi un eec sau un succes.
n utilizarea programrii euristice se are n vedere evaluarea rezultatelor care va ine cont
de calea raionamentului, de paii de parcurs ulterior precum i de experiena acumulat n
probleme similare i nu n ultimul rnd i de model.
Evaluarea rezultatelor se realizeaz cu ajutorul funciei de evaluare care depinde de stare
i de informaiile referitoare la acea stare. Starea va fi acceptat dac funcia de evaluare va
depi un anumit prag prestabilit sau dac este mai bun dect valorile strilor n ateptare.
Euristicile se pot grupa n: cantitative dac sunt n baza de modele a unui sistem
informatic de asistare a deciziei; calitative dac furnizeaz cunotine pentru un sistem expert.
Programarea euristic se aplic n cazul n care datele de care se dispune pentru o
problem complex sunt insuficiente sau are un grad mare de inexactitate.
Gradul de complexitate al problemei nu permite utilizarea modelelor de optimizare, nu
exist soluie algoritmic iar modelul de simulare simplific inadmisibil de mult problema i
trebuie obinut o soluie rapid.
Acest tip de programare are o serie de avantaje dintre care se enumer: sunt metode uor
de aplicat i implementat, produc mai multe soluii acceptabile, se poate face o msurare
empiric sau teoretic a calitii soluiei obinute.
Totui prezint i dezavantaje referitoare la garania obinerii unei soluii optime, iar n
cazul n care se fac alegeri secveniale ntr-o decizie, exist riscul de a nu anticipa corect
consecinele alegerilor fcute. Toate aceste riscuri sunt de fapt asumate de decident n momentul
n care a ales ca rezolvare programare euristic.
Modul n care datele sunt retransformate n informaii i apoi n cunotine este de fapt un
proces de valorificare a datelor care se realizeaz prin sintetizarea i analiza lor i, n final, prin
interpretare. Procesul de sintetizare a datelor presupune centralizarea lor, avnd n vedere
diverse criterii i este utilizat n crearea situaiilor de sintez necesare informrii managerilor ca
suport pentru luarea deciziilor. Soluiile oferite de informatic pentru procesul de sintetizare a
datelor sunt: programe specifice i dedicate; interogri care dau posibilitatea gruprii datelor
dup criterii stabilite i ofer funcii pentru domeniile astfel create; funciile de total i subtotal
oferite de generatoarele de rapoarte care permit indicarea ierarhiilor criteriilor de grupare.
n ultimul timp, problema centralizrii datelor a rmas aceeai, ns volumul de date de
explorat este imens, ceea ce duce la faptul ca metodele clasice s devin ineficiente. De aceea
ctig tot mai mult teren tehnologii moderne ca Data Warehousing (depozitarea datelor) i
OLAP (On-Line Analytical Processing) pe msur ce suporturile soft devin suport de date pentru
sistemele tranzacionale.
Depozitele de date (Data Warehouse) ajut la:
- mbuntirea valorii performanelor organizaiei economice cu management centrat pe
client, printr-o mai bun nelegere a nevoilor clientului;
- analiza percepiilor clienilor asupra valorii produselor i serviciilor care sunt oferite sau
care ar putea fi oferite n viitor;
- integrarea marketingului cu tehnologiile informaiei i ale comunicaiilor (IT&C), cu
sursele de date operaionale, obinndu-se depozitul de date de tip ntreprindere, EDW
(Enterprise Data Warehouse);
- contribuie la creterea valorii strategice a organizaiei economice.
ntr-un cadru mai larg, se aplic noul concept de cercetare (inteligent) a afacerilor, BI
(Business Intellgence) ce devine o component critic a ansamblului de operaiuni zilnice ale
organizaiei economice, astfel nct se dezvolt depozite de date n timp real ce asigur
utlizatorilor finali actualizri rapide i emiterea unor semnale de alarm (alerte) generate din
cadrul sistemelor tranzacionale (TPS). Depozitele de date n timp real, RTDW (Real-Time Data
Warehouse), i BI sprijin ndeplinirea planului de afaceri al organizaiei economice. Aplicaiile
RTDW ale organizaiei economice cuprind:
- managementul i contabilitatea veniturilor i cheltuielilor;
- managementul relaiilor cu clienii, CRM (Customer Relationship Management);
- operaiuni i bilanuri la nivel de echip;
- managementul securitii informatice;
- managementul activitilor specifice ndeplinirii obiectivelor organizaiei economice.
Pentru administrarea eficient a afacerilor sunt necesare RTDW, SIAD (DSS) i
instrumente BI.
OLAP reprezint o categorie de tehnologie software care permite analitilor, managerilor
i persoanelor de execuie din organizaia economic s beneficieze de un acces rapid, consistent
i interactiv la depozitul de date; acest lucru se obine printr-o varietate de vizualizri posibile
ale informaiilor ce au fost transformate din datele operaionale i reflect dimensionalitatea real
a organizaiei din punctul de vedere al utilizatorului. Ca urmare, prin tehnologiile de centralizare
se transform datele n informaii de sintez i se asigur analiza lor. Analiza datelor presupune a
gsi relaii ntre datele sintetizate cum ar fi: asocieri, corelaii structurale, cauzale sau
funcionale. Funcionalitatea OLAP este caracterizat de o analiz dinamic multidimensional
dinamic a datelor consolidate ale organizaiei economice ce sprijin activitile analitice i de
cutare i regsire a informaiilor (prin navigare sau browsing) desfurate de utlizatorul final:
calcule i modele aplicate dimensiunilor transversale prin intermediul ierarhiilor sau
membrilor;
analize asupra tendinelor din perioade de timp secveniale;
submulimi obinute prin secionare (slicing) pentru vizualizrile prezentate pe ecranul
monitorului calculatorului;
efectuarea unor operaiuni de drill-down pentru adncirea nivelurilor de consolidare a
datelor;
efectuarea operaiunii de rotaie (rotation) pentru obinerea unor noi comparaii
dimensionale n zona de vizualizare a datelor.
O form simpl de analiz a datelor este compararea datelor cu date similare, comparare
care se face pstrnd toate criteriile identice, doar unul singur avnd valori diferite. Comparare se
face ntre seturi de date comparabile, iar tehnologiile de comparaie sunt dotate cu tehnici de
observare pentru semnalizarea tiparelor, corelaiilor, asocierilor prin similitudini sau sesizeaz
abateri, excepii. Informatica a venit n ntmpinarea acestor cerine cu tehnicile de prezentare
grafic care transform informaia cantitativ n informaie calitativ. Au aprut i tehnici de
observare analitic a datelor care au la baz teorii matematice prin care datele reale sunt
comparate cu date teoretice produse de un model ipotetic.
Dezvoltarea tehnicilor de observare a dus la apariia tehnicilor de observare automat
bazate pe data-driven. Rezultatul unor astfel de tehnici se regsesc ntr-un model cu caracter
general. Tehnicile de observare analitic a datelor se regsesc ntr-o tehnologie modern
denumit Data Mining (n traducere liber Mineritul datelor).
Rezultatul procesului de observare analitic este obinerea unor tipare, corelaii i uneori
modele din care se pot deduce tendine sau se poate previziona cu o anumit probabilitate cum
vor arta datele pe o perioad ulterioar. Modelul permite interpretarea datelor, ce reprezint un
proces cognitiv cu o apreciere general a situaiei, i identific probleme, oportuniti sau
poteniale cauze de eec.
De remarcat este faptul c interpretarea datelor duce la apariia de cunotine noi care se
vor cumula la cele deja existente. Instrumentele soft clasice pentru asistarea deciziei au avut ca
principal scop asigurarea tehnicilor de analiz, optimizare i simulare precum i reprezentarea
grafic a rezultatelor. Dintre aceste instrumente se amintesc procesoarele de tabele Lotus i Excel
orientate pe volume mici de date, cele referitoare la sistemele de gestiune a bazelor de date
Access, Visual Foxpro, capabile s lucreze cu volume mari de date cu structur uniform.
Principalul dezavantaj al acestor instrumente clasice este c opereaz numai asupra acelor date
care au o structur prestabilit i provin dintr-o surs unic. Noile sisteme de asistare a deciziei
folosesc tehnici speciale de comasare a datelor stocate n structuri neuniforme, pentru a utiliza
informaii implicite care nu sunt specificate n datele existente. Suporturile software de asistare a
deciziei ofer utilizatorilor o serie de faciliti cum ar fi: interogarea n limbaj natural, accesul la
modele conceptuale, sisteme de gestiune OLAP i servicii de integrare cu alte suporturi soft.
Depozitul de date (Data Warehouse) este un ansamblu de date special produse pentru a
sprijini luarea deciziei manageriale. Depozitul de date conine date istorice i curente de interes
potenial pentru manageri n cadrul organizaiei economice. n mod obinuit, datele sunt
structurate pentru a putea fi oricnd disponibile pentru activiti de prelucrare analitic online
(OLAP), Data Mining, interogri, rapoarte, alte aplicaii pentru asistarea lurii deciziei8.
Trebuie precizat c noiunea de depozit de date (Data Warehouse) se refer la rezultatul
final date memorate pe suport informaional, date ce prezint caracteristici distincte fa de
bazele de date tranzacionale, n timp ce noiunea de depozitarea datelor (Data Warehousing)
privete ntregul proces de creare, meninere i exploatare a unui depozit de date.
Depozitele de date (Data Warehouse) reprezint din perspectiva metodologic, pur didactic,
o ramur a informaticii aplicate n domeniul sistemelor informatice pentru asistarea deciziei,
SIAD sau DSS, prin intermediul creia se asigur:
1) administrarea complex a afacerilor;
2) accesarea din exterior, oportun i eficace, a informaiilor i cunotinelor necesare
afacerilor (business information and business knowledge).
Procesul de depozitare a datelor (Data Warehousing) conine urmtoarele componente majore
(fig.3.1):
1) Sursele de date;
2) Extragerea, transformarea i ncrcarea datelor din bazele de date operaionale, ETL
(Extraction, Transformation and Load);
3) Depozitul de date de tip ntreprindere, EDW (Enterprise Data Warehouse);
8
Turban E., Aronson, J.E., Liang, T.P., Sharda, R. - Decision Support and Business Intelligence Systems, Pearson
Prentice Hall, New Jersey, 2007.
4) Metadatele (programe soft pentru date i reguli pentru organizarea rezumatelor de date.
Sunt uor de indexat i regsit, inclusiv prin instrumente Web);
5) Instrumente de tip middleware, ce asigur accesul la depozitul de date (OLAP, Data
Mining, instrumente soft de ntocmire a rapoartelor i de vizualizare a datelor).
Necesitatea depozitelor de date este dat de volumul imens de date acumulat n timp de
organizaiile economice. Integrarea acestor date istorice ale organizaiei ntr-o structur care s
stea la baza lurii deciziilor a devenit principala preocupare a noilor tehnologii informatice.
Depozitele de date integreaz diferitele tipuri de baze de date din organizaie, asigurnd date
oportune i relevante (n timp real sau aproape de rspuns n timp real) pentru sistemele
informatice pentru asistarea deciziei manageriale, SIAD. Implementarea depozitelor de date
confer valoare strategic organizaiei economice. De asemenea, depozitele de date contribuie la
reducerea costurilor. De exemplu, n primul an de operare a depozitelor de date, aceast reducere
a costurilor este similar cu investiiile n sistem pe timp de ase ani9.
APLICAII:
Rafturi
de date OLAP
EDW Interfee de
aplicaii Web
middleware
Data Mining
Instrumente de
interogare
ETL relaionale
Instrumente de
SURSE DE DATE raportare
(OLTP, externe, motenite
de la sistemele informatice vechi)
Vizualizare
rezultate
9
Turban E., op.cit.
Sistemele de asistare a deciziei care au la baz analiza i sinteza datelor realizeaz
comasarea, sistematizarea, corelarea i gruparea datelor pentru a obine informaii care s
reliefeze factorii care influeneaz pozitiv sau negativ performanele companiei. Ca urmare a
obinerii unor astfel de informaii se poate adopta o strategie de ameliorare a factorilor cu
influen negativ asupra performanelor organizaiei economice.
Obinerea rezultatelor, sub form de rapoarte care conin informaii utile factorilor de
decizie sunt ntr-o form accesibil i sunt rezultatul tehnicilor speciale de explorare a masivelor
de date. Aceste tehnici conduc la evidenierea unor corelaii ntre date, pot face estimri i
prognoze precum i atenionri ale managerilor asupra unor disfuncii.
Caracteristicile fundamentale ale depozitelor de date (Inmon 2005, Tuban 2007) sunt
urmtoarele:
a) orientarea pe subiecte (de exemplu, produse, clieni, vnzri etc.) coninnd numai informaia
relevant pentru procesul de decizie managerial; prin aceasta, managerii, n calitate de
utilizatori finali, calculeaz sau evalueaz performanele obinute n afaceri, formulnd i
explicaiile justificative pentru aceste performane.
b) integrarea, nemijlocit legat de caracteristica orientarea pe subiecte; datele provenite din
surse diverse sunt dispuse ntr-un format consistent, eliminndu-se astfel conflictele i
discrepanele ce pot apare datorit unitilor de msur diferite. Un depozit de date se presupune
c este total integrat.
c) nonvolatilitatea: odat ce datele au fost introduse (scrise) ntr-un depozit de date,
utilizatorii nu mai pot modifica sau actualiza datele. Un depozit de date este proiectat din
perspectiva utilizatorului, n mod exclusiv, numai pentru acces la date.
d) variabilitatea n timp (serii de timp). Un depozit de date menine datele istorice ale
organizaiei economice. Datele nu trebuie s asigure, n mod necesar, starea curent (excepie
fac doar sistemele n timp real). Pe baza depozitelor de date sunt detectate trenduri, deviaii,
relaii pe termen lung pentru comparaii i prognoze ce conduc la luarea deciziei. Pentru fiecare
depozit de date exist o calitate temporal. Timpul reprezint una din dimensiunile importante pe
care trebuie s le posede toate depozitele de date. Datele pentru analize ce provin din surse
multiple conin referine de timp multiple (de exemplu, vizualizri zilnice, sptmnale, lunare
etc.).
e) includerea aplicaiilor bazate pe Web.
f) utilizarea arhitecturii client/server.
g) utilizarea structurilor de baze de date relaionale sau de baze de date multidimensionale.
h) folosirea metadatelor (date despre date).
Caracteristicile depozitelor de date rezult din faptul c ele pot nmagazina volume mari
de date preluate din arhive i/sau din bazele de date ale aplicaiilor informatice specifice
activitii curente a ntreprinderii (sunt volume de ordin 1012 terabytes), precum i din surse
externe organizaiei economice. Exploatarea acestor volume uriae de date, provenind de la surse
de date diverse, este asigurat de existena unor motoare speciale care dau posibilitatea ca
masivele s poat fi interogate, precum i existena unor servicii speciale de analiz on-line a
datelor (OLAP). Suporturile software susin performanele acestor servicii prin transformarea
datelor, corelarea i completarea lor precum i prin crearea dicionarului de date, toate acestea
asigurnd accesul la structurile primare. Datele sunt extrase din baze de date heterogene create
de sistemele informatice deja existente n organizaie pe diversele platforme hard i soft.
Se poate remarca faptul c datele sunt introduse nu la ntmplare ci sub controlul unor
aplicaii i al SGBD-ului. Acestea asigur prin serviciile de integritate, stocarea i lucrul n
condiii de siguran maxim. Datele care formeaz suportul pentru tranzaciile primare sunt
apoi prelucrate pentru a se obine informaiile de sintez necesare planificrii i lurii deciziilor
i sunt tratate de instrumentele SGBD.
Deoarece exploatarea unui volum enorm de date, pentru a obine diverse rapoarte, este
asigurat de integritatea i coerena bazei de date, reuniunea tuturor acestor date duce la
exploatarea unui mare numr de tabele, la crearea unor multiple legturi virtuale i tabele
temporare. Acest volum mare de munc conduce la principalul inconvenient al depozitelor de
date i anume timpul mare necesar exploatrii lor. Un alt inconvenient l constituie i
aglomerarea motorului bazei de date cu task-uri de centralizare care ncetinete astfel
tranzaciile curente.
Astfel a aprut necesitatea stocrii datelor care sunt dedicate planificrii i deciziilor
strategice ntr-un sistem diferit de sistemul operaional n aa fel nct funcionarea celor dou
sisteme s se fac fr inconveniente. n depozitul de date se pot stoca att arhive de date privind
activitatea anterioar ct i date referitoare la tranzacii ulterioare fr ca utilizatorul s poat
interveni.
Depozitele de date sunt o concentrare de date care organizeaz, consolideaz i
centralizeaz datele din surse eterogene i care vor constitui baza procesrilor analitice att de
necesare proceselor de decizie. Depozitul de date se construiete progresiv adic el permite
completri i dezvoltri ulterioare. Pentru a se asigura o calitate sporit a datelor acestea sunt
supuse unui proces de curire i transformare, menionnd i maniera de obinere a unor date
colectate pe baza celor existente, acest proces ducnd la micorarea timpului cerut pentru
obinerea unor rapoarte finale. n depozitele de date se face transformarea codurilor n date
explicite precum i integrarea datelor din nomenclatoare n datele referitoare la tranzacii. Acesta
este numit i proces de denormalizare i este caracterizat de faptul c nu modific integritatea
datelor i grbete procesul de regsire. ntr-un depozit de date redundana datelor este permis.
Literatura de specialitate prezint mai multe arhitecturi de depozite de date, grupate n
dou categorii: depozitele de date de tip ntreprindere, EDW (Enterprise Data Warehouse) i
rafturi de date (Data Marts). Un exemplu de arhitectur de depozit de date bazat pe Web
(Turban, 2007) este prezentat n fig.3.2. Aceast arhitectur pe 3-entiti (three-tiers) cuprinde
clientul, serverul Web i serverul de aplicaie. Pe partea de client exist o conexiune Internet i
un navigator Web bazat pe o interfa grafic de tip GUI (Graphical User Interface). Mediul de
comunicaie dintre client (atenie: aici client are sensul de staie de lucru Work Station - pentru
utilizatorul final) i servere este de tipul Internet/Intranet/Extranet. Pe partea de server se
folosete un server Web pentru gestionarea fluxurilor informaionale dintre client i server,
urmat de serverul de aplicaie i depozitul de date.
Navigator Server Web Depozit de
Web date
1. Client
2. Server Web 3.Server de aplicaie
10
www.wikipedia.com
11
searchsoa.target.com
format HTML sau PDF (Portable Document Format). Prin CMS se asigur actualizarea cu
ultima versiune a unui document sau restaurarea unui document n versiunea precedent.
Decizie de alegere a unei arhitecturi de depozit de date este influenat de mai muli
factori, dintre care se menioneaz:
- cerinele de informaie ale managementului de vrf (top-management);
- interdependenele informaionale existente ntre departamentele i entitile funcionale
ale organizaiei economice;
- gradul de limitare a resurselor organizaiei economice;
- existena compatibilitii cu sistemele informatice aflate deja n exploatare n organizaie;
- motivaia profund a angajailor n dezvoltarea unui depozit de date.
Integrarea datelor ntr-un depozit de date conine trei procese majore:
a) accesul la date;
b) realizarea federaiei de date;
c) reflectarea oportun n depozitul de date a modificrilor semnificative ale datelor
provenite din sursele de date de tip ntreprindere.
Exist mai multe tehnologii de integrare a datelor i metadatelor n depozit de date:
1) integrarea aplicaiilor de tip ntreprindere, EAI (Enterprise Application Integration);
2) arhitectura orientat pe servicii, SOA (Service-Oriented Architecture);
3) extragerea, transformarea i ncrcarea datelor n depozitul de date, ETL (Extraction,
Transformation and Load);
4) integrarea informaiilor de tip ntreprindere, EII (Enterprise Information Integration).
Integrarea aplicaiilor de tip tip ntreprindere, EAI (Enterprise Application Integration)
asigur modalitatea unitar de preluare a datelor din surse diverse i stocarea lor n depozitul de
date de tip ntreprindere, DEW. Aceast integrare a aplicaiilor de tip ntreprindere se realizeaz
la nivelul interfeei de programare a aplicaiei, API (Application Programming Interface). EAI
este combinat cu arhitectura orientat pe servicii, SOA (Service-Oriented Atchitecture) care
estre focalizat pe un ansamblu coerent de procese de afaceri orientate pe servicii Web.
Extragerea, transformarea i ncrcarea datelor n depozitul de date, ETL (Extraction,
Transformation and Load) reprezint componenta integral a oricrui proiect centrat pe
organizarea, stocarea i prelucrarea datelor, aa cum este depozitarea datelor (Data
Warehousing). Aceast component ETL consum circa 70% din perioada de lucru la un proiect
centrat pe date12.
Extragerea datelor nseamn citirea datelor destinate depozitului de date din una sau mai
multe baze de date.
Transformarea datelor reprezint conversia datelor extrase din forma iniial n forma
standard necesar pentru stocarea n depozitul de date sau n alte baze de date cu care depozitul
de date lucreaz direct.
ncrcarea datelor nseamn stocarea datelor, anterior transformate n forma standard,
curate i rafinate, n depozitul de date.
Pot constitui surse de date relevante pentru depozitul de date (raftul de date): baze de
date tranzacionale (provenite din sistemul informatic de procesare a tranzaciilor, TPS), baze de
date provenite din aplicaii ERP, din aplicaii CRM, din tabele Excel (ntr-un cadru mai larg, din
baze de date specifice OAS), din baze de cunotine specifice KWS, din iruri de mesaje, din
fiiere externe etc.
Datele stocate n depozitul de date sunt conforme (prin forma standard dobndit prin
intermediul procesului ETL) cu regulile de afaceri ce definesc modul de folosire a datelor
stocate, cu regulile de ntcomire a rezumatelor (sintezelor, rapoartelor), cu regulile de
standardizare a atributelor codificate, cu regulile de efectuare a calculelor. Toate aceste reguli
sunt memorate ntr-o baz de metadate i sunt aplicate unitar n ntreg depozitul de date.
Turban (2007) difereniaz trei tipuri principale de depozite de date: rafturile de date,
DM (Data Marts), memoriile-tampon de date operaionale, ODS (Operational Data Stores) i
depozitele de date de tip ntreprindere, EDW (Enterprise Data Warehouse).
Aa cum s-a artat n primul capitol al lucrrii, organizaia economic este structurat pe
departamente i entiti funcionale, figurate ca domenii de gestiune ale organizaiei economice.
La nivelul acestor departamente i entiti funcionale, datele ce prezint caracteristicile
prezentate n paragraful anterior sunt depuse n rafturi de date, DM (Data Marts). n unele
lucrri, noiunea romneasc asociat lui Data Marts este de magazie de date, Altfel exprimat,
12
Turban, E., Op.cit.
dac depozitele de date (Data Warehouse) combin baze de date la nivelul ntregii organizaii
economice (adic la nivelul sistemului informatic integrat al organizaiei economice), n schimb
rafturile de date cu dimensiuni mai mici dect depozitele de date, sunt destinate unui anumit
departament al organizaiei economice sau unui anumit subiect definit la dorina utilizatorului
final.
Utilizarea magaziilor sau rafturilor de date (Data Marts) conduce la creterea
performanelor n exploatare. Aceste depozite de date se construiesc de obicei cu tehnologii
relaionale.
Majoritatea rafturilor de date sunt rafturi de date dependente (adic sunt generate direct
din depozitul de date). Exist, ns, i rafturi de date independente de depozitul de date al
organizaiei ce sunt realizate special pentru o unitate strategic de afaceri, SBU (Strategic
Business Unit) i care nu folosesc date din depozitul de date al organizaiei economice. Raftul de
date independent poate constitui o alternativ low cost pentru firmele care nu-i pot permite
achiziionarea, meninerea i exploatarea unui depozit de date.
13
Turban, E., 2007, Op.cit.
EDW utilizeaz date n format standard ce provin de la surse diverse. Datele din EDW
sunt folosite ca date de intrare pentru majoritatea tipurilor de sisteme informatice pentru asistarea
deciziei economice, cum sunt sistemele informatice pentru managementul relaiilor cu clienii,
CRM (Customer Relationship Management), sistemele informatice pentru managementul
lanului de aprovizionare, SCM (Supply Chain Management), sistemele informatice pentru
managementul performanelor afacerilor, BPM (Business Performance Management), sistemele
informatice pentru managementul ciclului de via al produselor, PLM (Product Lifecycle
Mangement), sistemele informatice pentru monitorizarea activitilor afacerilor, BAM (Business
Activity Monitoring), sistemele (aplicaiile) informatice pentru managementul veniturilor,
sistemele informatice pentru automatizarea lucrrilor de birou, OAS (Office Automation
Systems), sistemul informatic de lucru cu cunotine, KWS (Knowledge Work Management)14
etc.
14
Idem.
informaii pariale (incomplete). Depozitele de date elimin acest dezavantaj prin accesarea,
integrarea i organizarea datelor operaionale cu rol-cheie ntr-o form care se caracterizeaz
prin consisten, fiabilitate, oportunitate, disponibilitate rapid i cu referin n timp (timely).
*
Dinu Airinei Oper citat
pot exista mai multe nomenclatoare alternative. Dac se integreaz aceste subdimensiuni i
dimensiuni alternative, se creeaz o schem sub form de fulg de zpad.
Schemele de tip stea, fulg de nea sau constelaie sunt modele conceptuale
multidimensionale ale depozitelor de date, avnd ca rol organizarea datelor pe subiecte, necesar
procesului de decizie. Schema este deschis, adic ea se poate modifica pe tot parcursul vieii
depozitului de date.
*
Zaharie D, Albescu F, colectiv Oper citat
Produsul Oracle Express cuprinde urmtoarele componente arhitecturale: utilitare pentru
administrare (Express Instance Manager, Express Administrator i Relational Access Manager),
instrumente pentru dezvoltare (Oracle Express Analyser, Oracle Express Objects etc) i nucleul
(limbajul de programare Express). Instrumentul OLAP denumit Oracle Express Analyser
asigur selectarea, analiza i vizualizarea datelor memorate n baza de date multidimensional,
iar instrumentul Oracle Express Objects asigur dezvoltarea de aplicaii OLAP cu ajutorul
limbajului de programare Express. Prin integrarea instrumentului Oracle Express Objects cu
Oracle Discoverer, este facilitat realizarea aplicaiilor destinate cercetrii (inteligente) a
afacerilor (Oracle Integrated Business Intelligence Tools). Este prevzut, de asemenea, un editor
de conexiuni, Express Connection Editor, care asigur definirea conexiunilor la baza de date
multidimensional.
Pentru ca un depozit de date s poat fi procesat este necesar existena unui set
specializat de instrumente pentru: descrierea fizic i logic a surselor de date, a depozitelor sau
a magaziei de date n care acestea urmeaz s fie ncorporate; validarea, curirea i
transformarea datelor care urmeaz a fi stocate n depozitul de date; utilizatorii finali,
instrumente care permit acestora accesul la datele stocate n depozitul respectiv. Astfel de
instrumente sunt specializate pentru medii de dezvoltare a aplicaiilor, produse program
specializate pe analiza datelor precum i pentru aplicaii personale (individuale).
Dac se analizeaz tehnologia relaional se observ c cea mai mare parte a problemelor
tratate relaional sunt n realitate multidimensionale. n modelul relaional problemele sunt
tratate n tabele care au dou dimensiuni: linie i coloan. Problemele reale, care n cea mai mare
parte a lor sunt multidimensionale, nu impun limite stocrii spaiale a datelor. Astfel, un SGBDR
obinuit nu poate face fa cerinelor de agregri de date, sintetizri, consolidri i proiecii
multidimensionale. De aceea, a aprut necesitatea extinderii funcionalitii unui SGBDR prin
adugarea unor componente speciale care s permit modelare i analiz multidimensional
(OLAP) i Data Mining.
La modul general, termenul de procesare analitic online, OLAP (OnLine Analytical
Procesing) se refer la o varietate de activiti ce sunt realizate de ctre utilizatorii finali n
sistemele informatice interactive (online). n mod obinuit, OLAP cuprinde activiti ca
generarea i obinerea rspunsurilor la interogri i cererile ad-hoc de rapoarte i grafice.
Obinerea acestor rspunsuri la interogri, rapoarte i grafice se fundamenteaz pe metodele
moderne ale statisticii i cercetrilor operaionale, precum i pe tehnologiile de construire a
prezentrilor vizuale. Unele lucrri de specialitate includ analizele i prezentrile
multidimensionale, sistemele informatice pentru suportul executivului, ESS (Executive Support
Systems) sau EIS (Executive Information Sytstems) i Data Mining n tehnologia OLAP15. n
esen, produsele de firm OLAP furnizeaz posibiliti de modelare, analiz i vizualizare
15
Lungu, I. .a., Sisteme informatice executive, Editura ASE, Bucureti, 2007.
pentru volume mari de date din baze de date (prin intermediul SGBDR) sau din depozite de date.
OLAP asigur vederi conceptuale multidimensionale asupra datelor. Modelele de date asociate
sistemelor OLAP se ncadreaz astfel n dou categorii: extensii ale modelului de date relaional
i modelele bazate pe cuburi n-dimensionale. Din categoria extensiilor modelului de date
relaional pentru OLAP fac parte, ntre altele:
- modelul Kimball (fundamentat pe schema tip stea ca o reprezentare relaional a cubului
n-dimensional; din aceasta s-au dezvoltat schema tip fulg de nea i schema tip
constelaie);
- modelul Gary (fundamentat pe operatorii CUBE i ROLLUP ai clauzei Group By din
limbajul de interogare structurat SQL);
- modelul Gyssens i Lakshmanan (fundamentat pe o extensie ale algebrei relaionale).
Din categoria modelelor bazate pe cuburi n-dimensionale se pot meniona, ntre altele:
- modelul lui Agrawal, Gupta i Sarawagi (fundamentat pe o mulime de operatori
asemntori cu cei din algebra relaional, cu organizarea datelor bazat pe cuburi n-
dimensionale);
- modelul Cabbibo i Torlone (fundamentat pe o schem multidimensional compus din
mulimea de dimensiuni, tabelele de fapte i descrierile nivelurilor ierarhice)16.
Tehnologia OLAP permite utilizatorilor navigarea rapid de la o dimensiune la alta i
faciliti sporite de obinere a celor mai detaliate informaii din depozitul de date. Tehnologia
OLAP se bazeaz pe 12 principii formulate de Ted Codd (1993), extinse la 18 principii n anul
1995. Acestea sunt:
1. abordarea conceptual multidimensional a datelor; ca urmare, se folosesc modele
multidimensionale;
2. asigurarea unei transparene sporite prin existena unei arhitecturi deschise a sistemului;
3. accesibilitatea asigurat utilizatorului prin asistarea implicrii acestuia n modalitile
tehnice de furnizare a datelor (utilizatorul final reprezint i el o surs de date); trebuie s se
realizeze o singur viziune logic a datelor din organizaie (enterprise);
4. complexitatea dimensional a analizei ofer performane stabile; instrumentele OLAP
trebuie s aib implementate patru modele de analiz: direct, explicativ, contemplativ i
formativ;
5. utilizarea arhitecturii client-server, unde server-ul are ca scop omogenizarea datelor;
6. posibilitatea de a efectua aceleai operaii asupra tuturor dimensiunilor i care poart
numele de prelucrare generic a dimensiunilor;
7. dimensiunile trebuie s fie echivalente operaional i structural (dimensionalitate
generic); prin intermediul acestui principiu sunt astfel asigurate ierarhii multiple;
8. gestionarea dinamic a matricilor ncruciate prin facilitatea de a elimina combinaiile
dimensionale nule, pentru a nu ncrca memoria calculatorului; indiferent de sursa lor, valorile
lips sunt ignorate;
9. posibilitile de acces simultan al mai multor utilizatori (multi-user) la aceeai faz
(etap) de analiz;
10. operaii nerestrictive, ceea ce d posibilitatea executrii fr restricii a calculelor pentru
toate combinrile de dimensiuni i niveluri ierarhice;
11. posibilitatea manipulrii intuitive a datelor;
16
Muntean, M., Iniiere n tehnologia OLAP. Teorie i practic, Editura ASE, Bucureti, 2004.
12. numr nelimitat de niveluri de agregare i de dimensiuni 1.
13. valorile lips sunt diferite de valorile invalide i de valorile zero (mprtiere); valoarea
zero este valid; modelele OLAP satisfac regula referitoare la valorile NULL din modelul
relaional. Ca urmare, datele lips i invalide trebuie tratate n mod individual;
14. denormalizarea datelor, la introducerea lor n depozitul de date;
15. memorarea rezultatelor generate de OLAP; sistemele OLAP stocheaz datele n depozite
de date separat de sistemele tranzacionale;
16. flexibilitatea rapoartelor, prin selectarea axelor la raportare la dorina utlizatorului final;
17. caracteristici superioare ale raportrii, n funcie de locaia procesrii datelor (client sau
server) i de modul de efectuare a calculelor (dup modele de preprocesare sau calcule executate
n momentul interogrii depozitului de date);
18. ajustarea automat a nivelului fizic, n funcie de volumul datelor i de tipul de model
logic folosit.
OLAP este tehnologia de agregare a datelor stocate n depozite de date ntr-o manier de
abordare multidimensional cu faciliti referitoare la accesul la informaii a managerilor n mod
interactiv i flexibil. Legtura dintre OLAP i depozitele de date este aceea c OLAP le
completeaz prin transformarea volumului imens de date stocate i gestionat n depozite n
informaii utile procesului de decizie. Cele 12 reguli (iniiale, din 1993) ale lui Codd au fost apoi
regrupate ntr-un test cu 5 reguli denumit FASMI (Fast Analysis Shared Multidimensional
Information).
OLAP presupune existena unor tehnici care permit de la o navigare i selecie simpl a
datelor pn la analiza detaliat i complex. Aplicaiile care se rezolv pe baza acestei
tehnologii au la baz analiza rapid a informaiei multidimensional dispersat n locaii multiple
dar accesibile unui mare numr de utilizatori. Pentru utilizarea acestor faciliti, OLAP dispune
de eficacitatea bazelor de date multidimensionale i de posibilitatea de a construi alternative
pentru diverse probleme de decizie. OLAP presupune c analiza datelor (care pot fi de tip
numeric sau statistic) poate fi predefinit de cel care creeaz aplicaia sau chiar de utilizatorul
final.
OLAP se caracterizeaz prin: perspectiva multidimensional a datelor, capacitatea de
calcul intensiv i orientare n timp (time intelligence).* Aspectul multidimensional al datelor este
dat de posibilitatea de a integra multiplele aspecte care caracterizeaz activitatea unei
ntreprinderi i care sunt considerate din perspective multiple ca: timp, bani, produse. Fiecare
dimensiune este definit n genere prin mai multe niveluri ca de exemplu: timpul este divizat n
an, trimestre, luni, sezoane; produsul n: categorii, clas. Conceptul de dimensiune este folosit ca
neles de aspect, dimensiunile fiind independente i cu uniti de msur specifice dimensiunii
respective.
1
Grupul BDASEID Oper citat i M.Muntean, Iniiere n tehnologia OLAP. Teorie i practic, Editura ASE,
Bucureti, 2004.
*
Zaharie D, Albescu F, colectiv Oper citat
Fig.3.4. Hipercubul de date
Unitile de msur pot constitui criterii de agregare a datelor, iar nivelele unei
dimensiuni formeaz ierarhia care la rndul ei poate constitui criteriu de agregare a datelor.
Privite din punct de vedere multidimensional, datele sunt reprezentate n hipercuburi de date
(fig.3.4), prin extinderea cubului tridimensional la cel n-dimensional.
Pe acest tip de cub se pot efectua calcule prin aplicarea unor algoritmi compleci asupra
datelor structurate n acesta. Acestea implic posibilitatea de adresare multidimensional direct
a cuburilor unitare i optimizarea timpului de rspuns.
Caracteristica de orientare n timp (time intelligence) presupune flexibilitatea exploatrii
acestei dimensiuni care este necesar pentru comparaii i aprecieri de valoare n analizale
economice. Aceast dimensiune este luat de obicei din calendarele tranzaciilor economice aa
cum se afl n bazele de date ale sistemului informatic al companiei. Se pot face astfel grupri pe
dimensiuni ca: trimestre, luni, ani, sezoane. Se pot utiliza i dimensiuni speciale cum sunt:
perioada curent, perioada precedent, aceeai perioad din anul..., care trebuie neaprat luate n
considerare la proiectarea hipercubului. Bazele de date multidimensionale folosite de OLAP sunt
suprapuse depozitelor de date i stocheaz straturi de date agregate pe diferite criterii ierarhice.
De asemenea, aceste baze de date multidimensionale conin i date statistice pentru fiecare nivel
de agregare.
Un server OLAP reprezint un motor de manipulare a datelor multiutilizator de mare
capacitate ce a fost proiectat pentru a sprijini i funciona cu structuri de date multidimensionale.
O structur de date multidimensional este astfel aranjat nct fiecare articol (item) de date este
localizat i accesat pe baza interseciei membrilor dimensiunii care definesc acel articol (irem).
Proiectarea serverului i a structurii de date sunt optimizate pentru regsirea rapid (ad-hoc) a
dalelor n oricare dintre orientrile dorite, pentru calculul flexibil i rapid, precum i
transformarea rndurilor de date pe baza relaiilor de tip formul. O formul este un obiect al
bazei de date (calcul, regul sau alt expresie) destinat pentru manipularea datelor n interiorul
bazei de date multidimensionale. Serverul OLAP poate s reprezinte, fie o etap fizic a
procesrii informaiei multidimensionale pentru a furniza timp de rspuns rapid i consistent
utilizatorilor finali, fie poate s populeze structurile sale de date n timp real avnd ca surse baze
de date relaionale sau alte tipuri de baze de date. De asemenea, serverul OLAP poate s fie o
reprezentare a ambelor alternative de mai sus.
Baza de date multidimensional este format din dou structuri: structura datelor n care
se stocheaz msurile activitilor preluate din tabela de fapte a depozitului de date. Datele vor fi
prezentate utilizatorului n celulele tabelelor pivot; structura metadatelor care este format din
totalitatea dimensiunilor i membrilor acestora precum i din structurile ierarhice ale
dimensiunilor. Utilizatorul poate vizualiza aceast structur ca nume de coloane i linii care
reprezint informaiile de pe axele cuburilor.
Numerotarea nivelurilor ncepe de la rdcin (nivel 0) ctre frunze (unde va apare
nivelul maxim). Ierarhiile posed propriile lor seturi de niveluri, chiar dac unele ramuri sunt
comune. De exemplu: ierarhia Calendar este format din nivelele (0-5): Timp, An, Semestru,
Trimestru, Lun, Dat calendaristic, ierarhia Anotimp este format din nivelele (0-4): Timp,
An, Sezon, Lun, Dat calendaristic, iar ierarhia Anotimp este format din nivelele (0-3): Timp,
Sptmn, Zi, Dat calendaristic. Pe fiecare nivel se stocheaz membrii dimensiunilor
respective. Rdcina care se observ c este comun (Timp) este nivelul de agregare maxim
avnd ca unic membru implicit all. Orice nod n arbore este un membru al unei subdimensiuni.
Nodurile subordonate unui nod formeaz un set, iar orice membru al unui set are un numr de
ordine ncepnd cu 0. De asemenea, orice membru poate avea proprieti ca de exemplu unele
zile sunt srbtori legale, unii ani sunt biseci. Exemplul prezentat presupune o structur strict
arborescent ntruct fiecare membru al unei dimensiuni are submembri distinci, chiar dac
acetia au aceleai valori. De exemplu fiecare an are setul lui de luni, fiecare sptmn are setul
ei de zile. Ca mod de identificare, membrii vor fi calificai cu numele membrului de pe nivelul
precedent cruia acesta i se subordoneaz: 2007-feb, 2008-feb. Tipul acesta de dimensiuni care
au membri ce se repet se pot crea i ulterior prin combinarea a dou nivele din ierarhie sau din
ierarhii diferite pentru a crea un nivel nou, virtual.
17
Turban E., Op.cit.
Pentru a se putea naviga pe o structur arborescent, sistemele de gestiune pun la
dispoziie operatori ierarhici. De exemplu, pentru exploatarea datelor, sistemele de gestiune
ofer operatori pe hipercuburi. Fizic, datele sunt stocate ntr-un fiier cu acces direct pe baza
adresei fizice absolute sau relative a nregistrrii obinute prin exploatarea tabelelor bitmap
obinute n urma creerii structurii de date. Aceste tabele sunt puntea de legtur dintre structura
de date i structura de metadate. Iat cum se face aceast legtur: se tie c pentru fiecare
membru al fiecrei dimensiuni exist o coloan (1 bit) n tabele bitmap pentru fiecare nregistrare
exist un rnd n acelai tabel n care se stocheaz 1 n dreptul biilor asociai membrilor
dimensiunii existente n nregistrare. Datorit acestui procedeu, cmpul respectiv nu trebuie
stocat n nregistrare, iar structura datelor este redus la un minim necesar. Din tabelul de msuri
se vor putea selecta acele nregistrri care au un bit 1 n poziia corespunztoare biilor 1 din
masc. Un inconvenient al tabelelor bitmap este acela c ele sunt greu de obinut, iar apariia
unor noi membri sunt greu de inserat n poziia corespunztoare. Procesul de refacere a unui
tabel bitmap este mare consumator de timp avnd n vedere c tabelul de fapte din depozit (care
se va transforma n baza multidimensional) poate avea un numr imens de nregistrri.
Masca de interogare se obine prin exploatarea structurii ierarhice a metadatelor de unde
se pot extrage seturi de membri pentru dimensiunile desemnate prin specificatorii de axe.
Adresarea tabelului de msuri se face n mod direct pe baza unui set de adrese de nregistrri
care se suprapun cu tiparul mtii. Din tabel se preiau n aceast manier valorile care se
centralizeaz pentru celula cubului cu dimensiunile sale.
Se poate afirma c structura metadatelor este de tip ierarhic, fiecare dimensiune fiind
stocat ntr-o structur arborescent cu o singur rdcin (all) i cu o multitudine de ramuri care
pot conine frunze comune (ierarhii alternative). Orice nivel al unei ierarhii poart un nume i
conine un set de membri. De altfel i ierarhiile alternative poart un nume pentru a putea fi
distinse. Structura n care sunt stocate datele este o structur cu acces direct prin tabele bitmap
exploatate prin mti.
Un hipercub este proiectat astfel nct el s aib n vedere nivelul de detaliu necesar n
procesul de analiz. Nivelul de detaliu (granularitatea) reprezint numrul de membri ai unei
dimensiuni. Datele pot fi vizualizate printr-o selecie n hipercub pe baza unui criteriu ierarhic
care ar putea fi de exemplu structura organizaional pe care o conduce un anumit manager. Dac
de la pornire, granularitatea este prea mare, datele vor fi mult prea centralizate i nu se va putea
face dect o analiz grosier. Ajustarea nivelului de granularitate este realizat de OLAP prin
exploatarea ierarhiilor dimensiunilor prin comasri i descompuneri ale msurilor prin proceduri
care poart numele de roll-up i drill-down. Prin intermediul acestor proceduri se face o
deplasare a proieciei cubului n sus sau jos pe nivelele ierarhice ale fiecrei dimensiuni (zoom
in; zoom out), executnd de fiecare dat centralizri ale msurilor stocate la cea mai mic
granularitate dup criterii ierarhice stabilite n prealabil.
Este stabilit un nivel de granularitate iniial sub care nu se poate cobor. Din acest motiv
este important ca dimensiunile de baz s fie ct mai rafinate sau s se creeze Data Marts unde
hipercuburile sunt proiectate la nivelul de detaliu stabilit de managementul operaional. Pentru
managementul superior se va construi un depozit cu hipercuburi centralizatoare cu granularitate
mare. Prin drill-down se obin detalii, iar prin roll-up se obin date sintetice.
Un alt grup de operaii oferit de OLAP este secionarea (slicing) i defalcarea (dicing).
Prin secionare, se creeaz posibilitatea selectrii prin vizualizare doar pentru un membru al unei
dimensiuni, adic un plan din cubul tridimensional. Seciunea astfel obinut va apare ca un tabel
pilot cu valorile dimensiunilor pe laturi i cu specificarea valorii alese pentru dimensiunea
suprimat. Defalcarea (dicing) este operaia de proiectare a unei dimensiuni pe o alta. De obicei
o dimensiune din primul plan este combinat cu o alt dimensiune din adncime. Acest proces se
mai numete imbricarea dimensiunilor.
Dimensiunile unui cub pot fi private sau pot fi utilizate n comun i de alte cuburi (ele
provin din depozitele cu schema de tip constelaie). Proiectarea structurilor depozitelor de date i
a cuburilor OLAP este un proces ce se desfoar continuu pe tot parcursul existenei (vieii)
aplicaiei, dimensiunile cuburilor fiind n strns dependen cu detaliile activitii structurate.
Aplicaiile construite cu tehnologia OLAP i gsesc locul n multiplele domenii ale
activitii ntreprinderilor, de la finane, bnci, marketing pn la producie i vnzri. De
exemplu, activitatea de producie poate fi susinut de aplicaii OLAP cum sunt: planificarea
operaiilor, controlul calitii produselor, analiza rebuturilor, analiza optimizrii raportului dintre
cost-beneficii.
OLAP, utiliznd tehnici inteligente de optimizare, beneficiaz de avantajul timpului de
rspuns mic.
Datele referitoare la gestiunea mijloacelor fixe sunt stocate ntr-o baz de date
tranzacional ce st la baza construirii cuburilor de date. Datele sunt organizate n tabele care
corespund dimensiunilor, ierarhiilor i tabelelor de fapte ale cuburilor multidimensionale.
Aceast baz de date tranzacional este denumit MIFIX i conine urmtoarele tabele
(fig. 3.5):
Dbo.fapte_miscare_MF conine faptele referitoare la micarea mijloacelor fixe (intrri
i ieiri), precum i la valoarea de inventar i amortizarea acestora.
Dbo.PV_intrare conine date referitoare la intrarea mijloacelor fixe;
Dbo.PV_iesire conine date referitoare la ieirea mijloacelor fixe;
Dbo.Gestionari - conine date cu privire la identificarea gestionarilor care rspund de
mijloace fixe;
Dbo.Timp - datele coninute n acest tabel reprezint perioadele de timp de manipulare a
mijloacelor fixe; pe baza acestor date se realizeaz dimensiunea Timp cu urmtoarea ierarhie: an,
luna, trimestru, sezon.
Fig.3.5 Structura bazei de date MIFIX realizat n Microsoft SQL Server 2005
1
Han, J., Kamber, M. - Data Mining- Concepts and Technique, Second Edition, Morgan Kaufmann Publishers,
USA, San Francisco CA 2006.
Existena unor volume imense de date a pus problema reorientrii utilizrii lor de la un
proces de exploatare retrospectiv ctre unul prospectiv. Data Mining poate avea mai multe
definiii, ns toate converg n esen ctre miezul problemei i anume c acest concept
reprezint un proces de extragere de informaii noi din coleciile de date existente. Termenul de
dat are semnificaia de descriere a unui eveniment bine determinat care se produce n lumea
real i este perfect verificabil. Prin tehnologia Data Mining se prelucreaz date care refer
perioade anterioare (date istorice), care sunt examinate i sunt deja cunoscute, pe baza lor
constituindu-se un model sau ablon. Acest model sau ablon va putea fi aplicat situaiilor noi de
acelai tip cu cele deja cunoscute. Informaiile care se pot obine prin Data Mining sunt
predictive sau descriptive. De exemplu direcionarea aciunilor de marketing pot constitui o
problem tipic predictiv.1 Detectarea fraudelor produse cu carduri bancare reprezint o
problem tipic de aplicaie descriptiv.
Dezvoltarea tehnicilor de Data Mining se explic prin acumularea de volume imense de
date pe care organizaiile economice le-au derulat de-a lungul anilor. De asemenea, concurena
tot mai acerb precum i creterea exigenelor pieei au determinat firmele s ia tot mai mult n
considerare potenialul uria pe care l ofer arhivele de date. Alturi de arhivele de date
memorate pe suporturi informatice mai exist nc doi factori care au dus la necesitatea Data
Mining: existena i perfecionarea algoritmilor i a produselor-program dedicate precum i
creterea capacitii de memorare i prelucrare a calculatoarelor electronice care permit tratarea
corelativ a volumelor mari de date.
Este de remarcat c depozitele de date pot fi surse pentru Data Mining, iar rezultatele
obinute pot completa cmpurile nregistrrilor din depozitele de date, care apoi pot fi
valorificate prin proieciile multidimensionale specifice OLAP.
Potenialul oferit de Data Mining se ncorporeaz n procesele comerciale ale firmelor,
iar cutarea informaiilor i cunotinelor nu devine un scop n sine ci este util doar dac este
transformat ca aciune. Astfel firmele pot alege s reacioneze sau nu la situaiile diverse create
de realitate (diminuarea numrului de clieni, scderea vnzrilor, pierderea unor piee de
desfacere etc.). Pasul urmtor dup aceast alegere este exploatarea propriu-zis a datelor
utiliznd diveri algoritmi. De multe ori, aciunea de Data Mining poate fi un eec i nu o reuit,
fiind posibil ca msurile luate s nu fie adecvate informaiilor obinute.
Prin Data Mining, oamenii de afaceri reuesc s se focalizeze mai bine pe cei mai buni
clieni ai lor, s depisteze i s previn fraudele, s descopere caracteristicile de influen care
afecteaz cel mai mult indicatorii-cheie de performan, KPI (Key Performance Indicators) ai
afacerii, respectiv ai societii, s gseasc informaia ascuns n baza de date/depozitul de date.
Cu ajutorul tehnicilor Data Mining, orice proces sau fenomen reflectat n bazele de date,
respectiv depozitele de date, constituie tem de analiz i raportare n cadrul unei platforme
dedicate pentru cercetarea afacerilor, BI (Business Intelligence), impropriu dar sugestiv tradus
n unele lucrri romneti sub denumirea de inteligena afacerilor.
Spre deosebire de tehnicile OLAP (abordate n capitolul anterior) care abordau interogri
i raportri standard (care sunt clienii cei mai valoroi, care produse s-au vndut cel mai mult
sau care sunt zonele de costuri cele mai ridicate), tehnicile Data Mining exploreaz volumele
foarte mari de date heterogene cu scopul de a previziona, a nelege i de a dezvolta noi abordri
1
Zaharie D, Albescu F, colectiv Oper citat
asupra problematicii supuse soluionrii. Pe piaa actual extrem de competitiv, companiile
trebuie s-i administreze i s exploateze cu eficien cele mai valoroase active (assets) i
depozite de date (Data Warehouse), cu precdere informaia valoroas ascuns n aceste
depozite.
Instrumentele tradiionale de cercetare a afacerilor rapoarte, interogri i raportri
interactive permiteau sintetizarea a ceea ce s-a ntmplat n trecut, aspecte reflectate de datele
istorice ale companiei i de unele date curente. Prin tehnica OLAP se obin analize asupra unor
tendine, bazate n special pe rezumate, comparri, analize i previziuni ce au la baz valori
medii, sume i grupri de date prin agregare. Prin Data Mining se adncete explorarea
depozitelor de date prin descoperirea informaiei ascunse cu ajutorul abloanelor (patterns),
factorilor de influen, clusterelor, profilelor i prediciilor aplicate volumului mare de date. De
exemplu, prin analiza profilurilor celor mai buni clieni actuali, prin Data Mining se pot construi
modele i aplicaii integratoare destinate identificrii clienilor care au cele mai mari anse s
devin performani n viitor, cu toate c, n prezent, nu fac parte din portofoliul cu cei mai buni
clieni ai companiei. Managerii organizaiilor economice lucreaz astfel, n deciziile lor, cu
valoarea strategic a clienilor actuali prin care se previzioneaz nsi viitorul afacerii.
Toate elementele considerate anterior conduc spre ideea de ciclu n utilizarea Data
Mining n cursul cruia sunt patru etape:
definirea oportunitilor comerciale i a datelor pe care se face exploatarea;
obinerea de informai i cunotine din coleciile de date existente prin tehnici Data
Mining;
adoptarea deciziilor i aciunilor n urma informaiilor rezultate;
cuantificarea ct mai corect a rezultatelor concrete pentru a identifica i alte ci de
exploatare a datelor.
1
Han, J., Op.cit.
UTILITATOR
pentru
cunotine
MODELE
DE DATE
selecie, transformare
i eventual reducere
Data
Warehouse
curire i integrare
n mod uzual, datele rezultate din procesele de curire i integrare sunt stocate n Data
Warehouses, caz n care transformarea i unificarea lor se realizeaz nainte de procesul de
selecie. Pentru a obine o reprezentare mai mic a datelor originale poate fi realizat i
reducerea datelor (data reduction), fr a le afecta integritatea datelor.
Procesul Data Mining interacioneaz cu utilizatorul prin baza de cunotine destinat
acestuia, dintre modelele de date descoperite, cele cu importan pentru utilizator reprezentnd,
de fapt, cunotine noi care se stocheaz n baza de cunotine spre a-i fi prezentate.
Procesul Data Mining este o parte esenial a procesului de descoperire a cunotinelor
din date deoarece descoper modelele de date ascunse pentru a fi evaluate, n conformitate cu
cerinele utilizatorilor.
Din punctul de vedere al funcionalitii sale, Data Mining este procesul de descoperire a
cunotinelor care intereseaz dintr-o cantitate mare de date stocat n baze de date, Data
Warehouses sau n alte tipuri de depozite de date.
Privit din perspectiva depozitului de date - Data Warehouse, procesul Data Mining
reprezint un stadiu avansat de procesare analitic on-line (OLAP). Data Mining depete ns
procesul analitic limitat, de tip rezumativ, al sistemelor Data Warehouse prin tehnicile specifice
de analiz a datelor, mult mai avansate.
Data Mining implic o integrare de tehnici din mai multe domenii. Practic, Data Mining
reprezint un domeniu interdisciplinar, principalele discipline cu care se intersecteaz fiind cele
cuprinse generic sub denumirea de Tehnologia Bazelor de Date - Databases (DB), Tehnologia
depozitelor de date - Data Warehouse (DW), Tehnologia Digital, Tehnologiile Informaiei i
ale Comunicaiilor (IT&C) i Statistic (fig. 4.2).
Calculatoare Modelarea
datelor
Statistic
Vizualizarea
Tehnologiile datelor
Bazelor de Date Tehnologia
(DB) i Data Tehnologia Analiza
Digital i datelor
Warehouses Data Mining
(DW)
IT&C
Procesarea
imaginilor
Alte domenii
Machine Reele Regsirea
learning neurale informaiilor
or
18
Two Crows: Data Mining Glossary.
Modelarea este o tehnic general acceptat de specialitii din toate domeniile de
activitate. Se construiesc modele arhitecturale pentru a ajuta utilizatorii lor s vizualizeze
cldirile. Se construiesc modele matematice pentru a analiza traiectoria navetelor spaiale n
cosmos sau tendinele de evoluie a pieei. n era comunicaiilor digitale i a internet- ului, se
construiesc modele software care conduc la realizarea unor sisteme informatice flexibile, uor
adaptabile la schimbrile rapide de tehnologice i la cerinele utilizatorilor, mereu n cretere.
Dup cum, se construiesc modele de date pentru a descoperi cunotinele ascunse n depozitele
de date, utile n fundamentarea deciziilor manageriale strategice i de perspectiv.
Extragerea modelelor de date, aplicnd asupra datelor stocate n baze de date, data
warehouse sau n orice alt tip de depozit de date tehnici inteligente (avansate) de analiz,
denumite generic tehnici data mining, este un proces laborios denumit, n mod uzual, proces
data mining sau, pe romnete, proces de minerit, prin similitudine cu procesul clasic de
minerit care urmrete extragerea minereurilor din roci. n acest context, se spune, n mod uzual,
c modelele de date care pot fi extrase printr-un proces de minerit sunt minate, adic
sunt cutate i extrase din datele stocate n depozitele de date ale utilizatorului, aa cum sunt
cutate i extrase minereurile din roci.
Modelele de date care pot fi minerite sunt grupate pe categorii determinate de funciile
sistemului Data Mining, denumite pe scurt funcii Data Mining, care urmresc extragerea
modelelor de date din datele utilizatorului stocate n depozite de date. Pentru ndeplinirea
(realizarea) funciilor sale, sistemul Data Mining execut sarcini specifice, denumite n mod
uzual sarcini Data Mining, care au ca rezultat modele de date care pot fi minerite de
utilizator.
O sarcin Data Mining se definete ca fiind o activitate sau un set de activiti care se
execut pentru ndeplinirea sau realizarea unei funcii a sistemului Data Mining. Practic, sarcina
Data Mining reprezint partea procesului Data Mining care se desfoar pentru ndeplinirea
unei funcii Data Mining. La modul general, sarcinile Data Mining pot fi clasificate n dou mari
categorii:
- sarcini descriptive, cele care descriu caracteristicile generale ale datelor stocate
n baza de date, Data Warehouse sau n orce alt tip de deposit de date;
- sarcini predictive, cele care realizeaz deduceri de date din datele curente cu
scopul de a face previziuni, determinnd tendinele de evoluie ale acestora.
Principalele funcii Data Mining, sarcinile Data Mining care trebuie executate pentru
realizarea lor i categoriile de modele Data Mining care se pot obine ca rezultat, sunt
urmtoarele:
- descriere clas/concept este funcia sistemului Data Mining realizat prin
executarea sarcinilor Data Mining - caracterizare date i discriminare date care au
ca rezultat un model Data Mining de tip descriere, denumit n mod uzual descriere;
- mineritul modelelor frecvente este funcia sistemului Data Mining realizat prin
executarea sarcinilor Data Mining asociaie date i corelaie date care au ca rezultat
modele Data Mining frecvente;
- clasificarea i predicia, este funcia sistemului Data Mining realizat prin
executarea sarcinilor Data Mining de clasificare date i predicie care au ca rezultat
modele Data Mining de clasificare (clasificator) i predicie (predictor);
- analiza grupurilor, este funcia sistemului Data Mining realizat prin executarea
sarcinii Data Mining de grupare a datelor cu caracteristici representative
commune, care are ca rezultat un model Data Mining de grupare;
- analiza excepiilor, este funcia sistemului data mining realizat prin executarea
sarcinii Data Mining de analiz a excepiilor care are ca rezultat un model Data
Mining al excepiilor (date atipice);
- analiza evoluiei, este funcia sistemului Data Mining realizat prin executarea
sarcinii Data Mining de analiz a evoluiei datelor care are ca rezultat un model
Data Mining tendinelor de evoluie (a datelor).
De cele mai multe ori, utilizatorii nu tiu ce modele de date prezint interes pentru ei i
doresc s extrag mai multe categorii diferite de modele din datele stocate n depozitlele de date
la dispoziia lor (baze de date, Data Warehouse etc.). De aceea, este important ca un sistem Data
Mining s poat mineri categorii variate de modele de date pentru a rspunde diverselor
aplicaii i/sau ateptrilor diferiilor utilizatori. Este important ca un sistem Data Mining s
permit extragerea de modele de date pe diferite nivele de abstracie, corespunztoare nivelelor
de detaliu solicitate de utilizatori. i este important ca un sistem Data Mining s accepte
sugestiile utilizatorilor pentru a direciona cutrile ctre modelele de date care i intereseaz.
ntr-un sistem Data Mining datele stocate n baze de date, Data Warehouse sau n orice
alt tip de depozit de date sunt grupate n clase sau asociate la concepte. Spre exemplu, datele
stocate n baza de date de eviden a produciei organismului economic definit generic pot fi
grupate n dou clase care conin produse de categoria a I-a i produse de categoria a II-a, iar
datele stocate n baza de date de eviden a clienilor pot fi asociate conceptelor mariClieni i
bugetClieni. Dup cum, datele stocate n baza de date de eviden a articolelor unui magazin de
tehnic de calcul pot fi grupate n ase clase care conin calculatoare, imprimante, scannere,
camere video i produse software, i pot fi asociate conceptelor articolePentruCasa,
articoleProfesionale, articoleScumpe i articoleCuPreRedus.
Descrierea clas/concept este funcionalitatea sistemului Data Mining care se realizeaz
prin executarea urmtoarelor sarcini Data Mining:
- caracterizarea datelor, este sarcina Data Mining care const n rezumarea datelor din clasa
analizat, denumit n mod uzual clas-int;
- discriminarea datelor, este sarcina Data Mining care const n compararea datelor din clasa
int cu datele dintr-una sau din mai multe clase de comparat;
- caracterizarea i discriminarea datelor, este sarcina Data Mining care const att n
rezumarea datelor din clasa int, ct i n compararea acestora cu cu datele dintr-una sau din
mai multe clase de comparat.
Caracterizarea datelor este rezumarea, n termeni ct mai concii i mai precii cu
putin, a caracteristicilor sau trsturilor generale, eseniale, aferente datelor din clasa int.
Datele din clasa int, specificate de utilizator, se pot colecta, n mod tipic, printr-o interogare a
bazei de date (database query) n care sunt stocate. Spre exemplu, pentru caracterizarea
produselor fabricate de un organism economic ale cror vnzri au crescut cu mai mult 20% n
ultimul an, utilizatorul colecteaz datele de analizat prin executarea unei interogri (query) SQL
asupra bazei de date de eviden a vnzrilor.
Caracterizarea efectiv a datelor stocate ntr-o baz de date, Data Warehouse sau n orice
alt tip de depozit de date se realizeaz prin aplicarea urmtoarelor metode de analiz a datelor:
- rezumarea simpl a datelor, bazat pe msurtori statistice i pe eantionare;
- cubul de date, bazat pe operaiile OLAP roll- up i drill- down, care poate fi utilizat pentru
rezumarea datelor, proces controlat de utilizator, de-a lungul dimensiunilor specificate de
acesta;
- tehnica de inducie orientat pe atribut, care poate fi utilizat pentru a realiza caracterizarea
i generalizarea datelor fr interaciunea direct a utilizatorului cu sistemul Data Mining.
Caracterizarea datelor, ca sarcin Data Mining descriptiv, are ca rezultat descoperirea
unui model Data Mining de tip descriere (denumit n mod uzual descriere), care poate fi
prezentat utilizatorului sub diferite forme denumite n mod uzual forme de caracterizare, cele
mai uzuale fiind diagramele, graficele, tabelele, cuburile de date, relaiile generalizate sau
regulile de caracterizare.
Discriminarea datelor este comparaia caracteristicilor generale, eseniale, aferente
datelor din clasa int cu caracteristicile generale, eseniale, aferente datelor dintr-una sau mai
multe clase de comparat. Datele din clasele int i de comparat, specificate de utilizator, se pot
colecta, n mod tipic, prin interogarea bazei de date (database query) n care sunt stocate. De
exemplu, pentru compararea trsturilor generale ale studenilor cu medie de promovare n anul
universitar anterior, cu trsturile generale ale studenilor cu medie sub media de promovare n
aceeai perioad de timp, utilizatorul poate colecta datele de analizat prin executarea unei
interogri (query) SQL asupra bazei de date de eviden a studenilor.
Metodele de analiz a datelor, utilizate pentru discriminarea datelor stocate ntr-o baz de
date, Data Warehouse sau n orice alt tip de depozit de date, sunt similare celor utilizate pentru
caracterizarea datelor, i anume:
- compararea simpl a datelor, bazat pe rezumarea acestora, obinut prin msurtori
statistice i de eantionare efectuate asupra datelor din clasele int i de comparat;
- cubul de date, bazat pe operaiile OLAP roll- up i drill- down, care poate fi utilizat pentru
rezumarea i compararea datelor prin controlul utilizatorului, de-a lungul dimensiunilor
specificate de acesta;
- tehnica de inducie orientat pe atribut, care poate fi utilizat pentru a realiza discriminarea
i generalizarea datelor fr interaciunea direct a utilizatorului cu sistemul Data Mining.
Discriminarea datelor, ca sarcin Data Mining descriptiv, are ca rezultat descoperirea unui
model Data Mining de tip descriere (denumit n mod uzual descriere), care poate fi prezentat
utilizatorului sub aceleai forme ca i modelul data mining rezultat prin caracterizarea datelor,
cu deosebirea c formele de prezentare obinute n acest caz sunt denumite, n mod uzual, forme
de discriminare (grafice de discriminare, reguli de discriminare etc.) i descrierile
discriminrilor pot conine msuri de comparaie care ajut la deosebirea clasei int de clasele
de comparat.
Sistemul Data Mining este sistemul informatic format din ansamblul componentelor
hardware i software care interacioneaz i comunic ntre ele pentru descoperirea (extragerea)
modelelor de date care reprezint cunotinele ce intereseaz dintr-o cantitate mare de date
stocat n baze de date, Data Warehouses sau n alte tipuri de depozite de date. Altfel spus, este
sistemul informatic n cadrul cruia se desfoar procesul Data Mining.
4.5.1. Structura sistemului Data Mining
Structura sistemului Data Mining (model de principiu) reprezint, prin definiie, modul
de organizare intern a acestuia pentru ndeplinirea funciei sale: aplicarea tehnicilor Data
Mining asupra datelor stocate n baze de date, Data Warehouses sau n alte tipuri de depozite de
date, cu scopul de a descoperi modele de date care intereseaz n fundamentarea deciziilor
manageriale, proces denumit generic proces Data Mining (fig. 4.3).
Setul de date care trebuie minerit, tehnicile Data Mining i modelele de date
descoperite n procesul Data Mining reprezint componentele structurale ale sistemului Data
Mining.
Interfaa utilizator
Evaluarea modelului
Baz de
Data mining engine cunotine
1
Zaharie D, Albescu F, colectiv Op. Cit.
semnificaie n maniera c distana de la elementul A la elementul B este egal cu distana de la
B la A i nu exist un punct C intermediar lui A i B prin a crei parcurgere s se scurteze
drumul de la A la B. Ca moduri de calcul pentru distana cmpurilor numerice se enumer:
diferena ntre valoare absolut |A-B|;
ptratul diferenei (A-B)2
diferena ntre valoare absolut normalizat |A-B| (diferena maxim). Ultima variant
produce rezultate cu valori cuprinse ntre 0 i 1.
Msurarea distanei ntre nregistrri. Cnd apare necesitatea de a considera simultan
mai multe cmpuri ale nregistrrii, se calculeaz distana pentru fiecare cmp n parte, iar
rezultatul se combin ntr-o valoare mic care reprezint distana nregistrrii respective.
Se vor enumera cteva procedee de combinare a distanei cmpurilor: nsumarea,
nsumarea normalizat (suma distanelor/suma maxim), distana euclidian (rdcina ptrat din
suma ptratelor distanelor). Distana euclidian evideniaz cel mai bine nregistrrile pentru
care toate cmpurile sunt vecine.
Combinarea rezultatelor presupune aflarea celor mai apropiai vecini, iar soluia
problemei se obine prin combinarea rspunsurilor obinute de la acetia. Fiecare vecin poate
avea diverse variante de rspuns, dar se vor lua n calcul doar cei care sunt mai apropiai.
Rezultatul ce obine majoritatea va fi atribuit cazului curent. Cerina minim este ca numrul
votanilor s fie impar, pentru a evita situaiile de nedeterminare.
Metodele care se bazeaz pe vot dau rezultate satisfctoare n situaiile n care
rspunsurile ateptate sunt de tip enumerativ. O alt soluie posibil este interpolarea valorilor
nregistrrilor vecine care ns introduce o aplatizare a rezultatelor care se nscriu ntre cele dou
limite folosite n calcul. De asemenea, se poate constata c rezultate bune se obin prin metode de
regresie statistic aplicate asupra valorilor date de vecinii cei mai apropiai. Se obine ecuaia
unei drepte sau a unei curbe care permite calcularea mai precis a valorilor aferente cazului
curent.
Se poate concluziona c raionamentul bazat pe cazuri este o tehnic de Data Mining
suficient de bun i care se poate aplica unui mare numr de probleme, caz n care conduce la
soluii acceptabile. Toate acestea sunt valabile dac volumul de date pe care se bazeaz este bine
ales i concludent. Ca avantaje pentru aceast metod se pot enumera:
aplicarea unui mare numr de tipuri de date, pe structuri de date complexe, iar cmpurile
tip text sunt mai bine tratate dect n alte tehnici;
luarea n considerare a orict de multor cmpuri;
rezultatele obinute sunt explicite;
elementele de noutate care apar n procesul de nvare sunt uor de nglobat i de folosit
n raionamente.
Ca orice metod prezint i unele dezavantaje dintre care se pot meniona: volumul mare
de memorie i resurs timp de prelucrare relativ mare, i de asemenea, timpul de prelucrarea
mare pentru aplicarea funciilor de distan asupra tuturor nregistrrilor i cmpurilor necesare
pentru obinerea rezultatelor.