Sunteți pe pagina 1din 83

SISTEME INFORMATICE PENTRU ASISTAREA DECIZIEI

Prof.univ.dr. Zenovic GHERASIM


Prof.univ.dr. Doina FUSARU
Conf.univ.dr. Maria ANDRONIE

Codul cursului:
Denumirea cursului: Sisteme informatice pentru asistarea deciziei
Tip curs: obligatoriu
Durata cursului / Nr. credite: un semestru /
Perioada de accesare a cursului: prelegeri 25 febr. 2008- iunie 2008
laboratoare
consultaii
Manuale recomandate:
1. Gherasim, Z., Fusaru, D., Andronie, M. Sisteme informatice pentru asistarea deciziei
economice, Editura Fundaiei Romnia de Mine, Bucureti, 2008.
2. Fusaru, D., Cocianu, C.L., Gherasim, Z., Andronie, M. Sisteme expert i Sisteme
informatice pentru asistarea deciziei, Teste gril, Editura Fundaiei Romnia de Mine,
Bucureti, 2006.
3. Zaharie, D., Albescu, F., Bojan, F., Ivancenco, V., Vasilescu, C. Sisteme informatice
pentru asistarea deciziei, Editura Dual Tech, Bucureti, 2001.
4. Filip, Fl.Gh. Decizie asistat de calculator. Decizii, decideni. Metode i instrumente de
baz, Editura Tehnic i Editura Expert, Bucureti, 2002.
5. Filip, Fl.Gh. Sisteme suport pentru decizii, Editura Tehnic, Bucureti, 2004.
6. Oancea, M. Sisteme informatice pentru asistarea deciziei bancare, Editura ASE,
Bucureti, 2005.

Obiectivele cursului:
Obiectivele cursului de Sisteme informatice pentru asistarea deciziei (SIAD) sunt:
revederea i fixarea noiunilor de baz din teoria sistemelor economice integrate i teoria deciziei
n general, i a sistemelor informatice integrate, n special; definirea conceptelor fundamentale
specifice SIAD; tratarea celor trei tipuri de SIAD-uri: bazate pe modele, bazate pe analiza i
sinteza datelor (tehnica OLAP) i Data Mining; ctigarea unor deprinderi n folosirea
componentelor de asistare a deciziei din produsul informatic Microsoft Excel, din instrumentul
informatic QM i din Microsoft SQL Server 2005 (Analyses Services, Data Mining).

Modul de stabilire a notei finale: nota este cea care rezult din evaluarea prin teste
gril, pe platforma BlackBoard.
Consultaii pentru studeni: n fiecare mari de la ora 10 - 12 pe perioada cursurilor.
Adresa e-mail responsabil pentru contactul cu studenii:zgherasim.mfc@spiruharet.ro
Titularul / titularii cursului / serie:Prof.univ dr. Zenovic GHERASIM
zgherasim.mfc@spiruharet.ro sau
zenovic.gherasim@yahoo.com
Str. Splaiul Independenei nr. 313, 3169785/110
Consultaii: n fiecare marti orele 10.00-12.00
pe perioada cursurilor.
Asistent seminarii-laboratoare: Asist.univ. mat. Mriua TUDOR,
t_mariuta@yahoo.com
Asist.univ. Alexandru DUMITRU
alexd@ines.ro

Tematica disciplinei:

1. ASISTAREA DECIZIEI ECONOMICE


1.1 Definirea, rolul i locul sistemelor informatice pentru asistarea deciziei
1.2. Decizia: loc, rol, clasificare
1.3. Decidenii
1.4. Consideraii asupra asistrii deciziilor
1.5. Clasificarea sistemelor informatice pentru asistarea deciziei
1.6. Sisteme suport pentru asistarea deciziei
1.6.1. Subsistemul de gestiune a datelor
1.6.3. Subsistemul de gestiune a cunotinelor
1.6.4. Interfaa cu utilizatorul

2. SIAD-URI BAZATE PE MODELE


2.1. Consideraii referitoare la modele i metode
2.2 Algoritmi euristici
2.3. Tabele de decizie i arbori de decizie
2.4. Optimizare cu algoritmi programare matematic
2.5 Simularea
2.5.1.Conceperea i proiectarea modelului
2.5.2. Simularea cu instrumente in Excel
2.6.Teoria jocurilor
2.7. Modelele predictive
2.8. Programarea euristic
2.9. Metoda utilitii globale maxime
2.10. Sistemul de gestiune a modelelor

3. SIAD-URI BAZATE PE ANALIZA I SINTEZA DATELOR


3.1. Problematica general
3.2. Depozite de date (Data Warehouse)
3.2.1. Definirea conceptului de depozit de date. Caracteristicile depozitelor de date
3.2.2. Rafturile de date
3.2.3. Memorii-tampon de date operaionale
3.2.4. Depozite de date de tip ntreprindere
3.2.5 Diferenierea depozitului de date de baza de date
3.2.6. Ciclul de via al depozitelor de date
3.3. Modelarea conceptual a depozitului de date
3.4. Modul de utilizare a depozitului de date
3.5. Mediul de depozitare al datelor
3.6. Abordarea multidimensional a datelor stocate n depozite
3.6.1. Definirea i caracterizarea OLAP (On-Line Analytical Processing)
3.6.2. Modelarea dimensional cuburi OLAP
3.6.3. Baze de date multidimensionale
3.6.4. Operaii OLAP asupra hipercubului
3.7. Aplicaie privind analiza datelor cu Microsoft OLAP
3.7.1. Analiza problemei de rezolvat
3.7.2. Definirea schemei bazei de date multidimensionale

4. DATA MINING TEHNOLOGII DEDICATE EXTRAGERII CUNOTINELOR DIN


DATE
4.1. Problematica general
4.2. Definirea conceptului Data Mining
4.3. Categorii de date care pot fi minerite
4.4. Categorii de modele de date care pot fi minerite
4.5. Sistemul Data Mining
4.5.1. Structura sistemului Data Mining
4.5.2. Arhitectura sistemului Data Mining
4.5.3. Clasificarea sistemului Data Mining
4.5.4. Explorarea datelor coninut i etape
4.5.5 Raionamentul bazat pe cazuri

Cuvinte-cheie: SIAD, DSS, OLAP, modelare, depozite de date, Data Warehouse, Data Mining.

1. ASISTAREA DECIZIEI ECONOMICE


1.1 Definirea, rolul i locul sistemelor informatice pentru asistarea deciziei

Sistemul este o colecie de pri (elemente) organizate i interconectate pentru


ndeplinirea unui anumit scop. Sistemul, n plan conceptual, este expresia abstractizrii unor
fapte, fenomene, procese, obiecte din universul real pe baza unei structuri logice predefinite.
Concepia sistemic ofer avantajul unei abordri integrale i integrate a fenomenelor i
proceselor specifice domeniilor abordate, evideniind latura calitativ corespunztoare
elementelor sistemului. Subsistemul este o parte component a unui sistem, n funcie de un
punct de vedere i de scopul urmrit. Dup domeniul de aplicare, sistemele sunt politice,
economice, sociale, tehnice etc.
Sistemele economice sunt sisteme deschise (open systems), puternic ancorate n mediul
socio-economic (piaa este o parte a acestui mediu) n care acestea funcioneaz. Sistemele
economice, ca sisteme deschise, sunt sisteme cibernetice adic prezint legtura de reacie
(feedback) ce le permite o funcionare normal. Sistemele economice prezint un comportament
dinamic care asigur adaptarea la fluctuaiile mediului socio-economic. Orice sistem economic
poate fi mprit n mai multe subsisteme n funcie de criterii specifice.
Societatea comercial (organizaia economic) reprezint un sistem economic care poate
fi divizat a) funcional sau pe domenii de gestiune (producie/servicii, comercial, cercetare-
dezvoltare, financiar-contabil, resurse umane) sau b) structural (organizatoric, decizional,
informaional, tehnologic, relaional pe resurse umane). Potrivit concepiei holonice asupra
sistemelor, dou sau mai multe sisteme autonome pot fi integrate (cu criterii i obiective precise)
i se poate obine astfel un sistem holonic. n limba greac, holos semnific un ntreg dedus din
pri. Sistemul holonic (holonul) economic permite optimizarea att pe sisteme componente ct
i pe ansamblul sistemului integrator devenit sistem de referin, pe cele dou planuri: real i
conceptual.
Orice sistem economic modern performant este un sistem integrat funcional i structural.
Sistemele economice integrate pot fi abordate din perspectiva diferitelor coli de gndire
n management (tehnico-raional, comportamental, cognitiv). Acestor sisteme economice
integrate le sunt asociate sisteme informaionale integrate, respectiv sisteme informatice
integrate. Sistemele informatice integrate economice au n compunere, n funcie de nivelurile de
management ale organizaiei economice (fig.1.1), sisteme informatice dedicate (integrate pe
orizontal), astfel: 1) nivelul de management strategic: sisteme informatice de sprijin al
executivului, ESS (Executive Support Systems) sau EIS (Executive Information System); 2)
nivelul de management mediu: sisteme informatice pentru management, MIS (Management
Information Systems) sau sisteme informatice pentru rapoarte de management, MRS
(Management Reporting Systems) i sisteme informatice pentru asistarea deciziei, DSS (Decision
Support Systems); 3) nivelul lucrtorilor cu date, informaii i cunotine: sisteme de
automatozare a lucrrilor de birou sau birotic, OAS (Office Automation Systems) i sisteme de
lucru cu cunotine, KWS (Knowledge Work Systems); 4) nivelul de management operaional:
sisteme informatice pentru procesarea tranzaciilor, TPS (Transaction Processing Systems). Cele
mai cunoscute implementri ale unor componente de integrare pe vertical ale sistemelor
informatice integrate economice sunt denumite: planificarea resurselor ntreprinderii, ERP
(Enterprise Resource Planning), fabricaie asistat de calculator, CAM (Computer-Aided
Manufacturing), planificarea resurselor de fabricaie, MRP (Manufacturing Resource Planning),
sistem informatic de resurse umane, HRIS (Human Resources Information System), sistem
informatic contabil, AIS (Accounting Information System), sistem informatic financiar, FIS
(Financiar Information System), sistem informatic pentru marketing, MKIS (Marketing
Information System), sistem informatic de resurse informatice, IRIS (Information Resources
Information System), sistem informatic pentru managementul relaiilor cu clienii, CRM
(Customer Relationship Management), sistem de management al lanului de distribuie, SCM
(Supply Chain Management) etc.
Pentru studentul de la specializarea Contabilitate i informatic de gestiune, elemente ale
OAS au reprezentat obiectul cursului de birotic, elemente ale TPS - al cursului de sisteme de
gestiune a bazelor de date, n timp ce elemente ale KWS au fost lmurite la cursul de sisteme
expert. DSS reprezint obiectul de studiu al disciplinei Sisteme informatice pentru asistarea
deciziei (SIAD) economice. MIS reprezint o disciplin de informatic pentru specializarea
Management. Este discutabil separarea SIAD (DSS) de MIS, indiferent de modul de abordare,
avnd n vedere c luarea deciziei reprezint scopul fundamental al oricrui sistem de
management. ESS sunt n curs de clarificare, conceptualizare i realizare.
Steven Alter consider c sistemele informatice pentru asistarea deciziei (SIAD) sunt
destinate managerilor i prezint ca obiectiv fundamental eficientizarea deciziilor, spre deosebire
de TPS-uri care se ocup de eficientizarea i consistena datelor. Moore i Chang arat c un
SIAD este extensibil i capabil s suporte analize ad-hoc, precum i modelarea deciziei
manageriale, folosit pe un interval de timp nedeterminat i neregulat i cu orientare principal pe
procese i fenomene viitoare1.

General Manager

Management ESS, Executive Support Systems sau


strategic EIS, Executive Information Systems

Management MIS, Management Information Systems


de nivel i
mediu DSS, Decision Support Systems

Lucrtori cu date, OAS, Office Automation Systems


informaii i ORGANIZAIA (birotic)
cunotine ECONOMIC KWS, Knowledge Work Systems

Management
operaional TPS, Transaction
(de exploatare) Processing Systems

Fig. 1.1. Sistemele informaionale/informatice n funcie de nivelurile de management ale


organizaiei economice

n lucrarea Decision Support Systems: A Knowledge-Based Approach (1996), Holsapple


i Whiston evideniau caracteristicile unui SIAD astfel2:
1. are n compunere o baz de cunotine referitoare la domeniul abordat de procesul
decisional;
2. permite achiziia cunotinelor descriptive sau de natura procedurilor i regulilor;
3. asigur posibiliti de prezentare a unor cunotine ad-hoc sau de realizare a unor rapoarte
periodice;
4. faciliteaz selectarea unor mulimi de cunotine pentru informare sau pentru asistarea
procesului decizional;

1
Oancea, M. Sisteme informatice pentru asistarea deciziei financiare, Editura ASE, Bucureti, 2005.
2
Lungu, I., Sabu, Gh., Velicanu, M., Muntean, M., Ionescu, S., Posdarie., E., Sandu, D, - Sisteme informatice.
Analiz, proiectare i implementare, Editura Economic, Bucureti, 2003.
5. realizeaz interactivitatea sistem-decident.
Sistemele informatice pentru asistarea deciziei, SIAD implic folosirea elementelor
aplicative din discipline diverse cum sunt statistica, economia, cercetrile operaionale,
tehnologiile informaiei i ale comunicaiilor IT&C, inteligena artificial, psihologia cognitiv
etc.
Sistemul informaional economic reprezint un cumul de resurse umane i capital investit
ntr-o organizaie economic pentru colectarea i prelucrarea datelor necesare obinerii
informaiilor care vor fi utilizate la toate nivelurile de decizie ale conducerii i controlului
activitii acelei organizaii.
Informaie devine n felul acesta centrul n jurul cruia basculeaz ntreaga activitate a unei
organizaii economice.
Informaia este vzut de DeMarco (1982) ca fiind abordabil din trei perspective specifice
sistemelor informaionale i anume:
1) Datele care sunt vzute sub form de atribute i care reflect structura static a
sistemului informaional.
2) Funciile scot n eviden ceea ce face sistemul. Ele pot fi vzute i ca procese,
deoarece elementele sistemului care stocheaz datele sunt supuse transformrilor
funcionale prin intermediul proceselor.
3) Comportamentul reflect de fapt strile prin care trece sistemul la apariia diverselor
evenimente care au impact asupra lui i care i confer un statut dinamic.
Reenginering-ul organizaiei economice semnific regndirea din temelii i reproiectarea
radical a proceselor de afaceri cu scopul de a obine o mbuntire semnificativ a indicatorilor
critici de performan ai acestei organizaii economice (costuri, calitate, vitez, service etc). n
reingineria proceselor de afaceri, BPR (Business Process Reengineering), IT&C joac un rol
determinant.

1.2. Decizia: loc, rol, clasificare

Evoluia tehnologiilor informaiei i ale comunicaiilor, IT&C influeneaz evoluia


procesului managerial prin oferta de mijloace i instrumente din ce n ce mai performante pentru
rezolvarea sarcinilor managerilor, sintetizate n ESS, MIS, DSS, KWS, OAS. Sistemele
informatice ofer un nivel rapid de obinere, analiz i interpretare a unei mari cantiti de date i
informaie, ajutnd la o adaptare rapid a decidenilor ntr-un mediu economic n permanen
dinamic. Tot ele asigur un nalt nivel de responsabilitate i putere de decizie spre nivelele
inferioare. n acelai timp, procesul managerial are impact asupra modului n care se face
proiectarea i realizarea sistemelor informatice care deservesc acest proces.
n principal, managerii utilizeaz sistemele informatice pentru planificarea, organizarea,
coordonarea, controlul i previziunea activitilor lor, dar i pentru comunicarea dintre persoane,
stabilirea reelelor n interiorul organizaiei ct i la rezolvarea problemelor curente. La baza
structurrii sistemelor informatice se afl sistemele informaionale. Sistemul informaional al
unei organizaii conine dou subsisteme componente: subsistemul de conducere i subsistemul
condus. n fluxul informaional descendent se gsete decizia, ca rezultat al procesului decizional
desfurat n cadrul subsistemului de conducere.
Diveri autori definesc decizia n moduri aproximativ asemntoare ca de exemplu:
alegerea unei ci sau direcii de aciune (Simon, 1960), alegerea unei strategii de aciune
(Fishburn, 1964), o alocare a resurselor (Spradlin, 1997), hotrrea luat ca urmare a examinrii
unei probleme, situaii etc., soluia adoptat din mai multe posibile (DEX, 1998) etc. Decizia se
poate defini i ca fiind rezultatul unor activiti contiente de alegere a unei ci de aciune,
alegere care presupune alocarea unor resurse. Decizia reprezint rezultatul prelucrrii unor
informaii i cunotine i aparine unei persoane sau grup de persoane (decidentul) care dispun
de autoritatea necesar i care au responsabilitatea pentru utilizarea eficace a resurselor n
anumite situaii date3. Decizia este o activitate a omului ce urmrete, n mod contient, anumite
obiective. Pentru rezolvarea unei probleme decizionale se aleg obiectivele relevante pentru
problema respectiv. Aceste obiective relevante pot fi multiple i, deseori, contradictorii. Ele
sunt funcie de mai muli factori, dintre care se amintesc sistemul de valori (ansamblul
subiectelor de analiz adoptate sau impuse decidentului) i orizontul decizional de timp (specific
problemei de decizie).
O prim clasificare a deciziilor, legat nemijlocit de decident, este realizat n funcie de
domeniul de activitate al omului:
- decizii personale, cnd deciziile se refer la viaa personal a unui om, iar resursele sunt timpul,
energia, banii, renumele, cunotinele profesionale;
- decizii manageriale, cnd deciziile se refer la organizaia economic, iar resursele alocate sunt
umane, materiale, financiare i informaionale (dintre cele informaionale, cele mai importante
fiind cunotinele tezaurizate n organizaie).
Dup gradul de complexitate, deciziile pot fi simple sau complexe. Decizia simpl este
acea decizie care privete alegerea unei singure direcii de aciune sau acea decizie ce se
dovedete suficient (la o prim analiz) pentru ndeplinirea obiectivelor. Decizia complex
reprezint un ansamblu de decizii simple care se adopt pentru ndeplinirea unui obiectiv sau
grup de obiective.
Dup numrul de participani, deciziile sunt:
cu decident individual;
decizii cu mai muli participani (multiparticipant) sau cu echipe decizionale.
Clasificarea deciziilor n funcie de nivelul decizional asociat cu orizontul decizional de
timp este:
a) decizii strategice care se refer la obiectivele, resursele i politicile organizaiei, pe
termen mediu i lung (ani de zile); sunt specifice nivelului de managemement strategic (fig.1.1);
la elaborarea i adoptarea acestor decizii particip un numr redus de decideni ce lucreaz, de
regul, ntr-o manier creativ i nerepetitiv; se folosesc date i informaii puternic agregate
provenite, n principal, din surse externe organizaiei economice respective;
b) decizii tactice sau de conducere (control) managerial ce determin ct de eficiente
au fost folosite resursele; sunt specifice nivelului de management mediu i au ca orizont de timp
lunile anului; interaciunile personale sunt puternic prezente, adic controlul managerial
presupune o continu interaciune ntre persoanele care ndeplinesc obiectivele organizaiei

3
Acad. Florin Gheorghe FILIP, Decizie asistat de calculator, decizii, decideni, metode i instrumente de baz,
Editura Tehnic i Editura Expert, Bucureti, 2002.
(stabilite de nivelul de management strategic), n mod curent i pe termen scurt; se folosesc date
i informaii mediu agregate provenite att din surse interne ct i din surse externe organizaiei;
c) decizii de conducere (control) operaional care determin modul n care sunt duse la
ndeplinire sarcinile primite de la nivelele de management superioare; orizontul de timp este de
sptmni i zile; se folosesc date i informaii provenite, n principal, din surse interne
organizaiei;
n unele lucrri de specialitate, la acest criteriu de clasificare a deciziilor sunt cuprinse
i:
d) decizii n ceea ce privete cunotinele, acestea fiind indisolubil legate de ideile care
se refer la noi produse i servicii, metode de rspndire a acestor cunotine i de difuzare a
datelor i informaiior n cadrul organizaiei. Sunt satisfcute astfel toate nivelurile de
management ale organizaiei economice prezentate n fig.1.1.
Clasificarea deciziilor n funcie de gradul de structurare este:
a) decizii structurate sau programabile adic decizii uzuale pentru care exist proceduri
realizate. Acest tip de decizii intervin n momentul n care apare un proces cunoscut. Dac
decizia este supus procesului de informatizare, ea este descris printr-un program a crui
execuie este fix, deci nu pot exista reveniri, iar calea raionamentelor nu este schimbat nici
prin program i nici de utilizatori.
b) decizii nestructurate (neprogramabile) sunt cele care se bazeaz pe flerul i modul de
judecat al decidentului care analizeaz problema. Acest tip de decizie se refer la tipuri de
probleme atipice pentru organizaie, pentru care nu exist proceduri prestabilite. O decizie este
considerat nestructurat atunci cnd elementele sale sunt de tip calitativ, obiectivele i
finalitatea nu sunt precise i nu exist un algoritm cunoscut pentru rezolvarea lor;
c) decizii semistructurate sunt cunoscute ca decizii care pot fi rezolvate parial cu
proceduri cunoscute, ntruct acestea au elemente predominant cantitative, scopurile nu sunt
precise, iar procedura de rezolvare nu asigur ansamblul elementelor problemei. Gradul de
structurabilitate a deciziei depinde de experiena acumulat de decident precum i de nivelul i
importana ei. Conform terminologiei lui H. Simon, n cazul proceselor semistructurate apare
nevoia unui asistent, de fapt de asistare a deciziei. Acest termen de asistare a deciziei
trebuie definit la modul general ca fiind o serie de operaii cum sunt sortarea clasificarea,
selectarea, evaluarea ce au ca scop final organizarea informaiei, reducerea incertitudinii i
obinerea de variante de rezolvare. Dac se consider evoluia n timp a acestui termen, atunci se
poate constata c acesta s-a dezvoltat prin folosirea metodelor cercetrii operaionale, dar sunt
greu de aplicat. De aceea a aprut un alt nivel de abordare a asistrii deciziei i anume asistarea
interactiv. Pe baza acesteia au aprut sistemele informatice de asistare a deciziei sau Decision
Support Systems (DSS), situate generic pe nivelul de management mediu.
O alt clasificare a deciziilor poate fi fcut n funcie de cunotinele de care dispune
decidentul referitoare la evoluia problemei pe care o are de rezolvat. n funcie de acest criteriu,
deciziile sunt:
1. decizii n condiii de certitudine ce presupun o cunoatere a evoluiei fenomenelor
viitoare, ceea ce se petrece mai rar n realitatea economic. O astfel de decizie se bazeaz pe
criteriul costului minim de funcionare;
2. decizii n condiii de incertitudine ce presupun cunoaterea evoluiei anterioare a
fenomenului economic. Acest mod de cunoatere va permite o previziune i o alegere ct de ct
corect a variantei de decizie. Acest tip de decizie face parte din clasa general a deciziilor de
orientare n care alegerea unei variante se face n funcie de previziunile viitoare ale decidentului
precum i de criterii obiective care presupun raionament logic;
3. decizii n condiii de risc ce presupun c decidentul cunoate aproximativ evoluia
viitoare a fenomenului, posibilul trend al variabilelor necontrolabile i chiar ce rezultate are
fiecare strategie analizat pe baza criteriului speranei matematice. n acest caz procesul de
decizie va avea o multitudine de consecine, iar fiecreia i se va asocia o probabilitate. Se obine
o distribuie a probabilitilor din care se va alege varianta cu sperana matematic cea mai bun.
Dac exist variante de decizie care au aceeai speran matematic, atunci se va calcula
intervalul de variaie i abaterea standard. Ca variant optim se va alege aceea care are cea mai
mic abatere standard.
Dup modul de abordare, deciziile se clasific astfel4:
1. decizii rezultate ale activitilor de management desfurate la ntmplare;
2. decizii rezultate ale activitilor de management bazate pe rutin; se folosesc abloane
ale activitilor din trecut;
3. decizii rezultate ale activitilor de management bazate pe instruire (invare); modelele
de decizii din trecut sunt modificate n funcie de dobndirea de cunotine, experiene i tehnici
noi;
4. decizii rezultate ale activitilor de management paradigmatice; modelele de decizii de
succes din trecut sunt preluate ca exemple pentru situaia actual;
5. decizii bazate pe analiza deciziilor (analiza i modelarea sistemic i previzional);
analiza deciziilor, ca abordare prescriptiv, asist decidentul n nelegerea problemelor
decizionale i n pregtirea acestuia pentru a face fa situaiilor neateptate i nefavorabile;
analiza deciziilor nu poate influena hazardul i nu poate provoca manifestarea norocului.
Deciziile rezultate ale activitilor de management bazate pe instruire, precum i cele
paradigmatice fac obiectul tehnicilor de inteligen artificial (sisteme expert, reele neuronale
artificiale, sisteme bazate pe cazuri etc.).
Dup gradul de urgen, deciziile sunt:
decizii luate strict n timp real; sunt adoptate pentru managementul situaiilor de criz (de
exemplu, pentru conducerea unor instalaii industriale, pentru gestionarea efectelor unor
calamiti naturale inundaii, cutremure, incendii etc.); acest tip de decizii pot fi asistate de
tehnici de inteligen artificial;
decizii luate aproape n timp real; sunt adoptate pentru gestionarea unor situaii
decizionale importante pentru organizaie cum sunt, de exemplu, oportunitile de afaceri,
lansarea unui produs nou, prefalimentul firmei etc;
decizii care nu sunt urgente; timpul la dispoziia decidentului este suficient pentru
asiguraarea desfurrii unei analize detaliate i obinerea unei rezolvri optime a problemei
decizionale.
Dup criteriul de secvenialitate a deciziilor5, se deosebesc:
a) decizii independente, n situaia n care decidentul ia o decizie complet
implementabil;
b) decizii dependent-secveniale sau n cascad (o decizie dup alta);

4
G. Boldur-Lescu - Logica decizional i conducerea sistemelor, Editura Academiei Romne, Bucureti, 1992.
5
Acad. Florin Gheorghe FILIP, Sisteme suport pentru decizii, Editura Expert, 2004.
c) decizii interdependente, adic decizii independente (n prima faz) sunt agregate (n
faza a doua).

1.3. Decidenii

Modelul managementului clasic care descrie ce trebuie s fac un manager a fost


indiscutabil un model de top, aproape 70 de ani, ncepnd cu anii 1920. Henri Fayol i ali
specialiti au prezentat, pentru prima dat, cele cinci funciuni clasice ale managerilor:
planificarea, organizarea, coordonarea, luarea hotrrilor i controlul. La o analiz mai atent,
s-a observat c descrierea funciunilor manageriale n aceti termeni este neconcludent deoarece
nu corespunde cu ceea ce managerii execut n activitatea de zi cu zi. Prin modele
comportamentale6, s-a definit comportarea managerilor care pare s fie mai puin sistematizat,
mai informal, mai puin organizat i chiar mai neimportant dect s-ar crede la prima vedere.
S-a constatat c activitatea managerial, n realitate, are cinci caracteristici care difer
de modelul managementului clasic. Astfel:
a) activitatea managerial este foarte intens, adic managerii trebuie s desfoare foarte
multe activiti zilnice, ntr-un ritm destul de ridicat (unele studii indic 600 de activiti pe zi);
b) activitatea managerial este fragmentat, ceea ce nseamn c majoritatea activitilor
dureaz mai puin de 9 minute, numai 10% dintre activiti depesc o or;
c) este preferat comunicarea oral n detrimentul comunicrii scrise deoarece ofer mai mult
flexibilitate, necesit mai puin efort i aduce un rspuns mai rapid;
d) managerii prefer informaiile ad-hoc i speculaiile (informaiile scrise uneori sunt vechi
sau aceasta este percepia managerilor despre documentele scrise);
e) managerii lucreaz pe baza unei reele de contacte care funcioneaz ca un sistem
informaional informal.
Pe baza observaiilor din lumea real, Kotter susine c managerii de fapt sunt implicai
n trei activiti critice:
- petrec mult timp pentru stabilirea agendei personale i a obiectivelor att pe termen
scurt ct i lung;
- consum foarte mult timp pentru construirea unei reele interpersonale format din
angajaii de la ct mai multe nivele, de la personalul care deservete depozitele de mrfuri i
funcionarii organizaiei pn la manageri i managerii generali;
- folosesc ntreaga lor pricepere i desfoar activiti de baz pentru a realiza ceea ce
au stabilit n agenda personal i pentru a-i atinge propriile scopuri.
Analiznd comportamentul de zi cu zi al managerilor, Mintzberg a constatat c acest
comportament ar putea fi clasificat n funcie de zece roluri manageriale ce pot fi mprite n
trei categorii: interpersonale, informaionale i decizionale.
Prin rol managerial se neleg activitile i rezultatele acestora pe are managerii ar trebui
s le realizeze ntr-o organizaie.
n cazul rolurilor interpersonale, managerii funcioneaz ca reprezentani ai organizaiei
economice n relaiile cu lumea exterioar i ndeplinesc sarcini simbolice, cum ar fi, de
exemplu, primirea delegaiilor strine. Managerii acioneaz ca lideri prin motivarea, consilierea
6
Laudon, K. ; Laudon, J. Essentials of Management Information Systems, Organization and Technology in the
Networked Enterprise, Fourth Edition, JWS, New York, 2001.
i sprijinul angajailor. De asemenea, aceti manageri realizeaz legtura dintre diferitele nivele
ale organizaiei economice, iar n interiorul fiecrui nivel asigur legtura dintre membrii echipei
de management. Managerii acord timp i favoruri pe care se ateapt s le primeasc napoi.
Pentru eficientizarea acestor roluri interpersonale, managerii utilizeaz cele mai avansate tehnici
i tehnologii de comunicare i de comunicaii.
Ct privete rolurile informaionale, managerii acioneaz n calitate de servere de
informaii pentru organizaia economic, primind informaiile actualizate i redistribuindu-le
celor care au nevoie de ele. Aceste roluri informaionale sunt de monitor i acumulator
(centralizarea i stocarea tuturor datelor i informaiilor eseniale despre organizaie), de
diseminator al datelor i informaiilor ce trebuie supuse acestui proces (informaii n form brut
sau prelucrat), de generator sau creator de informaie nou (avnd la baz informaia acumulat
i interaciunile ce se produc n decursul desfurrii activitilor), precum i de purttor de
cuvnt sau reprezentant autorizat al organizaiei. Un rol determinant n susinerea acestor roluri
informaionale l au sistemele informatice dedicate i sistemul informatic integrat al organizaiei
economice n ansamblul su.
n situaia rolurilor decizionale, managerii iau decizii. Ei funcioneaz ca antreprenori
prin iniierea diferitelor tipuri de activiti, ei descoper nefuncionalitile care apar n
organizaie, aloc resursele personalului care are nevoie de ele, negociaz conflictele i mediaz
nenelegerile dintre diferite grupuri. n esen, rolurile decizionale sunt de ntreprinztor sau
planificator (depistarea de oportuniti de afaceri, focalizarea tuturor activitilor pentru
ndeplinirea obiectivelor stabilite de managementul strategic, supervizarea proiectelor de
importan deosebit pentru organizaia economic etc.), coordonator sau rezolvitor de probleme
perturbatorii care afecteaz cursul normal al evoluiei strategice a organizaiei economice,
organizator sau distribuitor al resurselor organizaiei, precum i de negociator.
Aa cum s-a artat mai sus, rolurile managerilor se clasific n interpersonale,
informaionale i de decizie (sau decizionale). Tuturor acestor roluri manageriale li se asociaz
sisteme informatice dedicate care ntregesc sistemul informatic integrat al organizaiei
economice.
Luarea deciziilor rmne una dintre activitile de baz ale managerilor o persoan sau
un grup de persoane ce prezint autoritatea necesar i care au responsabilitatea folosirii
resurselor la dispoziie n situaii date.
La nivelul de exploatare se iau decizii puternic structurate, n timp ce la nivelul
managementului strategic se iau decizii nestructurate. Multe dintre problemele ntlnite de
lucrtorii cu date, informaii i cunotine necesit, de asemenea, decizii nestructurate. Se
apreciaz c la fiecare nivel de management organizaional se iau att decizii structurate ct i
decizii nestructurate.

1.4. Consideraii asupra asistrii deciziilor


Situaia decizional reprezint momentul n care este necesar o decizie. Situaiile
decizionale pot fi forate i neforate7.
Situaiile decizionale forate (obiective sau provocate) sunt situaiile decizionale
determinate de obinerea unor informaii ce conduc la observarea apariiei unor manifestri

7
Acad. Florin Gheorghe FILIP, op.cit.ant..
externe sistemului, cum sunt abaterile intolerabile ale strii subsistemului condus fa de o stare
prestabilit, strile noi ale sistemului, precum i modificrile sistemului economic observate n
mediul socioeconomic extern. De exemplu, contul de profit i pierdere al unei firme semnaleaz
celorlali actori de pe pia starea de profitabilitate sau de faliment pentru acea firm, iar bilanul
firmei indic modificri intervenite n anul curent fa de anul precedent. Achiziionarea de ctre
o societate comercial de producie unui utilaj performant n locul muncii manuale asigur
creterea productivitii muncii, determinnd astfel o stare nou a sistemului economic. O
abatere intolerabil la o banc comercial este depirea limitei de creditare impus i
supravegheat de Banca Central. Situaiile decizionale forate determin decizii corective i
reactive n raport cu abaterile intolerabile, strile noi sau modificrile intervenite n sistemul
economic. Un stimulent pentru o situaie decizional forat i o decizie reactiv poate fi
observarea existenei unei oportuniti de afaceri pentru firm.
Situaiile decizionale neforate (subiective sau neprovocate) reprezint situaiile
decizionale, determinate de voina decidentului, care se refer la luarea din timp a unor msuri
preventive pentru situaii ca producerea unor accidente de munc sau boli profesionale la
angajaii firmei, producerea unui incendiu, pierderea avansului competiional al societii etc.
Situaiile decizionale neforate determin decizii proactive ca rezolvri ale problemelor de
explorare i exploatare a oportunitilor.
Procesul decizional este ansamblul de activiti executat de o persoan sau grup de
persoane (decident) care sunt puse n faa unui fenomen care poate genera mai multe variante de
aciune i avnd drept obiectiv alegerea uneia dintre ele care s rspund cel mai bine sistemului
de valori ale persoanei, grupului de persoane sau organizaiei n ansamblul su.
Decidentul uman, ca element fundamental al procesului decizional, prezint mai multe
limite care determin necesitatea i oportunitatea asistrii informatizate a deciziilor. Astfel, se
deosebesc limite cognitive (se refer la capacitatea limitat a omului de a memora i prelucra
date, informaii i cunotine), limite de timp (multe decizii trebuiesc adoptate de decidentul
uman sub presiunea timpului la dispoziie extrem de mic; ca urmare, aceste decizii pot fi eronate
n raport cu problema decizional) i limite economice (sunt determinate de costurile obinerii,
stocrii, prelucrrii, transmiterii i diseminrii datelor, informaiilor i cunotinelor ctre toi
membrii echipelor manageriale).
Procesul de adoptare a deciziilor este constituit din urmtoarele etape sau faze ale
procesului decizional (cu caracter generic):
1. Informarea general (sau intelligence, dup H.Simon), etap n care sunt analizate
evenimentele aprute n organizaia economic i depistate cauzele lor de apariie. Aceast
etap conine subetapele de stabilire a obiectivelor, de identificare a problemei, de
descompunerea a ei, de stabilire a responsabilitilor i are ca rezultat descrierea formal a
problemei decizionale, a categoriei din care aceasta face parte i a tuturor responsabilitilor
care decurg de aici.
2. Design-ul (proiectarea) sau modul de concepere al procesului de asistare a deciziei
presupune alegerea sau construcia unui model pentru asistarea deciziei precum i subetapele
de testare i validare. Una din subetapele design-ului este modelarea ce implic modul de
concepere a problemei precum i abstractizarea ei cantitativ i/sau calitativ. Experiena
decidentului i pune amprenta pe modul de alegere a modelului dintr-o multitudine
existent, dezvolt proceduri mentale care ajut la ncadrarea problemei de rezolvat ntr-o
anume clas de modele existente.
3. Alegerea (sau choice) este etapa de baz pentru adoptarea deciziei deoarece n cadrul ei se
concretizeaz rezultatele obinute n celelalte etape. Decidentul alege o singur aciune din
multitudinea existent n funcie de criteriul de selecie propus i de modelul decizional pe
care l-a ales (din clasa de modele la dispoziie). Decidentul alege ntre posibilitile n funcie
de soluionarea definitiv a modelului, de selectarea celei mai adecvate alternative i tot el
selecteaz planul pentru implementare. Pentru alegere sunt evideniate mai multe metode de
cutare ca de exemplu: tehnici analitice, metode de cutare exhaustive prin care rezultatele
obinute de fiecare alternativ sunt comparate, metode euristice care sunt aplicabile n
metodele descriptive.
Metodele analitice sunt utilizate datorit utilizrii formulelor matematice pentru a gsi
soluia optim. Utilizarea lor este restricionat de natura problemelor, iar acestea trebuie s fie
structurate. Se pot aplica astfel de metode pentru probleme de gestiune a stocurilor sau de
alocare a resurselor. Algoritmii stau la baza acestor metode i conduc la obinerea unor soluii
viabile pentru modelul ales.
Metodele de cutare exhaustiv sunt utilizate n genere la luarea n considerare a tuturor
cilor de aciune pentru a ajunge la scopul propus. Aceste metode au la baz un proces neghidat,
proces n urma cruia se alege soluia optim. Cutarea de obicei este incomplet ntruct
posibilitile de cutare sunt limitate de timp, spaiu de memorie i el se va opri cnd se va gsi o
soluie apropiat de cea optim (numit suboptim).
Metodele de cutare euristice se bazeaz pe o riguroas analiz a problemei sau printr-o
cutare prin ncercri succesive a spaiului soluiilor. Raionamentul fcut prin parcurgerea
spaiului de cutare a soluiri permite trecerea prin toate stadiile intermediare ctre o stare final
care poate fi un rezultat satisfctor sau o nereuit (eec). Se precizeaz c metoda de cutare
care este implementat de un sistem de asistare a deciziilor este o metod euristic.
Ca ultim etap n adoptarea deciziei este evaluarea rezultatelor soluiei.
4. Implementarea (sau review) este etapa n care se face declanarea aciunii alese (propuse)
de decident.
De obicei, aceast etap este o mare consumatoare de timp, resurse i n cursul ei pot apare
diverse probleme de rezolvat, ca de exemplu gradul de suport al nivelurilor superioare
decizionale.
Analiza deciziilor asigur un cadru sistematic de abordare, structurare, descompunere i
rezolvare a problemelor decizionale, ajutndu-l i stimulndu-l pe decident s gndeasc i s
preia critic alternativele propuse de echipa managerial sau de ctre un sistem informatic de
asistare a deciziei. Analiza deciziilor este sprijinit de metode, tehnici i instrumente informatice
specifice sau preluate din alte discipline (cercetri operaionale, statistic, probabiliti, simulare
etc.).
Pentru procesul decizional structurat i pentru cel semistructurat se pot folosi modelele
cantitative bazate pe metode i modele ale cercetrii operaionale. Aceast abordare presupune
automatizarea total sau parial a procesului de adoptare a deciziei i const n urmtorii pai:
a) descrierea i definirea problemei;
b) gsirea categoriei din care face parte problema;
c) elaborarea unui model matematic care s se plieze cel mai bine pe descrierea problemei;
d) alegerea soluiei.
Modelele cercetrii operaionale se obin prin metodele acestei cercetri. Metodele
cercetrii operaionale, utilizate la fundamentarea procesului decizional, sunt programarea
matematic (liniar, neliniar, ptratic), teoria stocurilor, teoria jocurilor, teoria grafurilor, teria
echipamentelor etc. Se obin astfel soluii optimale pentru problema decizional de rezolvat.
Procesul decizional care poate fi modelat presupune c situaia real se poate configura
pe un model. S-au implementat o serie de metodologii automate care permit obinerea soluiilor
pentru un model cunoscut.
Calculatorul electronic poate primi modelul pentru decizii structurate i tot el poate fi
decidentul. Spre exemplu, el poate decide cnd s se fac reaprovizionarea stocului cu materii
prime i materiale al societii comerciale i, n acest caz, libertatea de a alege n afara soluiei
optime, dispare.
n cazul n care exist decizii mai puin structurate se va utiliza un gen de modelare local
sau personalizat care presupune utilizarea mai multor modele sau chiar construirea altora
proprii. Modelarea personalizat este un proces interactiv i a dat i numele primelor sisteme:
sisteme interactive de asistare a deciziei. Acestea reprezint, n esen, sisteme informatice de
asistare a deciziei orientate pe modele.
Sistemele de asistare a deciziei orientate pe date prelucreaz date ce se gsesc n
depozitul de date al organizaiei. Aceste sisteme funcioneaz pe baza analizei i agregrii datelor
i au ca funcii accesul imediat la date, dispun de un mecanism pentru analiza imediat a datelor,
creeaz statistici. Acest tip de sisteme este rezultatul crerii unor tehnologii speciale cum sunt:
depozitarea unor volume enorme de date istorice ale organizaiei (Data Warehousing);
exploatarea acestor depozite prin procesare analitic on-line (OLAP, OnLine Analytical
Processing).
Adoptarea deciziilor constituie un proces care pe lng suportul tehnic are nevoie de un
suport cognitiv care este asigurat de partea uman component integrant a sistemului
decizional. Suportul cognitiv nglobeaz cunotinele i experiena decidentului precum i
capacitatea acestuia de raionament. Suportul cognitiv este sprijinit i marcat n ultimele decenii
de apariia sistemelor informatice de lucru cu cunotine, KWS (Knowledge Work System) care
se ocup de probleme de stocare, clasificare, meninere i calitate a cunotinelor.
Dac n sistemele informatice de asistare a deciziei se includ i bazele de cunotine, se
definesc astfel sisteme informatice de asistare a deciziei orientate pe cunotine sau aa numitele
sisteme informatice de asistare inteligent a deciziei.
Dup clasificarea lui Schneider (1994), exist patru categorii de probleme decizionale:
a) decizia de tip alegere (se pornete de la o mulime de alternative din care se alege o
singur alternativ);
b) decizia simpl (se pornete cu problema bine formulat i cu o mulime de activiti
de rezolvare a problemei i se finalizeaz cu soluionarea problemei prin realizarea unui plan de
aciune);
c) decizia complex (problema de rezolvat se descompune n mai multe probleme simple
sau subprobleme care se soluioneaz cu decizii simple);
d) decizia de tip proces (este o decizie de tip secvenial).
Procesul decizional este puternic influenat de caracteristicile mediului socio-economic
n care-i desfoar activitatea organizaia economic, cum sunt:
1. existena competiiei pe pia, din ce n ce mai acerb i mai evoluat; produsele i
serviciile oferite pieii sunt apreciate n conformitate cu un ansamblu de criterii (pre, calitate,
nivel tehnologic ncorporat, termen de livrare, durata de via sau existen pe pia);
2. ritmul schimbrilor tehnologice (se reamintete aici, deja celebra lege a lui Moll,
conform creia, n domeniul tehnologiilor informaiei i ale comunicaiilor, IT&C, fiecare
generaie tehnologic asociat, de regul, cu microprocesorul structurii de calcul, se modific la
fiecare 18 luni) i de alte tipuri (politice, legislative, sociale) care determin creterea numrului
de alternative ce constituie input-uri ale procesului decizional;
3. modificarea modului de organizare i de funcionare a organizaiei economice (ca, de
exemplu, apariia i dezvoltarea organizaiei virtuale) ce determin mrirea ponderii decidenilor
de tip multiparticipant asociai n echipe virtuale; prin reingineria proceselor de afaceri, BPR
(Business Process Reengineering) sunt gestionate toate aceste modificri organizaionale;
4. creterea continu i diversificarea surselor externe de date, informaii i cunotine;
5. creterea continu a preteniilor acionarilor fa de performanele organizaiei
economice, dar i a aspiraiilor personale ale angajailor acesteia i ale candidailor la angajare
provenii din mediul socioeconomic.

1.5. Clasificarea sistemelor informatice pentru asistarea deciziei

Semantic, un sistem informatic de asistare a deciziei este o arhitectur abordat unitar,


care presupune un dialog permanent cu utilizatorul, dar decizia final este adoptat de utilizator
i nu de sistem. Toate posibilele definiii date SIAD-ului au ca punct de pornire obiectivele i
modul lor de ndeplinire sau pornesc de la compararea specificitii acestora cu alte sisteme
informatice. De regul, se face comparaia ntre sistemele informatice de asistare a deciziei
(SIAD-uri) sau sistemele suport pentru decizii manageriale, DSS (Decision Support Systems) i
celelelte sisteme informatice din imediata lor vecintate (fig.1.1), cum sunt: sistemele
informatice pentru management (MIS), sistemele informatice pentru sprijinul conducerii
executive (ESS) sau sistemele de lucru cu cunotine (KWS). MIS, de obicei, pun la dispoziia
utilizatorului rapoarte de sintez sau probleme de excepie n funcie de criterii predefinite,
referindu-se cu prioritate la un anumit domeniu (contabilitate, marketing etc.). Diferena dintre
MIS i SIAD (DSS) const n aceea c MIS pleac de la date i relaiile dintre acestea pe cnd
SIAD-ul pornete de la decident i de la decizie. ESS (EIS) sunt sisteme destinate asistrii
deciziilor pe cel mai nalt nivel al managementului organizaional, ajut la identificarea i
rezolvarea problemelor prin sesizarea de noi oportuniti. De asemenea, acest tip de sisteme au
posibilitatea de a oferi decidentului tendine, analize pentru activitatea concurenial.
Caracteristicile principale ale SIAD (DSS) sunt: rezolvarea acelor probleme care nu se
pot rezolva cu sisteme destinate cuantificrii cantitative; rol de asistare a decidenilor
(managerilor) la nivel individual sau de grup n toate etapele procesului decizional; soluiile sunt
obinute prin manipulri de date, cutri de informaii, modele, calcule; timpul de rspuns pentru
obinerea unei soluii acceptabile este limitat.
Clasificarea SIAD-urilor se face dup mai multe criterii, cel mai des utilizat fiind
componenta tehnologic dominant (n unele lucrri, gradul de analiz a datelor pe care se
bazeaz soluia):
1. SIAD-uri orientate pe modele. Modelul cantitativ este sprijinit de o interfa care
faciliteaz utilizarea. Aceste SIAD-uri realizeaz analize de tipul what...if . Activitile
implicate sunt de tipul modelare-simulare, previziune, optimizare.
2. SIAD-uri orientate pe date care se refer la un volum apreciabil de date (date istorice)
stocate n sistemul informatic al organizaiei i ofer posibilitatea de a extrage informaii utile
din multitudinea de date de care dispune. Aceste tipuri de SIAD-uri au la baz depozitele de
date (Data Warehouse), iar prelucrarea este asigurat de tehnologiile informaionale OLAP
(procesarea analitic online) i Data Mining (explorarea i cutarea datelor).
3. SIAD-uri bazate pe cunotine care utilizeaz tehnologiile inteligenei artificiale i de
aceea se mai numesc i SIIAD (sisteme informatice inteligente de asistare a deciziei).
4. SIAD-uri orientate pe comunicaii la care componenta tehnologic dominant este
reprezentat de comunicaiile bazate pe calculatoare i reele de calculatoare;
5. SIAD-uri orientate pe documente (sau sisteme de management al documentelor, DMS,
Document Management Systems) care asigur stocarea i regsirea documentelor (inclusiv a
paginilor Web) i informaiilor prin tehnici (motoare) speciale de cutare (Search).
Primele trei categorii de SIAD-uri fac obiectul abordrii detaliate n capitolele urmtoare
ale lucrrii de fa.
O a doua clasificare, oferit de Holsapple i Whinston, grupeaz sistemele SIAD n cinci
1
tipuri:
1. SIAD bazate pe analiza textelor; toate informaiile de care are nevoie decidentul le
gsete sub form de text care trebuie analizat; documentele sunt create, revizuite i
vizualizate automat; de asemenea, documentele sunt grupate, fuzionate i expediate sub
diferite formate i cu diferite tehnologii (de exemplu, hypertext i ageni inteligeni); sunt
identificate locaiile corespunztoare coleciilor mari de date;
2. SIAD baze de date au drept component principal baza de date a organizaiei; sistemul
de gestiune al bazelor de date (SGBD) asigur structurile de date, modurile de acces la date,
specificarea volumului corespunztor coleciilor de date, asistarea interogrilor asupra bazelor
de date.
3. SIAD procesoare de tabele au ca principal component procesoarele de tabele care ajut
utilizatorul s descrie modele pentru analiz. Cel mai utilizat procesor de tabele este Excel
care include modele statistice, financiare, de previziune, de simulare. Modelul folosit se
genereaz prin selectarea obiectelor (conceptelor) i a relaiilor (ecuaiilor) dintre obiecte.
4. SIAD bazate pe funcii; funcia care de fapt este o procedur sau un algoritm scris ntr-un
limbaj de programare i destinat a fi utilizat pentru rezolvarea unui anumit tip de probleme;
5. SIAD bazate pe reguli; regulile sunt prevzute n KWS, specifice inteligenei artificiale.
Dac se consider drept criteriu de clasificare frecvena folosirii SIAD-urilor, acestea se
mpart n:

1
Zaharie D, Albescu F, colectiv Sisteme informatice pentru asistarea deciziei, Editura Dual Tech, Bucureti,
2001.
a) SIAD-uri organizaionale, adic acele SIAD-uri integrate n sistemul informatic total
(integrat) al organizaiei economice care prezint obiective precise pentru asistarea deciziilor ce
posed caracter de repetabilitate; sunt puse la punct i utilizate pe perioade mari de timp;
b) SIAD-uri ad-hoc, adic acele SIAD-uri care rezolv probleme unicat de asistare a
deciziei; prezint costuri ridicate de dezvoltare.
n ultimii ani au aprut SIAD de grup (Groupware) ca tip de suport al deciziilor pentru
un grup de decideni ale cror decizii au o pondere nsemnat n luarea deciziilor ntr-o
organizaie. Scopul utilizrii unor astfel SIAD-uri este creterea calitii procesului decizional
datorit lucrului n echip precum i creterea gradului de creativitate al grupului.
La realizarea SIAD-urilor (i nu numai), este avut n vedere un ansamblu de
caracteristici. Dintre aceste caracteristici, cele mai importante sunt:
- s fie flexibile i s furnizeze mai multe opiuni pentru gestionarea datelor i
evaluarea lor intermediar i final;
- s fie capabile s suporte o mare varietate de stiluri, calificri i clasificri;
- s se bazeze pe mai multe modele analitice i intuitive pentru evaluarea datelor i s
dispun de capacitatea de a urmri mai multe alternative i consecine;
- s reflecte nelegerea grupurilor i proceselor organizaionale de luare a deciziilor;
- s fie sensibile la birocraia i cerinele politicilor organizaionale;
- s reflecte i s contientizeze limitele sistemelor informatice.
Aa cum s-a artat deja, SIAD-urile sunt ncorporate n cadrul sistemelor informatice
integrate (la nivelul organizaiei economice), asimilate dup unele lucrri, cu sistemele de
planificare a resurselor ntreprinderii, ERP (Enterprise Resource Planning).

1.6. Sisteme suport pentru asistarea deciziei

Ca i alte tipuri de sisteme informatice, SIAD-urile au ca baz un suport soft care le ofer
un mediu de ntreinere, dezvoltare i funcionalitate, ele funcionnd ntr-un mediu creat de
sisteme suport de asistare a deciziei (SSAD).
Funciile unui SIAD sunt: gestiunea datelor, gestiunea modelelor, gestiunea cunotinelor
i gestiunea comunicrii ntre utilizator i sistem i ntre date i modele, cunotine.
Un sistem suport pentru SIAD (SSAD) prezint n arhitectura sa urmtoarele subsisteme:
subsistemul de gestiune a datelor; subsistemul de gestiune a modelelor; subsistemul de gestiune
a cunotinelor; subsistemul de gestiune a dialogului (sau interfaa cu utilizatorul).

1.6.1. Subsistemul de gestiune a datelor

Subsistemul de gestiune a datelor are urmtoarele componente:


a) baza de date ce poate fi proprie SIAD sau se poate crea prin extragere de date din alte
baze de date sau dintr-un depozit de date. Ea poate fi utilizat de unul sau mai muli decideni
pentru diverse aplicaii. Datele pot proveni din mai multe surse interne organizaiei sau chiar din
afara ei, ele putnd fi incluse n baza de date proprie sau pot fi accesate direct doar n momentul
n care se utilizeaz sistemul.
b) sistemul de gestiune a bazelor de date, SGBD, ce este de obicei ncorporat n SIAD i
de cele mai multe ori el este de tip relaional.
c) dicionarul de date (Data Dictionary) ce conine un catalog al datelor bazei de date
mpreun cu definiia lor i care este utilizat n prima faz a procesului decizional - faza de
identificare a problemelor.
d) facilitile de integrare a datelor ce se refer la existena limbajelor declarative de
interogare.
Factorii de difereniere a datelor, pe diferitele niveluri de management organizaional,
sunt structurile de date, existena posibilitii de agregare a datelor, dimensiunea datelor
(unidimensionalitatea sau multidimensionalitatea), orizontul de timp, metadatele.
Metadatele sunt date despre date. Este realizat, n acest scop, un dicionar al metadatelor
ce poate conine inclusiv metadate partajate. Dac se prevede un server comun de metadate,
atunci orice aplicaie se poate folosi de aceste metadate.

1.6.2. Subsistemul de gestiune a modelelor

Subsistemul de gestiune a modelelor prezint urmtoarele componente:


a) modelele sunt reprezentate de modelele financiare, statistice, de previziune i stau la
baza analizei obinerii soluiilor pentru sistemul decizional;
b) sistemul de gestiune al modelelor (similar SGBD), destinat pentru crearea de noi
modele cu ajutorul limbajelor de programare, subrutine, sau de actualizare a modelelor deja
existente;
c) dicionarul (catalogul) de modele;
d) procesul de execuie i integrare a modelelor, ce este utilizat pentru a interpreta
instruciuni create de utilizator pentru un anumit model utilizator i pentru transmiterea acestora
ctre sistemul de gestiune a modelelor.

1.6.3. Subsistemul de gestiune a cunotinelor

Subsistemul de gestiune a cunotinelor nglobeaz sisteme expert ce ofer pentru SIAD


soluii pentru aspectele calitative nestructurate. Sistemele expert utilizate n acest context se vor
axa pe analiza problemei i selecia modelelor care pot oferi soluii pentru problema respectiv i
realizarea modelelor.
1.6.4. Interfaa cu utilizatorul

Subsistemul de dialog cu utilizatorul sau interfaa este o component care asigur


interactivitatea SIAD. SSAD este gestionat de un produs soft denumit sistemul de gestiune al
interfeei cu utilizatorul (SGIU), format din programe speciale cum sunt: interfa grafic
(Graphic User Interface, GUI), prezentarea datelor sub diverse forme (grafice, figuri, tabele),
dialog cu utilizatorul n diverse moduri i altele. Datorit rolului pe care l are n SIAD
utilizatorul este considerat o parte component a acestuia. Pentru SIAD, utilizatorul devine
manager sau decident.

2. SIAD-URI BAZATE PE MODELE


2.1. Consideraii referitoare la modele i metode

Un sistem informatic de asistare a deciziei (SIAD) folosete un set de modele ca


instrumente de analiz. Modelarea este considerat esenial pentru sistemele informatice de
asistare a deciziei i implic partea de concepere a problemei i partea de abstractizare n
expresii cantitative sau calitative. Funcionarea SIAD pe baz de modele se axeaz pe utilizarea
modelelor pentru rezolvarea unor probleme cu care sunt confruntai managerii, dac aceste
probleme pot fi parial modelate. Principala caracteristic a acestor sisteme este modelarea
euristic utilizat ca metod de rezolvare a acelor probleme care nu se pot rezolva prin metode
analitice.
Modelul ofer un mod simplificat sau abstractizat de abordare a realitii. Simplificarea
rezid din faptul c problemele din lumea real sunt mult prea complicate, iar unele aspecte ale
acestei realiti nu sunt ntotdeauna relevante. Gradul de abstractizare al unui model este dat de
mai multe criterii, dup care se va face i clasificarea lor:
a) modele iconice cu un grad mic de abstractizare, cu reflectarea fidel a realitii la o alt
scar;
b) modele analitice care au acelai comportament cu sistemul real, dar sunt diferite ntruct
ele sunt reprezentri simbolice. Astfel de modele pot fi diagramele, graficele bidimensionale;
c) modele cantitative (matematice) ce au un nalt grad de abstractizare i care sunt cele mai
des folosite n SIAD.1
Ca structur, modelul are trei componente principale:
1. variabilele de decizie care descriu opiuni alternative i ele sunt date de decident;
2. parametrii ce influeneaz rezultatul, dar nu pot fi controlai de decident, ei devenind de
fapt restricii ale problemei, limitnd soluiile acesteia;
3. variabilele rezultat care sunt variabile dependente de adoptarea unor aciuni i de
parametrii modelului.
De obicei, modelele pot fi de optimizare cu ajutorul unui algoritm, cu ajutorul unei formule,
obinndu-se modele de simulare, euristice i chiar predictive, adic acele care pot da trend-ul
referitor la un scenariu utilizat. De remarcat este c fiecare metod de rezolvare se poate aplica
unui model static sau dinamic construit n ipoteza de certitudine, incertitudine sau risc.
Conceptul de model a fost preluat din tehnic, matematic i de la analitii de sistem.

1
Zaharie D, Albescu F, colectiv Oper citat
Modelul se poate defini ca o reprezentare abstract i simplificat a unui proces
economic. Metoda modelrii este astfel un instrument al cunoaterii tiinifice i are drept obiect
construirea unor reprezentri care s permit o cunoatere pertinent a diverselor domenii. n
esen metoda modelrii const n substituirea procesului real studiat cu un model care este mai
accesibil studiului.
Rezultatele obinute prin modelare se pot extrapola ctre procesul modelat, cu condiia ca
modelul s reprezinte proprietile, structura i particularitile acestuia. De aceea trebuie inut
cont de faptul c indiferent de modelul economico-matematic ales, el va reprezenta fidel un
anume fenomen, numai n msura n care acesta are la baz teoria economic, teorie care descrie
categoriile, conceptele i legile obiective ale realitii economice. Modelele se pot grupa pe
categorii n funcie de anumite criterii.
1. Dup sfera de cuprindere a problematicii economice sunt:
- modele macroeconomice care sunt definite ca modele de ansamblu ale economiei;
- modele mezoeconomice care au ca domeniu de reflectare nivelel regional, teritorial;
- modele microeconomice care au un domeniu mai restrns i se refer la nivelul firmelor.
2. Dup domeniul de provenien i concepie :
- modele cibernetico-economice, care se bazeaz pe relaii I/O cu evidenierea fenomenelor
de reglare;
- modele econometrice n care elementele numerice sunt determinate statistic i identific
tendine sau periodiciti;
- modele ale cercetrii operaionale care permit obinerea soluiei optime sau apropiate de
optim pentru un anume fenomen supus studiului;
- modele din teoria deciziei;
- modele de simulare prin care se poate stabili modul de funcionare al unui sistem micro sau
macroeconomic prin combinaii aleatoare de valori pentru variabilele independente
- modele specifice de marketing.
3. Dup caraterul variabilelor modelele sunt:
- modele deterministe cu mrimi cunoscute;
- modele stochastice sau probabiliste n care intervin mrimi a cror valoare este permanent
nsoit de o probabilitate.
4. Dup factorul timp modelele sunt statice i dinamice.
5. Dup orizontul de timp considerat sunt modele discrete sau secveniale i modele
continue.
6. Dup structura proceselor modelate sunt:
- modele cu profil tehnologic;
- modele informaional-decizionale;
- modele ale relaiilor umane;
- modele informatice.
n cadrul celor ase grupe, modelele mai pot fi caracterizate ca fiind:
- descriptive pentru c realizeaz o cunoatere direct a procesului studiat;
- normative deoarece permit realizarea unui comportament viitor cerut de factorii de
decizie.
Metodele folosie pentru rezolvare constau dintr-o succesiune de operaii logice i
aritmetice care sunt denumite algoritmi.
Se poate afirma c algoritmii pot fi exaci (riguroi), aproximativi i euristici.
Pentru ca un algorim s rspund cerinelor opentru care a fost construit, el va trebui s
satisfac urmtoarele cerine:
- universalitatea, adic s asigure prelucrarea unui numr mare de date de intrare;
- finitudinea, adic timpul de obinere a rezultatelor s fie de ordinul ore, iar necesarul de
memorie s fie minim;
- determinismul.
Adaptrile modelrii matematice la fenomene economice au la baz i concepia asupra
mrimilor care intervin n procesul de fundamentare corect a deciziilor. De menionat este
faptul c aceste mrimi care intervin implic observri, anchete, raportri care permit o msurare
a lor cu diferite grade de precizie. Conform cu gradul de precizie mrimile care caracterizeaz
procesele economice se pot clasifica n:
- mrimi deterministe care sunt bine definite i au o valoare unic;
- mrimi stochastice sau aleatoare ce dein o multitudine de valori crora li se asociaz o
probabilitate;
- mrimi fuzzy care nu au valoare unic, ci dispun de o mulime de valori crora li se asociaz
un grad de apartenen la o anume proprietate.
Conform cu clasificarea mrimilor ce caracterizeaz procesele economice se ajunge la o
similar clasificare a metodelor de prelucrare pentru adoptarea deciziilor.
Astfel se poate afirma c sunt metode deterministe, metode stochastice i metode fuzzy.
Se poate face o clasificare care are la baz criteriul exactitii i astfel metodele pot fi: exacte,
aproximative i euristice.
Metodele exacte permit ca pentru o problem de decizie economic s se obin o soluie
S care ndeplinete fr nici un dubiu restriciile impuse i/sau condiiile de optim, condiii cerute
de criteriile de eficien. Dac se face notaia S1 pentru vectorul soluiilor adevrate i notaia S
vectorul soluiei efectiv adoptate, atunci: S-S1=0.
Metode aproximative permit obinerea unei soluii S diferit de soluia adevrat S1
printr-un vector dominat de un alt vector dinainte stabilit astfel c vom avea:
S-S1= (1)
Metode euristice sunt utilizate n cazul unor probleme complexe pentru c ntr-un timp
relativ scurt, comparativ cu alte metode, se obine o soluie acceptabil din punct de vedere
practic, S care nu prezint garanii asupra rigurozitii rezolvrii.
Este dat vectorul erorii admisibile , dar metodele euristice nu pot totdeauna s duc la o
soluie S care s ndeplineasc proprietatea (1). Sunt ns cazuri cnd metodele euristice reuesc
s asigure respectarea relaiei (1), cu o anumit probabilitate. Acest tip de metode sunt
considerate a fi o succesiune de ncercri sau tatonri a cror alegere este de fiecare dat legat
de natura problemei care se rezolv i de analistul de sistem.

Etapele procesului de modelare.


Modelele pentru a fi utile practicianului trebuie s fie simple, suple, accesibile i
adaptabile.
Modelarea are ca etape;
1. cunoaterea detaliat a realitii sistemului de modelat;
2. construirea modelului economico-matematic;
3. experimentarea acestui model;
4. implementarea modelului i actualizarea soluiei.
Construirea modelului presupune alegerea instrumentelor de modelare, fie ele clasice
sau nu. Pentru elaborarea unor modele noi, analistul poate decide n a alege o combinaie de
modele clasice sau modele noi. Experimentarea modelului se face in vivo prin aplicarea
modelului descriptiv sau normativ n practica firmei i prin determinarea eficienei sale. Modul
acesta de experimentare se realizeaz numai pe eantioane reduse, pentru c implic riscuri.

2.2 Algoritmi euristici


Modelarea procedural.
Metodele de optimizare bazate pe metode normative se pot uneori ndeprta de realitatea
economic i de aceea aceste inconveniente pot fi ndeprtate prin utilizarea modelrii
procedurale. Pentru a cunoate legile care definesc un fenomen economic se parcurg urmtorii
pai:
observarea sub aspect descriptiv-calitativ a fenomenului luat n studiu;
formularea unor legi de tip descriptiv-calitativ;
observarea fenomenelor sub aspect cantitativ i formulareaunor legi cantitative;
adoptarea unor decizii;
stabilirea efectelor deciziilor adoptate i cum se va perfeciona modul de luare a deciziilor
n viitor.
Etapele se pot sintetiza i folosi ntr-un model economico-matematic, iar construirea acestuia
este independent de informaiile obinute. Pentru rezolvarea modelului se utilizeaz diferii
algoritmi care sunt considerai de prim rang n modelarea procedural.
Modelarea procedural se poate realiza n dou strategii:
- modelare general cnd se urmrete acoperirea tuturor cazurilor posibile;
- modelarea pe tipuri de probleme sau clase, atunci cnd se aleg probleme frecvente din practic.
Exist n economie o stns legtur dintre metodele utilizate i natura mrimilor care
caracterizeaz procesul analizat. Dac mrimile pot fi msurate exact atunci se poate afirma c
sunt utilizai cu maxim eficien algoritmii exaci.
Dac ns, problema este complex sau de mari dimensiuni sau datele de intrare sunt
inexacte se vor folosi algoritmi euristici.

Schema de concepere a algoritmilor euristici.


Euristica se definete ca fiind o clas de metode i reguli care dirijeaz subiectul spre o
soluie simpl i economic, sau este un drum care duce la descoperirea soluiilor problemelor
complexe fr a le supune simplificrii.
Metodele euristice sunt tatonri i nu abloane, iar alegerea lor este legat de natura
problemei de rezolvat i de experiena celui care modeleaz. Euristica are legturi cu
raionamentele analogice i cu psihologia simulrii. Aceast relaie se poate evidenia prin
performan, comportament si prin srtuctur. Modelarea euristic pornete de la construirea unui
sistem analog cu cel investigat. De obicei, problema este de a descoperi regulile de baz ale
euristicii specialistului, pentru ca apoi ele s poat fi perfecionate i sistematizate ntr-un
algoritm. n utilizarea algoritmilor euristici trebuie respectate restricii i n fiecare etap de
calcul s se obin eficien maxim pentru funcia obiectiv. Dintre dou sau mai multe
posibiliti se va alege acea cale (posibilitate) care duce la creterea sau descreterea valorii
funciei obiectiv de maxim respectiv minim.
Paii algoritmului general de rezolvare sunt urmtorii:
se construiete o soluie iniial;
se testeaz condiiile de administrare a soluiei;
dac pasul anterior a fost ndeplinit se trece la urmtorul pas care const n cutarea unei
strategii de reducere a abaterilor . n acest scop se poate stabili una sau mai multe
strategii care se presupune a reduce abaterile . Dup testarea strategiilor se va alege
aceea strategie care permite un numr ct mai mic de iteraii i reduce la maxim abaterile
. Dup un numr relativ mare de iteraii, dac nu s-au anulat aceste abateri, problema
este considerat fr soluie din punct de vedere al algoritmului euristic utilizat;
se calculeaz funcia de performan f(x0) a soluiei iniiale admisibile;
se calculeaz funcia de performan f(x1) a noii soluii;
se compar performanele celor dou soluii f(x0 i f(x1). Dac performana f(x1) este
superioar performanei f(x0) atunci se evalueaz diferena f(x1)- f(x0;
dac diferena este semnificativ, soluia x1 devine soluie iniial i algoritmul se
continu de la pasul n care se calculeaz funcia de performan.
Din cele expuse mai sus rezult c modelele procedurale utilizeaz simularea i n urma
obinrerii rezultatelor decidentul poate adopta decizii bazate i pe cunotinele dobndite
asupra fenomenului condus, ct i prin acumularea unei anumite experiene.

2.3. Tabele de decizie i arbori de decizie

Actul de decizie care presupune un numr relativ finit i rezonabil de alternative se poate
modela prin analiza decizional. Aceasta presupune ataarea unor valori estimate (cu
probabilitile aferente) pentru fiecare alternativ i care se vor nscrie ntr-un tabel sau un graf.
Modul de alegere a deciziei se face prin a vedea care dintre alternative este cea mai bun.
Aceast metod utilizeaz tabelele de decizie care caracterizeaz aciunea decizional i conine:
stri generale care sunt date de totalitatea condiiilor n care se desfoar evenimentul de
analizat; alternative decizionale ce determin modul de realizare a unei aciuni independente de
voina decidentului; consecine decizionale ce sunt rezultatul aciunii conjugate a strii generale,
criteriilor decizionale i alternativelor. Condiia este ca numrul de consecine s fie mai mare
sau egal cu numrul de criterii.
n cazul problemelor de decizie multicriterial n condiii de risc, n care se cunosc
probabilitile de realizare a fiecrei stri, soluia optim este dat de (p probabilitatea, u
utilitatea):
n
Sopt = max i p ij * u ( x j )
j =1

Dac problema de decizie multicriterial este descris n condiii de incertitudine soluia


optim va fi dat urmnd una dintre reguli:
Criteriul WARD (al prudenei) ce presupune c nu se admite sub nici o form riscul. Se
determin soluia cea mai slab pentru fiecare variant i se alege aceea care duce la cel mai
bun rezultat (ales dintre rezultatele slabe);
Criteriul SAVAGE sau regula regretului care folosete conceptul de regret economic*
ce rezult din faptul c nu s-a ales varianta bun. Se compar apoi fiecare ipotez cu o singur
alternativ i se alctuiete o matrice a regretelor, obinut din scderea fiecrei stri din
variabila maxim. Apoi se rezolv problema de minim-maxim;
Criteriul Laplace n care toate strile se consider a fi echiprobabile i se alege acea
variant pentru care sperana matematic a efectului economic este maxim;
Criteriul Hurwicz ce presupune calculul unui indicator decizional ca medie ponderat a
rezultatelor extreme. Se noteaz cu coeficientul de optimizare considerat de decident, iar
acesta poate avea valori cuprinse ntre 0 i 1:
 di = * Mi + (1 ) * mi
Cu ajutorul arborilor de decizie se pot reprezenta tabelele de decizie prin evidenierea
grafic a relaiilor dintre variabilele problemei.

2.4. Optimizare cu algoritmi programare matematic

Problemele manageriale n care decidentul poate aloca doar o cantitate limitat de resurse
mai multor activiti se pot rezolva cu setul de instrumente i metode puse la dispoziie de
programarea matematic, din care cea mai utilizat este programarea liniar. Aceasta din urm
impune anumite reguli pe care decidentul trebuie s le respecte: existena unui set de variabile
msurabile pentru care se caut valoarea optim; construirea unui set de restricii cu aceste
variabile care, n cazul decizional, sunt variabile de decizie, care sunt de fapt relaii de egalitate
sau inegalitate fa de anumite valori; o funcie obiectiv care reprezint o relaie matemetic
liniar ntre variabilele de decizie i rezultatul scontat a crei valoare trebuie minimizat sau
maximizat; crearea legturilor ntre elemente realizat cu ajutorul relaiilor matematice numite
ecuaii, n care apar i coeficieni.
Modelul unei probleme de programare liniar devine astfel: determinarea unui min sau
max pentru funcia obiectiv care depinde de una sau mai multe variabile care satisfac restriciile
modelului (condiii implicite) sau care se refer la valorile ce pot fi luate de variabile (condiii
explicite); problemele de programare liniar au restricii de tip inegaliti i condiii explicite
puse unora dintre variabile.
Modelul de programare liniar are forma:
max (min ) f ( x 1, x 2 ,..., x n ) = c 1 * x 1 + c 2 * x 2 + ... + c n * x n
a 11 * x 1 + a 12 * x 2 + ... + a 1 n * x n b 1
a 21 * x 1 + a 22 * x 2 + ... + a 2 n * x n b 2

.......... .......... .......... .......... ..........


a m 1 * x 1 + a m 2 * x 2 + ... + a mn * x n b m

n forma standard toate restriciile sunt ecuaii, iar variabilele sunt >=0:
max (min ) f (x ) = cx

Ax = B
x 0

n forma canonic toate restriciile sunt concordante i toate variabilele sunt>=0:

max f ( x ) = cx min f ( x ) = cx

Ax B Ax > B
x 0 x 0

Aceste probleme se rezolv cu algoritmul SIMPLEX (Dantzing, 1951) care este de fapt
iterativ, la fiecare pas se obine o mbuntire a soluiei, oferind:
- soluia admisibil ce satisface doar condiiile explicite sau
- soluia optim.
Programul Excel prin componenta sa Solver rezolv problema de programare liniar. n
ultimul timp majoritatea problemelor sunt de programare liniar multidimensional, ca de
exemplu: metoda utilitii globale n care problema de programare liniar este luat drept o
problem de decizie multidimensional. n acest caz, funcia obiectiv este nlocuit cu funcia de
utilitate; metoda P.O.P. algoritmul care descrie aceast metod presupune o ordonare a
soluiilor n funcie de criterii de preferin definite de decident; metoda STEM ce const n
definirea unei funcii obiectiv de sintez cu coeficieni care vor fi ataai fiecrui criteriu.

2.5 Simularea

Simularea const n a crea variante care se apropie de ceea ce se ntmpl n realitate, ea


fiind de fapt o metod experimental. De obicei SIAD reflect realitatea complex a fenomenelor
i proceselor economice, i de aceea este greu de crezut c un model matematic, ct ar fi el de
bun, poate s reflecte aceste procese. Simularea, a nu se confunda, nu este un model n strictul
neles al cuvntului, ci prin diverse instrumente folosite imit ceea ce se ntmpl n realitate.
Gradul de simplificare oferit de simulare este mult mai mic dect n cazul modelelor
tradiionale. Ea reprezint o metod descriptiv, deci nu exist o procedur prin care s se obin
o soluie optim.

Procesul de trecere de la sistemul real la modelul de simulare.


Structurarea unor informaii despre sistemul real, nainte ca el s fie realizat concret, este
posibil cu ajutorul tehnicii simulrii. Dac este s definim simularea, aceasta este tehnica de
realizare a experimentelor cu calculatorul numeric, care implic construirea unor modele
matematice i logice care descriu comportarea unui sistem real (sau a unor componente ale sale)
de-a lungul unei perioade mari de timp 1 .
Ca proces, simularea va genera intrrile, iar prin algoritmi corespunztori va determina
ieirile i va descrie evoluia n timp a strilor interne ale sistemului.
Obiectivele finale ale simulrii necesit adoptarea celor mai bune mijloace i metode de
conducere pentru activitile tehnologice ct i pentru cele economice. Pentru modelarea prin
simulare a proceselor tehnologice se utilizeaz att echipamente de automatizare ct i
calculatoare electronice conectate la procesul de producie.
n condiiile n care se simuleaz un proces economic se includ calculatoare electronice
cu capacitate mare de calcul i posibiliti de stocare pentru mari volume de date.
Se poate afirma c n cazul sistemelor de conducere a activitilor economice,
calculatoarele sunt destinate pentru luarea unor decizii corespunztoare, iar n cazul sistemelor
de conducere a proceselor tehnologice acestea elaboreaz automat decizii sub forma unor
comenzi care sunt transmise ctre procesul condus. Dac se face referire la cercetrile pe plan
mondial, acestea se refer la realizarea unor sisteme de conducere ierarhizate, multinivel care
funcioneaz n timp real i sunt distribuite n toate compartimentele firmelor.
Sistemele ierarhizate se bazeaz pe o structur ierarhizat pe niveluri de conducere, ceea
ce implic coducerea tuturor compartimentelor componente prin decizii adoptate n timp real.
Obiectivul major al sistemului este obinerea unei producii optime cantitativ i calitativ n
condiiile n care exist resticii temporale de scurt sau lung durat i a unor perturbaii
permanente din partea mediului.
Dac se fac referiri la etapele procesului de simulare se poate afirma c ele se concretizeaz
n:
Analiza i sinteza sistemelor i proceselor;
Programarea modelului de simulare;
Validarea modelului de simulare;
Simularea propriu-zis;
Analiza i implementarea rezultatelor.
Analiza i sinteza sistemelor i proceselor economice const n descompunerea n pri
componente pentru fiecare activitate de analiz, iar proiectarea sistemelor este procesul prin care
sunt selectate componentele i elementele dar i etapele i procedurile care conduc ctre
realizarea unui sistem viabil pentru obiectivul luat n studiu.
De obicei un model de simulare se proiecteaz pentru a observa comportamentul unui
sistem existent sau pentru proiectarea unui sistem nou. Ca prim pas n procesul de simulare se
evideniaz identificarea i formularea problemei sau scopului studiului, n care trebuie s se
specifice obiectivele experimentului.
Pentru aceasta se vor lua n considerare elemente cum sunt:
1. Stabilirea variabilelor de decizie i a variabilelor de stare, n care variabilele de decizie
sunt cele asupra crora analistul are un control complet i care stau la baza deciziei luate
de acesta la un moment dat. Variabilele de stare sunt dependente de cele de decizie i
descriu starea unei componente n orice moment;
2. Identificarea unui model optimal de evoluie implic analiza i sinteza, care se
concretizeaz n stabilirea unui model conceptual care s fie apropiat de cel real;
3. Msurarea performanelor sistemului se obine prin construirea unei funcii obiectiv. Sunt
ns i cazuri cnd aceast identificare a performanelor sistemului se realizeaz prin
punerea n eviden a deciziilor i valorilor variabilelor de stare n diverse variante ale
mrimilor de intrare.

2.5.1.Conceperea i proiectarea modelului

Aceast etap const n stabilirea n mod detaliat a tuturor aspectelor legate de problema
pus n studiu, chiar dac uneori tinde ctre o rezolvare analitic. n aceast etap se precizeaz:
ipotezele care se vot testa;
efectele probabile care urmeaz s apar;
schimbrile caracteristicilor operative asupra variabilelor i parametrilor de ieire;
studiul efectelor asupra variabilelor i parametrilor de intrare;
intervalul admisibil pentru variabilele i parametrii de stare,
strategiile luate n calcul la eventuale apariii a evenimentelor perturbatoare i a
costurilor corespunztoare fiecrei strategii;
strategiile de urmat pentru modificarea parametrilor de stare n cazul n care au fost
depite limitele admisibile ale altor parametri de stare;
vectorul iniial al probabilitilor de prevenire a apariiei evenimentelor perturbatoare sau
de modificare a mrimii parametrilor de stare;
tehnici de reducere a datelor i de analz a rezultatelor;
forma ecuaiilor matematice;
ecuaiile suprafeei de rspuns etc.
Un loc important l are colectarea i prelucrarea primar a datelor, faz n care se
stabilesc datele necesare, cum se obin ele i mai ales cum sunt introduse n model.
Datele se vor organiza n fiiere, tabele, rapoarte i se prelucreaz pentru a intra n
prelucrare numai cele care sunt necesare. Un alt obieciv l reprezint stabilirea modelului
potenial, pentru care se va lua n considerare fenomenul aa cum se produce el n realitate.
Pentru aceast etap este necesar a se stabili :
1. ce funcii trebuie s realzeze sistemul;
2. care sunt funciile care se vor modela;
3. care sunt funciile deterministe;
4. care sunt factorii de mediu care influeneaz performanele sistemului;
5. cum se face aproximarea efectelor factorilor de mediu asupra sistemului;
6. ce interaciuni intervin ntre om, sistem i mediu i cum se evalueaz.
Avnd rspunsurile la aceste ntrebri se poate obine o prim form a modelului, se pot
defini parametrii i variabilele. De remarcat este faptul c parametrii modelului sunt: de sistem
sau auxiliari. Parametrii sistemului sunt direct legai de sistemul care va fi simulat, iar parametrii
auxiliari nu sunt asociai direct cu sistemul, ns au efect asupra performanelor acestuia. Exist
parametri cinematici care sunt asociai cu micarea n sistem sau n mediu, iar cei dinamici dein
valori care sunt influenate de ali parametri sau variabile. Exist i o categorie de parametri care
sunt denumii statici i care prin valorile lor influeneaz stochasic procesele i schimb
elementele n sistem. Parametrii de mediu sunt asociai mediului din care face parte sistemul i-i
pot influena performanele.
n model exist i variabile aleatoare, adic valorile lor sunt necunoscute, dar pot apare
n condiii datorate ntmplrii cu probabiliti determinate. O alt categorie de variabile sunt
cele controlabile ale cror valori sunt msurabile printr-o anumit procedur i sunt i variabile
necontrolabile.
O alt clasificare a variabilelor este aceea c acestea pot fi de intrare (mrime exogen
controlabil), perturbatoare (mrime exogen necontrolabil), intermediare (variabile de stare a
unei componente a sistemului), de ieire (variabile exogene).
Variabilele de intrare sunt deterministe sau stochastice. Variabilele deterministe sunt
date pe supori de informaii ori determinate de reguli precise. Variabilele stochastice sunt
generate prin algoritmi corespunztori pe calculator. Dac cel puin una dintre variabile de
intrare este stochastic, rezult c cel puin una dintre variabilele de ieire este stochastic, iar
parametrii ei devin parametrii de ieire. n model fiecare parametru i variabil a modelului se
specific prin: simbol, definiie, descriere, unitate de msur, ordin de mrime pentru valori,
caracteristici, locul n model, sursa.
De remarcat este faptul c variabilele se modific ntr-un ciclu de simulare ct i de la o
variant de evoluie simulat la alta. Dac variabila nu se modific de la o variant la alta atunci
putem afirma c ea devine parametru. Caracteristica parametrilor este aceea c ei rmn
constani n cadrul aceleiai variante, dar se pot schimba de la o variant la alta. O clasificare a
parametrilor d posibilitatea gruprii lor n:
parametrii cei mai importani i pentru care se iau n considerare toate valorile provenite
din msurtori ;
parametri de importan medie, pentru care se iau n considerare numai trei valori
caracteristice : maxim, medie i minim ;
parametri de mic importan pentru care se ia n considerare doar o singur valoare
caracterisic care poate fi valoarea medie sau valoarea cea mai probabil.
Simularea unui sistem economic pornete de la definirea evenimentelor care survin n
derularea procesului economic supus analizei i de la specificarea legturilor existente ntre
evenimente. Evenimentele care intervin n procesul de simulare se clasific n funcie de
anumite criterii i anume :
1. Dup natura evenimentelor acestea pot fi:
Evenimente sistem;
Evenimente program, care sunt asociate programului de prelucrare a datelor.
2. Dup natura condiionrilor dintre evenimente:
evenimente noncontingente n care apariia unor evenimente nu depinde de
apariia sau existena altor evenimente n sistem :
evenimente contingente la care apariia este influenat sau condiionat de
apariia altor evenimente.
3. Dup modul de prelucrare care este asociat evenimentului:
evenimente care nu apar n urma unor decizii :
evenimente cu decizii.
Conform caracterului deciziei, evenimentele au la baz decizii deterministe, adic decizia
se adopt dup reguli de natur algoritmic sau euristic ; sau au la baz decizii probabiliste,
unde decizia este adoptat cu o anumit probabilitate.
4. Dup probabilitile de prevedere evenimentele se clasific n:
previzibile, adic apariia lor este planificat;
perturbatoare, adic apariia lor nu se poate stabili anticipat i sunt cele care
influeneaz defavorabil evoluia sistemului.
5. Dup aciunea asupra parametrilor de stare:
cu aciune imediat, ele modific parametrii de stare ai unor componente
chiar din momentul n care apar;
cu aciune ntrziat, ele modificnd componentele sistemului dup o
anumit perioad de timp.
La elaborarea modelului se are n vedere relaiile funcionale dintre variabile, care dac
nu au date suficiente, ele se pot obine recurgd la metoda analogiilor. Cnd se simuleaz un
model complex este eficient formularea unor submodele specializate n rezolvarea unor funcii
precise i mai apoi acestea vor fi agregate ntr-un model general pe baza relaiilor logice dintre
ele.
O astfel de operaie este denumit integrare i are la baz construcia modular a
modelului. Modulele sunt de dou tipuri : de sistem i auxiliare.
Modulele de sistem simuleaz o funcie sau o operaie logic n sistem, iar cele auxiliare
constituie o parte a modelului dar nu sunt o funcie direct a sistemului. De exemplu, generatorul
de numere aleatoare este utilizat n orice tip de model fr a avea legtur cu problema de
rezolvat.
Se cunoate c n model exist variabile i parametri care vor trebui explicitai prin
limite accesibile minime i maxime. Aceste limite nu pot fi depite n cazul modelelor
deterministe, iar pentru celelalte tipuri de modele se vor stabili aa numitele penalizri dac
limitele se vor depi. Simularea presupune evoluia n timp a sistemului simulat, ceea ce
provoac apariia succesiv a unor evenimente care dau de fapt schimbrile din sistem. Apare
astfel pericolul ca diverse variabile s parcurg intervale de timp diferite. Pentru meninerea
ordinii evenimentelor care ori schimb ori menin starea sistemului, se introduce n algoritmul
simulrii o variabil care va msura scurgerea timpului real n care se execut simularea.
Aceast variabil poart numele de ceasul simulrii i are posibilitatea de a preciza dup
fiecare pas al simulrii, care este intervalul de timp care a trecut de la un pas la altul al simulrii
i cnd aceasta se poate opri. Iniial variabila ceas este zero, ca mai apoi s se modifice ntr-un
numr finit de pai, pas care poate fi constant sau variabil.
Ceasul cu incrementare finit genereaz pe parcursul procesului de simulare o cretere
constant T>0.
Programul de simulare permite determinarea tuturor evenimentelor posibile care se
produc n intervalul T, precum i efectele asupra strii sistemului i deciziile ce se vor adopta.
Ceasul cu cretere variabil are la baz tehnica sau regula evenimentului urmtor, deoarece
mrimea cu care este incrementat ceasul este egal cu intervalul de timp de trecere de la o stare
notat Si la starea determinat de apariia celui mai apropiat eveniment notat cu Si+1. Se poate
afirma c un model de simulare se construiete prin discretizarea timpului cu cretere constant
sau variabil.
Timpul simulat se scurge perioad cu perioad, iar calculatorul va executa toate
tranzaciile care au loc pas cu pas pn la expirarea orizontului de simulare. Sunt cazuri n care
perioadele vor fi relativ scurte pentru c pot apare prea multe evenimente n cazul perioadelor
lungi i aceasta face ca programul s fie greu de executat. Exist i situaia n care perioadele
sunt prea scurte i atunci apare riscul s nu apar nici o tranzacie.
Remedierea acestei deficiene se face prin mrirea perioadei sau prin utilizarea ceasului
cu increment variabil.
Fiecrui tip de sistem simulat i corespunde un anumit tip de funcie obiectiv.
Dup aceast etap se verific validitatea modelului prin utilizarea testelor statistice care
vor arta dac parametrii de intrare au fost corect estimai. Se verific apoi i dac modelul
conine toate variabilele eseniale iar relaiile dintre variabile i parametri sunt cele corecte. Dup
ce modelul a fost scris ntr-un limbaj natural el va fi transformat ntr-un model scris n limbaj de
simulare.
Ca exemplificare se vor da cteva detalii despre cea mai cunoscut metod de simulare a
proceselor economice i anume metoda Monte Carlo.
Metoda Monte Carlo st la baza procedeelor de generare a proceselor stochastice sau de
cutare a unor puncte n domeniu. Rezultatele obinute prin utilizarea acestei metode se refer la
evaluri i ierarhizri care fundamenteaz o decizie economic.
Domeniile n care se aplic aceast metod sunt:
Procese de stocare complexe, unde ritmul de aprovizionare este aleator sau sezonier,
suprafaa de depozitare este limitat, sunt penalizri pentru lipsa de stoc sau n condiiile
n care nu este posibil o modelare clasic prin teoria stocurilor;
Procese de ateptare n care evenimentele se intercondiioneeaz, iar rezolvarea lor prin
modele de ateptare este practic imposibil;
Procese de repartiie care se analizeaz n legtur cu activitatea de producie i cu cea
de investiii.
Dac se dispune de structura graficului reea i de repartiia duratelor, simularea va consta
n aplicarea algoritmului de calcul al drumului critic pentru un numr suficient de mare de
generri ale duratelor activitilor n concordan cu repartiia stabilit.
Simularea are ca rezultat estimarea parametrilor repartiiei duratei totale i poate da i
determinarea frecvenei caracterului critic pentru orice activitate n parte.
Procese de munc complexe care se refer la deciziile legate de programarea operativ a
produciei (ca de exemplu ncrcarea utilajelor, lansarea n fabricaie, urmrirea realizrii
produciei), de la locul de munc la atelier sau secie.

Prezentarea metodei Monte Carlo


Simularea prin metoda Monte Carlo presupune c unei probleme deterministe i se
asociaz un model aleator, numit i probabilist, iar prin generarea unor variabile aleatoare legate
de soluie se realizeaz experiena pe model. n esen metoda const n realizarea experimental
a unui eveniment a crui probabilitate va fi exprimat de numrul , dar i estimarea
aproximativ a acestei probabiliti. Aceast metod este de fapt sinonim cu metoda
estimrilor statistice, mai putnd fi definit i ca metoda modelrii variabilelor aleatoare pentru
calculul caracteristicilor repartiiei lor.
Metoda propune s se plece n calculul variabilei aleatoare de la o alt variabil aleatoare,
dar care are o repartiie uniform pe intervalul [0,1]. Aceast variabil este din cmpul de
probabilitate constructiv, cmp a crei aplicaie are forma : =f(x), x[0,1] cu urmtoarea
prorietate:
0

f ( x)dx =1.
Metoda presupune estimarea parametrilor repartiiei unei variabile aleatoare pe baza
relizrilor acesteia. Problema principal rezolvat prin metoda Monte Carlo const n estimarea
valorii medii a unei variabile aleatoare n funcie de o eroare admisibil i o probabilitate dat.
Se construiete prin experiment statistic imaginea unor procese i astfel se impune ca
variabilele aleatoare care intervin s fie estimate cu o abatere ct mai mic n probabilitate n
raport cu variabilele considerate a fi reale. De aceea este nevoie de construcia unor estimatoare
satisfctoare. De exemplu pentru variabile aleatoare cu distribuie normal media m se
consider a fi estimator de maxim verosimilitate.
Calitatea eantionului se poate aprecia prin teste de concordan care msoar apropierea
repartiiei empirice de repartiia teoretic. Testele de concordan se pot baza pe unul dintre
criteriile Kolmogorov, Smirnov sau Pearson. Prin utilizarea acestor criterii se compar valorile
corespunztoare din tabelele repartiiei teoretice cu cele de acceptare pentru funcia de
verosimilitate. Dac diferena dintre valorile celor dou repartiii este mai mare dect un prag
admis, funcia de verosimilitate se respinge.
Procesul de simulare indiferent de ce metod utilizeaz are la baz, pentru a reproduce n
mod fidel anumite elemente ale sistemului simulat, de rezolvarea unor probleme numerice n
care apar numere alese ntmltor sau aleatoare.
Se afirm c un numr este ntmpltor sau aleator numai dac se afl ntr-un context
statistic. De aici apare necesitatea elaborrii unor metode care s asigure generarea de numere
aleatoare care s respecte legea empiric a sistemului economic, necesitnd un timp minim de
rulare. Se utilizeaz generarea unor numere aleatoare uniform repartizate. n mod normal nu se
pot genera numere aleatoare care s satisfac cerinele cunoscute n teoria probabilitilor, ci sunt
numere pseudoaleatoare, care satisfac urmtoarele condiii:
1. Sunt repartizate uniform ntr-un interval dat, iar pentru intervalul [0,1], funcia de
repartiie uniform se definete:
0 dac x 0
F(x)= { x dac x (0,1)}
1 dac x 1
2. Sunt statistic independente, adic nu sunt autocorelate.
3. Sunt reproductibile pentru testarea programelor sau pentru a efectua comparaii
4. Funcia de repartiie este stabil, adic nu se schimb n cursul rulrii programului
de simulare.
5. irul generat are o perioad de repartiie mare care poate fi predeterminat.
De remarcat este faptul c irurile de numere pseudoaleatoare aproximeaz irurile de numere
aleatoare. Dac condiiile sunt riguros respectate atunci aproximaia este cu att mai corect.

Validarea modelului de simulare.


Aceast etap are rolul de a elucida unele aspecte cum sunt:
Modelul reprezint sau nu procesul studiat;
Dac sunt cuprinse toate etapele modelului complex;
Cum se vor folosi rezultatele obinute din simulare i dac acestea au un caracter empiric.
Modelul de simulare este considerat bun, dac se comport similar cu fenomenul simulat.
Dac fenomenul este neles teoretic i dac se cunoate comportamentul sistemelor economice,
sociale, de afaceri, atunci se poate construi un model valid.
Validarea modelului se face prin verificarea corectitudinii interne a acestuia n sens logic
i dac reprezint fenomenul de modelat. Dup adoptarea i validarea modelului de simulare,
acesta se execut n concordan cu schema sau cu scopul experimentului. Descrierea
experimentelor de simulare are aceleai etape ca i descrierea evenimentelor, prin verificarea
unor concepte ca: structura, mrimea eantionului, cost, calitate. Sunt utilizate i instrumente
statistice pentru analiza rezultatelor.
Mrimea rulrii este direct legat de costul experimentului. Pentru a determina mrimea
optim a rulrii se folosesc regulile de oprire (determinate prin utilizarea teoriei statistice). Prin
intermediul calculatorului se pot face rulri mari ntruct timpul i costul de rulare sunt
minimale.
Reducerea variantelor presupune c descriera simulrii se poate face n aa fel nct s se
obin precizie maxim pentru eantionul luat n calcul. Exist tehnici pentru micorarea
variantelor de distribuie a msurii performanelorca de exemplu eantionul stratificat unde
datele sunt divzate proporional sau n straturi, iar fiecare strat este modelat individual (separat).
Dup obinerea rezultatelor se fac eventuale modificri numai dac este necesar acest lucru. n
aceast etap, utilizatorii au rol important pentru a se obine rezultate practice satisfctoare.

Analiza i interpretarea rezultatelor


Etapa de analiz i interpretare a rezultatelor const n colectarea datelor simulate i
prelucrarea lor, calcularea statisticilor pentru testele de semnificaie, obinerea de tabele, grafice
i interpretarea rezultatelor. Se analizeaz valorile variabilelor de ieire pentru diverse valori ale
varibilelor de intrare reale, analizndu-se curba de evoluie a fiecrei variabile de ieire.
Dac aceast curb nu difer semnificativ de cea real atunci se poate afirma c valorile
obinute sunt cele corecte. n interpretarea rezultatelor un loc important l are i analiza
caracteristicilor numerice asociate variabilelor de ieire cum sunt media, dispersia, mediana. n
concluzie4, se poate afirma c simularea este o tehnic de realizare a experimentelor cu
calculatorul, ea implicnd utilizarea unor modele matematice i logice care descriu comportarea
unui sistem real de-a lungul unei perioade mari de timp.
Un experiment de simulare trebuie s parcurg urmtarele etape:
 Formularea problemei este etapa n care se stabilesc ipotezele de lucru mpreun cu
criteriile de acceptare sau respingere precum i precizarea estimaiilor obinute prin
simulare;
 Culegerea i prelucrarea preliminar a datelor reale;
 Formularea modelului de simulare, etap prin care se aleg variabilele, parametrii,
relaiile funcionale i algoritmul prin care se determin elementele de ieire n funcie de
cele de intrare;
 Estimarea parametrilor prin metode statistico-economice pe baza datelor reale;
 Evaluarea performanelor modelului i a parametrilor prin teste de concordan;
 Elaborarea algoritmului simulrii prin schem logic detaliat sau schem bloc n
funcie de complexitatea modelului;
 Validarea sistemului de simulare prin testarea programului pe o soluie particular
cunoscut sau prin compararea valorilor variabilelor de ieire cu observaiile situaiei
reale simulate;
 Programarea experimentelor de simulare prin considerarea succesiv a valorilor
parametrilor de intrare i a variabilelor de intrare ale modelului;
 Analiza datelor simulate care va consta n interpretarea rezultatelor obinute.
Prin simulare se poate afirma c se poate determina forma funcional de exprimare a
legturilor dintre fenomenele supuse studiului i estimarea valorilor parametrilor modelului,
testarea diferitelor variante de aciune care nu se pot explicita n model, o mai bun structurare a
problemei supus simulrii precum i validarea soluiilor obinute.
Avantajul simulrii este dat de utilizarea sistemului cibernetic de reglare, care este baza
deciziei concrete din activitatea practic.
2.5.2. Simularea cu instrumente din Excel

Simularea cu ajutorul diagramelor

n Excel, diagramele pot fi utilizate pentru simulare prin exploatarea proprietii de


biunivocitate care exist ntre schimbarea locaiei punctelor pe diagram prin tehnica drug-and-
drop efectuat cu mouse-ul i modificarea valorii datelor corespunztoare din tabelul cu date.

Tabelul de simulare

Tabelul de simulare din Excel este un instrument informatic dedicat din categoria
analizei datelor i rezolvrii problemelor complexe de asistare a deciziei economico-financiare.
Tabelul de simulare din Excel reprezint o zon de celule ce indic rezultate obinute ca urmare a
substituirii unor valori din formule definite n prealabil de utilizator. Se pot obine:
Tabele de simulare cu o singur variabil de intrare;
Tabele de simulare cu dou variabile de intrare.
n cazul tabelelor de simulare cu o singur variabil de intrare, dac se introduce un
set de valori pentru variabila de intrare, se poate astfel pune n eviden influena pe care o are
aceast modificare de valori ntr-una sau mai multe formule.
n cazul tabelelor de simulare cu dou variabile de intrare, se aplic seturi de valori
pentru cele dou variabile i se pune n eviden efectul modificrilor asupra unei singure
formule.

Scenariul

Scenariul servete pentru realizarea previziunilor asupra unui proces economic prin
compararea seturilor de valori care conduc la rezultate diferite. Practic, n instrumentul
Microsoft Excel, scenariul (Scenario) reprezint o mulime de valori pe care acesta le poate
substitui automat ntr-o foaie de calcul. Cu ajutorul scenariului se obin simulri ale mai multor
variante ale unui proiect, variante care au valori diferite ale parametrilor i rezultate diferite.

2.6.Teoria jocurilor
La baza lurii deciziilor de obicei intervin condiiile care influeneaz asupra diverselor
alternative. Condiiile sunt legate de aciunea omului sau pot reprezenta complexul factorilor
naturali n care se desfoar evenimentele.
Modelarea matematic a procesului de decizie se face cu ajutorul conceptului de joc
strategic. Jocul se poate defini ca fiind acel proces competitiv care se desfoar ntre mai muli
participani , care se numesc juctori, dintre care unul este inteligent i prudent, adic poate
analiza situaia creat i poate lua decizii asupra aciunilor ce vor urma. Ca noiune apare partida
care este dat de un set de reguli dup care juctorii i desfoar aciunile. Partida se
caracterizeaz printr-o stare denumit iniial i o stare final, aceasta din urm fiind determinat
de regulile jocului.
Strategia este definit n contextul jocului ca fiind o succesiune de aciuni ale unui
juctor, fiecare succesiune este astfel pregtit n aa fel nct s fac fa strategiei adversarului
de joc, pentru atingerea scopului propus. n acest fel se atinge acea stare final n care regulilor
jocului li se asociaz maximum de ctig posibil de realizat. Un joc n care intervin doar doi
parteneri se poate reprezenta matriceal astfel:

J/N N1 N2 ........ Nn
J1 c11 c12 .... c1n
J2 c21 c22 ...... c2n
.............. .... .... .... ....
Jm cm1 cm2 .... cmn
unde s-a notat cu:
J juctorul;
N adversarul din cadrul jocului;
Ji = {J1,J2,..,Jm}este mulimea strategiilor lui J;
Nj = {N1,N2 ,,Nn}mulimea strategiilor lui N;
Ci,j{i=1,m; j=1,n}este consecina adoptrii strategiei Ji de ctre J i a strategiei Nj de ctre
N;
Cnd se pune problema alegerii uneia sau alteia dintre strategii, n procesul de adoptare a
deciziei, se iau n considerare utilitile fiecrei consecine.
Jocurile sunt cu punct a i fr punct a. Jocurile cu punct a presupun c cei doi juctori
se supun unui raionament corect care conduce la alegerea strategiei optime (fiecare dintre
juctori i va alege propria strategie optim). Astfel cele dou strategii optime alese de fiecare
juctor va constitui soluia jocului.
Cazul general al problemei generate de jocul cu punct a are ca principiu de baz principiul
maxim. Fie un joc de ordinul m*n are asociat urmtoarea matrice:
a11 .... a1n

... ... ...
am1 ... amn

Principiul maximului presupune c primul juctor alege acea strategie care are ctigul
minim.
V1= max(min aij); 1 i m, 1 j n
i j
Pentru determinarea valorii V1 se vor determina toate valorile minime pe linii (minj ai,j), iar
dintre acestea se va lua valoarea maxim (maxi ai,j). Juctorul doi va proceda n mod similar:
V2= min (max aij); 1 i m, 1 j n
j i
Valoarea V2 precum i strategia care i corespunde se vor afla prin alegerea tuturor
maximelor pe coloan (maxi aij) i lund pe cel mai mic dintre ele (minj maxi).
V=V1=V2=maxi(minj aij)=min j(max i aij); V1= max(min ai,j); 1 i m, 1 j n
Jocurile fr punct a au ca fundament un raionament, care orict de riguros ar fi, nu l
va conduce pe juctor la alegerea unei perechi de strategii, aa cum se ntmpl n cazul jocurilor
cu punct a. Soluia unei astfel de probleme este dat de determinarea strategiilor mixte optime
ale celor doi parteneri, prin metode algebrice, geometrice sau iterative. Jocurile cu doi parteneri
se modeleaz n situaii conflictuale ntre dou sau mai multe pri care se reduc tot la jocuri cu
doi participani, prin formarea de coaliii. Fiecare dintre pri urmrete alegerea unei strategii
care s asigure un rezultat avantajos n detrimentul adversarului sau adversarilor.
Modele asemntoare sunt utilizate n probleme de decizie n care este doar un singur
participant care trebuie s aleag strategia optim, care n acest caz se numesc stri ale naturii.
Astfel se poate afirma c natura nu acioneaz ca un adversar inteligent care urmrete un
beneficiu ct mai mare din partea adversarului i n consecin nu se pot stabili reguli de
comportare a ei. Se pot ns culege informaii statistice i se pot face previziuni probabilistice.
Deciziile n cazul jocurilor contra naturii se clasific n:
decizii n condiii de certitudine, adic exist informaii certe despre evoluia
viitoare;
decizii n condiiide risc, n care se cunosc doar probabilitile de realizare a
strilor naturii;
decizii n condiii de incertitudine, nu exist informaii privind probabilitile de
realizare a strilor naturii.
Referitor la deciziile n condiii de risc se poate afirma c n procesul managerial,
decidenii sunt pui n faa unor situaii deosebite deoarece trebuie s aleag dintr-o multitudine
de strategii.
Elementele unui model de decizie sunt:
decidentul;
stabilirea i formularea problemei;
totalitatea variantelor sau alternativelor posibile care definesc o situaie
decizional;
mulimea tuturor consecinelor anticipate pentru fiecare variant;
totalitatea criteriilor de decizie ale decidentului;
obiectivele propuse de decident;
strile naturii, factori independeni de decideni i care sunt de tip conjunctural.
Din multitudinea de variante posibile, decidentul urmeaz s aleag drept soluie
convenabil, doar una. n acest proces apare necesitatea de a se compara variantele decizionale
ntre ele prin efectul consecinelor i astfel apare conceptul de utilitate. Utilitatea este de fapt
unitatea comun de msur a consecinelor multitudinii de alternative decizionale.
Teooria jocurilor este utilizat pentru simularea diverselor procese economice.
Jocurile de ntreprindere (Business Games) faciliteaz simularea dinamic a unor
decizii secveniale. Utilizarea jocurilor de ntreprindere are ca scop formarea deprinderilor de a
rezolva diverse situaii limit la factorii de conducere, precum i dezvoltarea de aptitudini de
abordare complex i sistemic a procesului simulat. Cu ajutorul unor astfel de jocuri, specialitii
pot testa ipoteze referitoare la natura deciziilor pe care urmeaz s le adopte cu identificarea
efectelor probabile ale diverselor decizii. De aceea se poate afirma c jocul ofer posibilitatea
acumulrii de experien n problem, nainte ca procesul economic s se fi petrecut i permite
anticiparea acelor consecine referitoare la resurse.
Jocurile se pot clasifica dup anumite criterii i anume:
dup sfera de aciune sunt:
a. jocuri pentru ntreaga ntreprindere prin care se simuleaz funciile principale ale
ntreprinderii n aa fel nct participanii la joc s neleag legitile unitii economice n
ansamblu, n condiiile influenei reciproce dintre subsistemele interne sau dintre acestea i un
sistem exterior.
b. jocul funcional, se refer doar la o funcie specific a ntreprinderii analizate, participanii la
joc exprimmnd decizii n cadrul compartimentului care ndeplinete funcia simulat i pot
estima eventuale consecine pentru alte compartimente cu care acesta acioneaz n legtur
strns.
c. jocuri complexe. Acestea au ca scop analiza mai multor funcii ale ntreprinderii i relaiile
principale cu alte compartimente sau cu exteriorul. n acest tip de joc, particupanii trebuie s
estimeze implicaiile unei decizii adoptate ntr-un compartiment asupra altor compartimente ale
aceleiai ntreprinderi. Se evalueaz n acest caz efectele unor perturbaii asupra
compartimentului luat n studiu chiar dac aceste perturbaii au aprut n compartimente din
afar dar legate de cel studiat.
d. jocuri pentru alte zone de specialitate.
Dup elementul competiv, jocurile sunt:
a. jocuri concureniale n care fiecare participant adopt decizii n aa fel nct s-i depeasc
adversarul. Acestea pot fi jocuri independente i jocuri interdependente.
- jocurile interdependente au drept caracteristic faptul c succesul unui participant este
dependent de propriile decizii ct i de deciziile concureniale.
- jocurile independente se caracterizeaz prin aceea c fiecare juctor realizeaz mbuntirea
propriilor performane economice, fr a aciona asupra celorlali juctori. n cadrul coaliiilor de
juctori se consider c un joc este independent, atunci cnd juctorii din coaliie se ajut
reciproc.
b. jocurile cooperative presupun existena a doi parteneri care convin c n privina anumitor
clase de decizii i aciuni, acestea s nu fie ndreptate mpotriva intereselor celuilalt partener. n
economia de pia pentru anumite tipuri de produse, acetia i mpart piaa.
c. jocurile contra naturii au nevoie de un decident real sau o coaliie de decideni care se
coalizeaz mpotriva unui prtener fictiv, care este de fapt mediul ambiant.
Dup criteriul prelucrarea rezultatelor, jocurile sunt pe calculator sau manuale.
Dup scopul urmrit sunt jocurii de instruire, jocuri de ntreprindere sau pentru
fundamentarea deciziilor operative.
Jocurile de instruire permit celor care particip la ele s poat s adopte decizii optime n
condiiile unor situaii ipotetice, dar posibile n practica economic.
Jocuri de ntreprindere sau pentru fundamentarea deciziilor operative permit
specialitilor s adopte decizii pertinente n condiiile reale existente n ntreprinderele pe care le
conduc sau le organizeaz. Astfel de jocuri necesit utilizarea calculatorului electronic, ntruct
deciziile se adopt pe baza unui algoritm complex, care analizeaz efectele economice ale mai
multor soluii. n acest caz decidentul poate cunoate consecinele asupra performanelor
economice att ale soluiilor optime ct i ale soluiilor ineficiente.
Principalele etape de desfurare a unui joc de ntreprindere sunt urmtoarele:
Etapa de instruire a participanilor;
Adoptare deciziilor de ctre participani. n aceast etap exist un arbitru care
adopt deciziile considerate cele mai bune pentru participani. Arbitrul nu pune la dispoziia
juctorilor nici un algoritm pentru ca acetia s gseasc soluia cea mai bun. Astfel, juctorii
trebuie s adopte decizia fie pe baza competenei, fie pe baza unui algoritm euristic elaborat n
timpul participrii la joc, sau alegnd la ntmplare valori numerice ale parametrilor economici.
Se poate modifica algoritmul ales la urmtoarea iteraie. Dac juctorul adopt decizii la
ntmplare, el le poate perfeciona pe parcursul jocului, ajungnd fie la un algoritm, fie la o
procedur de cutare aleatoare, dar accelerat. Fiecare etap de adoptare a deciziilor constituie o
iteraie a jocului, care corespunde unei perioade de timp de obicei urmtoare. N, numrul maxim
de iteraii pentru un joc este stabilit n prima etap de arbitru. n timpul jocului , consilierii de
joc, precizeaz arbitrului perturbaiile care au avut loc n timpul n care juctorii au adoptat
decizii.
Arbitrul efectueaz calculele prin evaluare consecinelor aprute dup primirea de la
participani a deciziilor adoptate i a perturbaiilor de la consilieri, de obicei cu ajutorul unui
program pe calculator.
Arbitrul public o informare asupra rezultatelor obinute, n urma crora juctorii fac
la rndul lor o analiz rezultatelor. Se remarc faptul c n situaia n care numrul de iteraii nu
este suficient de mare, exist riscul ca unii juctori s obin rezultate bune din pur ntmplare.
Dup dezbaterea rezultatelor care s-au obinut i dup analiza regulilor aplicate, arbitrul creaz
condiii juctorilor pentru pregtire accelerat n adoptarea deciziilor.
Efectuarea unui test de continuare sau de ncetare a jocului de ctre arbitru. Testul
const n compararea iteraiei I la care se afl jocul cu numrul maxim N de iteraii. Dac I < N,
atunci jocul trece la iteraia urmtoatre I+1, iar dac I=N, atunci se trece la etapa urmtoare.
Se anun sfritul jocului i a rezultatelor finale. Arbitrul decide ncetarea jocului,
iar dup parcurgerea celor N iteraii se evalueaz rezultatele jocului. Pentru aceasta arbitrul
calculeaz funcii de performan care permit acordarea unui calificativ global fiecrui
participant la joc. n acest fel se face ordonarea participanilor la joc din punct de vedere al
aptitudinilor de conductori i organizatori.

Un model de simulare poate descrie doar caracteristicile i comportamentul sistemului n


diferitele etape ale funcionrii sale. Din variantele obinute se va alege cea mai bun alternativ,
adic aceea care prin experimentele aplicate efectului combinat al mai multor aciuni sau factori
se apropie cel mai mult de evoluia sistemului studiat.
Simularea nlocuiete n bun msur metodele de optimizare pentru rezolvarea
problemelor complexe. Simularea prezint avantaje deoarece modelul este obinut de obicei din
perspectiva decidentului; este unica metod din cadrul SIAD care se poate utiliza pentru
problemele nestructurate, surprinde complexitatea real a problemei i se poate aplica unor mari
diversiti de probleme manageriale.
Pentru simulare exist un soft relativ uor de utilizat, soft care implementeaz metoda
Monte Carlo (ca de exemplu, Excel). Acest proces de simulare prezint i dezavantaje precum
lipsa de garantare a obinerii soluiei optime ci a unei soluii mbuntite; modelul de simulare
este aplicat doar pentru o singur problem, neputnd fi generalizat.
2.7. Modelele predictive

Modelele predictive au ca scop anticiparea evoluiei viitoare a sistemului considerat n


funcie de evoluiile sale anterioare. Acest tip de modele se rezolv de obicei prin metode
statistice i evoluiile acestora.
Legtura dintre variabile este denumit corelaie, iar stabilirea tipului de legtur dintre
variabilele dependente de una sau mai multe variabile independente, n statistic, se numete
analiz de regresie.
Se cunoate c dependena dintre variabile poate fi liniar, exponenial sau ptratic, iar
pentru fiecare tip de dependen exist instrumente puse la dispoziie de statistic pentru a
determina elementele modelului de regresie aferent.
Pentru a alctui un model de regresie se va ine cont de urmtoarele etape: analiza pentru
identificarea dependenelor i a tipurilor de legturi pe care le exprim; specificarea prin care se
caut cea mai optim form de exprimare a variabilelor; estimarea parametrilor modelului;
testarea semnificaiei parametrilor estimai; validarea (verificarea) modelului; utilizarea
modelului n operaii de simulare i predicie.
Pentru regresia liniar simpl exist o singur variabil pentru care se face previziunea,
dependent de o singur alt variabil. Modelul este Y=f(x) i se observ c relaia dintre cele
dou variabile este liniar.
Pentru previzionarea variabilei Y se pot folosi una din urmtoarele metode: metoda
glisajului exponenial ce presupune previziunea evoluiilor viitoare pe baza celor trecute i a
estimrilor din trecut; metoda filtrajului adaptiv ce face o previziune pentru valorile variabilei
dependente n funcie de sumele ponderate a valorilor anterioare; metoda regresiei liniare simple
prin care se obine un model cauzal care pune n eviden dependena variabilei dependente de
variabila independent.
Acest model este sintetizat n urmtoarea manier: Y=mX+b+V unde m i b sunt
parametrii de regresie ce se vor determina prin metode statistice, iar V este factorul de
cuantificare al influenelor cauzelor nespecifice i se mai numete variabil de perturbaie.
Valoarea medie a lui V trebuie s fie 0, aceasta nsemnnd c influena factorilor perturbatori se
compenseaz reciproc.
Avnd n vedere valorile variabilei independente X i a parametrilor de regresie, se vor
putea estima valorile viitoare ale variabilelor dependente Z; metoda regresiei liniare multiple
care presupune existena dependenei de mai multe variabile. Aceast metod este mai apropiat
sistemelor decizionale, ntruct de cele mai multe ori variabila depinde de efectul mai multor
factori considerai laolalt. Acest model are urmtoarea form:
Y = b + mjXj + ... + mnXn
Pentru a stabili care este semnificaia influenelor variabilelor independente asupra lui Y
(variabil dependent) se fac o serie de teste statistice, cum ar fi calculul coeficientului de
determinaii R2, testarea determinaiei globale a ecuaiei de regresie (testul F), testarea
determinaiei fiecrei variabile (testul t) care la un loc se prezint ca o analiz dispersional.
Astfel, n concluzie, se poate afirma c rezultatele obinute se vor accepta numai n cazul n care
legtura liniar presupus ntre variabilele dependente i celelalte variabile este real. Softul
aferent unei astfel de metode este des utilizat precum SPSS.
Acesta este un sistem automat de analiz a datelor de marketing (Statistical Package for
Social Sciences). De asemenea, procesorul de tabele Excel conine funcii statistice care permit
efectuarea previziunilor bazate pe tipuri de regresie i se poate astfel realiza i analiza statistic a
datelor.
Pentru a lucra cu metode de previziune este bine de tiut c trebuie parcurse o serie de
etape: formularea i nelegerea coninutului problemei ce presupune ca managerul sau
decidentul s defineasc n termeni ct mai apropiai de realitate problema, aceasta incluznd
variabilele care trebuie explicitate i a cror valori vor face obiectul previziunii.
n aceast etap se descrie situaia decizional, se identific variabila sau variabilele care
vor constitui obiectul prediciei ca i variabilele dependente de acestea; selectarea indicatorilor
economici care presupune a se gsi alturi de variabilele independente i acei factori suplimentari
care influeneaz variabila dependent, factori ce vor trebui inclui n ecuaia de regresie; analiza
matricei de corelaie simpl care se face pentru a alege variabilele care trebuie incluse n ecuaia
de regresie.
Specific domeniului economic este fenomenul de multicoliniaritate adic nivelul nalt de
interdependen ntre variabile diverse. La ncheierea acestei etape se vor reine doar trei sau
patru ecuaii de regresie care vor fi ulterior analizate; alegerea unei ecuaii de regresie dintre
cele reinute anterior.
De obicei calculatorul va determina coeficienii de regresie i elementele care permit
testarea semnificaiei acestora. Se vor reine ecuaiile semnificative i se va ncerca ridicarea
progresiv a valorii coeficientului de corelaie R2 prin introducerea unor noi variabile
independente.
Dup fiecare iteraie de mrire progresiv a acestui coeficient se vor verifica testele de
semnificaie. verificarea corectitudinii condiiilor de regresie; pregtirea previziunii care
presupune stabilirea unui interval de ncredere pentru previziunile individuale i ce precizie are
fiecare variabil independent.
Predicia are un caracter limitat fa de previziune (prognoz) care nseamn depirea
cadrului statistic permis de modelele de regresie.
Dezavantajul principal al acestor metode statistice l constituie volumul mare de date
necesar i costul ridicat al colectrii acestora. Acest dezavantaj este remediat de apariia noilor
tehnologii de analiz i agregare a datelor (OLAP).

2.8. Programarea euristic

Aceast metod conduce la generarea unei soluii aproximate pentru probleme complexe
de obicei nestructurate. Pentru astfel de probleme nu se poate descrie un algoritm care nu poate
oferi soluii optime ntr-un numr finit de pai.
Programarea euristic se poate utiliza i pentru probleme complexe structurale ntruct
poate conduce la opiunea mai rapid a soluiilor fa de un algoritm de optimizare (de exemplu
sunt problemele combinatoriale cu extrem de multe soluii posibile).
De remarcat este faptul c procesul decizional se caracterizeaz printr-o formalizare a
spaiului strilor i presupune o explorare atent i pertinent a acestuia. n cazul acestei
programri euristice, spaiul de rezolvare a problemelor implic: spaiul strilor, spaiul
operatorilor, starea iniial, starea sau strile finale precum i informaia asociat fiecrei stri.
Soluia final obinut prin programarea eurstic poate fi un eec sau un succes.
n utilizarea programrii euristice se are n vedere evaluarea rezultatelor care va ine cont
de calea raionamentului, de paii de parcurs ulterior precum i de experiena acumulat n
probleme similare i nu n ultimul rnd i de model.
Evaluarea rezultatelor se realizeaz cu ajutorul funciei de evaluare care depinde de stare
i de informaiile referitoare la acea stare. Starea va fi acceptat dac funcia de evaluare va
depi un anumit prag prestabilit sau dac este mai bun dect valorile strilor n ateptare.
Euristicile se pot grupa n: cantitative dac sunt n baza de modele a unui sistem
informatic de asistare a deciziei; calitative dac furnizeaz cunotine pentru un sistem expert.
Programarea euristic se aplic n cazul n care datele de care se dispune pentru o
problem complex sunt insuficiente sau are un grad mare de inexactitate.
Gradul de complexitate al problemei nu permite utilizarea modelelor de optimizare, nu
exist soluie algoritmic iar modelul de simulare simplific inadmisibil de mult problema i
trebuie obinut o soluie rapid.
Acest tip de programare are o serie de avantaje dintre care se enumer: sunt metode uor
de aplicat i implementat, produc mai multe soluii acceptabile, se poate face o msurare
empiric sau teoretic a calitii soluiei obinute.
Totui prezint i dezavantaje referitoare la garania obinerii unei soluii optime, iar n
cazul n care se fac alegeri secveniale ntr-o decizie, exist riscul de a nu anticipa corect
consecinele alegerilor fcute. Toate aceste riscuri sunt de fapt asumate de decident n momentul
n care a ales ca rezolvare programare euristic.

2.9. Metoda utilitii globale maxime

Problemele de asistare a deciziei din realitatea socio-economic sunt probleme


multicriteriale. Reducerea rezolvrii unei probleme de asistare a deciziei la un singur criteriu se
face, de cele mai multe ori, cu scop simplificator, de lmurire a unor aspecte unilaterale. n
universul socio-economic de modelat, problemele de asistare a deciziei economice sunt generate
de procesele de decizie multicriteriale. Pentru msurarea consecinelor diferitelor alternative
luate n considerare n momentul lurii deciziei, s-a introdus o unitate de msur comun
denumit utilitate. Prin intermediul funciei de utilitate, se asociaz fiecrei alternative de decizie
o valoare numeric real.
Este evident c o calitate ridicat a deciziei economice, fundamentat pe baza acestei
metode, se va realiza dac utilitile asociate vor fi ct mai obiective cu putin (aici intervine
rolul important al experilor domeniului).
Problemele de optimizare multicriterial scot n eviden relaii de tip local-global, n
sensul c dup rezolvarea separat a fiecrei probleme unicriteriale (cu un singur criteriu), se
rezolv problema multicriterial prin luarea n consideraie a ntregului ansamblu de criterii.
Soluiile obinute la rezolvarea problemelor decizionale multicriteriale sunt soluii
suboptimale n raport cu variantele monocriteriale. De cele mai multe ori, n practica economic,
aceste soluii suboptimale se dovedesc satisfctoare.
n optimizarea multicriterial, exist dou categorii de probleme: optimizare multiatribut
i optimizare multiobiectiv.
O problem de optimizare multiatribut prezint o mulime finit a soluiilor posibile, cu
variante ce au asociate atribute multiple (de natur numeric sau nenumeric).
O problem de optimizare multiobiectiv prezint o mulime infinit a soluiilor admisibile
i folosete funcia-obiectiv drept criteriu de optimizare (care se maximizeaz sau minimizeaz).
Utilitatea global a unui proiect se definete ca suma produselor ntre elementele
matricei utilitilor (reprezentate de coloana corespunztoare proiectului) i coeficienii de
utilitate considerai pentru fiecare indicator. Proiectul care se selecteaz este asociat cu utilitatea
global maxim. n metoda utilitii globale maxime, se construiete, mai nti, matricea
utilitilor cu elementele (aij), U=(aij), in, jm. n cazul rezolvrii problemei cu criteriul de
maxim, se folosete relaia:
a ai min
aij = i ,
ai max ai min
unde semnificaia notaiilor este urmtoarea:
ai=valoarea indicatorului i asociat proiectului j; ai max=valoarea maxim a indicatorului i;
ai min=valoarea minim a indicatorului i.
n cazul rezolvrii problemei cu criteriul de minim, relaia similar este:
a ai
aij = i max .
ai max ai min

2.10. Sistemul de gestiune a modelelor


Sistemul de gestiune a modelelor (SGM) are de fapt faciliti asemntoare cu cele ale
unui sistem de gestiune a bazelor de date (SGBD).
Facilitile oferite de un SGM se pot grupa n cteva categorii: stocarea modelelor;
utilizarea modelelor deja existente; faciliti de acces i de regsire a modelelor; faciliti de
mentabilitate a modelelor existente cu posibiliti de pstrare a soluiilor; construirea unor
modele noi pe baza celor existente; flexibilitate, care const n trecerea rapid de la o abordare la
alta; consistena care d posibilitatea ca acelai model i aceleai date s fie accesate de mai
muli utilizatori.
Aceste faciliti definesc i o serie de cerine pentru gestionarul de modele cum ar fi:
asigurarea comunicrii i schimbul de date dintre modele n momentul n care sunt utilizate ntr-
un anume context, asigurarea analizei i interpretrii rezultatelor obinute n urma utilizrii unui
model standard.
Din punct de vedere al limbajelor de modelare, care asist utilizatorul n gestionarea
modelelor, acestea sunt destinate pentru programare matematic: Lingo, GAMS, AMPL.
n procesul de modelare este utilizat i procesoarul de tabele, Excel. Excel are ncorporate
pachete de programe pentru structurarea i rezolvarea unor tipuri de modele pentru domeniul
economic, matematic. Procesorul de tabele are ncorporate o serie de categorii de funcii
(matematice, statistice, financiare, de previziune) care pot rezolva probleme de optimizare
(programare liniar) de simulare sau de cutare euristic a unor soluii. El poate oferi la un nivel
sczut i gestionarea unei baze de date sau importul de date.

3. SIAD-URI BAZATE PE ANALIZA I SINTEZA DATELOR


3.1. Problematica general

Modul n care datele sunt retransformate n informaii i apoi n cunotine este de fapt un
proces de valorificare a datelor care se realizeaz prin sintetizarea i analiza lor i, n final, prin
interpretare. Procesul de sintetizare a datelor presupune centralizarea lor, avnd n vedere
diverse criterii i este utilizat n crearea situaiilor de sintez necesare informrii managerilor ca
suport pentru luarea deciziilor. Soluiile oferite de informatic pentru procesul de sintetizare a
datelor sunt: programe specifice i dedicate; interogri care dau posibilitatea gruprii datelor
dup criterii stabilite i ofer funcii pentru domeniile astfel create; funciile de total i subtotal
oferite de generatoarele de rapoarte care permit indicarea ierarhiilor criteriilor de grupare.
n ultimul timp, problema centralizrii datelor a rmas aceeai, ns volumul de date de
explorat este imens, ceea ce duce la faptul ca metodele clasice s devin ineficiente. De aceea
ctig tot mai mult teren tehnologii moderne ca Data Warehousing (depozitarea datelor) i
OLAP (On-Line Analytical Processing) pe msur ce suporturile soft devin suport de date pentru
sistemele tranzacionale.
Depozitele de date (Data Warehouse) ajut la:
- mbuntirea valorii performanelor organizaiei economice cu management centrat pe
client, printr-o mai bun nelegere a nevoilor clientului;
- analiza percepiilor clienilor asupra valorii produselor i serviciilor care sunt oferite sau
care ar putea fi oferite n viitor;
- integrarea marketingului cu tehnologiile informaiei i ale comunicaiilor (IT&C), cu
sursele de date operaionale, obinndu-se depozitul de date de tip ntreprindere, EDW
(Enterprise Data Warehouse);
- contribuie la creterea valorii strategice a organizaiei economice.
ntr-un cadru mai larg, se aplic noul concept de cercetare (inteligent) a afacerilor, BI
(Business Intellgence) ce devine o component critic a ansamblului de operaiuni zilnice ale
organizaiei economice, astfel nct se dezvolt depozite de date n timp real ce asigur
utlizatorilor finali actualizri rapide i emiterea unor semnale de alarm (alerte) generate din
cadrul sistemelor tranzacionale (TPS). Depozitele de date n timp real, RTDW (Real-Time Data
Warehouse), i BI sprijin ndeplinirea planului de afaceri al organizaiei economice. Aplicaiile
RTDW ale organizaiei economice cuprind:
- managementul i contabilitatea veniturilor i cheltuielilor;
- managementul relaiilor cu clienii, CRM (Customer Relationship Management);
- operaiuni i bilanuri la nivel de echip;
- managementul securitii informatice;
- managementul activitilor specifice ndeplinirii obiectivelor organizaiei economice.
Pentru administrarea eficient a afacerilor sunt necesare RTDW, SIAD (DSS) i
instrumente BI.
OLAP reprezint o categorie de tehnologie software care permite analitilor, managerilor
i persoanelor de execuie din organizaia economic s beneficieze de un acces rapid, consistent
i interactiv la depozitul de date; acest lucru se obine printr-o varietate de vizualizri posibile
ale informaiilor ce au fost transformate din datele operaionale i reflect dimensionalitatea real
a organizaiei din punctul de vedere al utilizatorului. Ca urmare, prin tehnologiile de centralizare
se transform datele n informaii de sintez i se asigur analiza lor. Analiza datelor presupune a
gsi relaii ntre datele sintetizate cum ar fi: asocieri, corelaii structurale, cauzale sau
funcionale. Funcionalitatea OLAP este caracterizat de o analiz dinamic multidimensional
dinamic a datelor consolidate ale organizaiei economice ce sprijin activitile analitice i de
cutare i regsire a informaiilor (prin navigare sau browsing) desfurate de utlizatorul final:
calcule i modele aplicate dimensiunilor transversale prin intermediul ierarhiilor sau
membrilor;
analize asupra tendinelor din perioade de timp secveniale;
submulimi obinute prin secionare (slicing) pentru vizualizrile prezentate pe ecranul
monitorului calculatorului;
efectuarea unor operaiuni de drill-down pentru adncirea nivelurilor de consolidare a
datelor;
efectuarea operaiunii de rotaie (rotation) pentru obinerea unor noi comparaii
dimensionale n zona de vizualizare a datelor.
O form simpl de analiz a datelor este compararea datelor cu date similare, comparare
care se face pstrnd toate criteriile identice, doar unul singur avnd valori diferite. Comparare se
face ntre seturi de date comparabile, iar tehnologiile de comparaie sunt dotate cu tehnici de
observare pentru semnalizarea tiparelor, corelaiilor, asocierilor prin similitudini sau sesizeaz
abateri, excepii. Informatica a venit n ntmpinarea acestor cerine cu tehnicile de prezentare
grafic care transform informaia cantitativ n informaie calitativ. Au aprut i tehnici de
observare analitic a datelor care au la baz teorii matematice prin care datele reale sunt
comparate cu date teoretice produse de un model ipotetic.
Dezvoltarea tehnicilor de observare a dus la apariia tehnicilor de observare automat
bazate pe data-driven. Rezultatul unor astfel de tehnici se regsesc ntr-un model cu caracter
general. Tehnicile de observare analitic a datelor se regsesc ntr-o tehnologie modern
denumit Data Mining (n traducere liber Mineritul datelor).
Rezultatul procesului de observare analitic este obinerea unor tipare, corelaii i uneori
modele din care se pot deduce tendine sau se poate previziona cu o anumit probabilitate cum
vor arta datele pe o perioad ulterioar. Modelul permite interpretarea datelor, ce reprezint un
proces cognitiv cu o apreciere general a situaiei, i identific probleme, oportuniti sau
poteniale cauze de eec.
De remarcat este faptul c interpretarea datelor duce la apariia de cunotine noi care se
vor cumula la cele deja existente. Instrumentele soft clasice pentru asistarea deciziei au avut ca
principal scop asigurarea tehnicilor de analiz, optimizare i simulare precum i reprezentarea
grafic a rezultatelor. Dintre aceste instrumente se amintesc procesoarele de tabele Lotus i Excel
orientate pe volume mici de date, cele referitoare la sistemele de gestiune a bazelor de date
Access, Visual Foxpro, capabile s lucreze cu volume mari de date cu structur uniform.
Principalul dezavantaj al acestor instrumente clasice este c opereaz numai asupra acelor date
care au o structur prestabilit i provin dintr-o surs unic. Noile sisteme de asistare a deciziei
folosesc tehnici speciale de comasare a datelor stocate n structuri neuniforme, pentru a utiliza
informaii implicite care nu sunt specificate n datele existente. Suporturile software de asistare a
deciziei ofer utilizatorilor o serie de faciliti cum ar fi: interogarea n limbaj natural, accesul la
modele conceptuale, sisteme de gestiune OLAP i servicii de integrare cu alte suporturi soft.

3.2. Depozite de date (Data Warehouse)


3.2.1. Definirea conceptului de depozit de date. Caracteristicile depozitelor de date

Depozitul de date (Data Warehouse) este un ansamblu de date special produse pentru a
sprijini luarea deciziei manageriale. Depozitul de date conine date istorice i curente de interes
potenial pentru manageri n cadrul organizaiei economice. n mod obinuit, datele sunt
structurate pentru a putea fi oricnd disponibile pentru activiti de prelucrare analitic online
(OLAP), Data Mining, interogri, rapoarte, alte aplicaii pentru asistarea lurii deciziei8.
Trebuie precizat c noiunea de depozit de date (Data Warehouse) se refer la rezultatul
final date memorate pe suport informaional, date ce prezint caracteristici distincte fa de
bazele de date tranzacionale, n timp ce noiunea de depozitarea datelor (Data Warehousing)
privete ntregul proces de creare, meninere i exploatare a unui depozit de date.
Depozitele de date (Data Warehouse) reprezint din perspectiva metodologic, pur didactic,
o ramur a informaticii aplicate n domeniul sistemelor informatice pentru asistarea deciziei,
SIAD sau DSS, prin intermediul creia se asigur:
1) administrarea complex a afacerilor;
2) accesarea din exterior, oportun i eficace, a informaiilor i cunotinelor necesare
afacerilor (business information and business knowledge).
Procesul de depozitare a datelor (Data Warehousing) conine urmtoarele componente majore
(fig.3.1):
1) Sursele de date;
2) Extragerea, transformarea i ncrcarea datelor din bazele de date operaionale, ETL
(Extraction, Transformation and Load);
3) Depozitul de date de tip ntreprindere, EDW (Enterprise Data Warehouse);

8
Turban E., Aronson, J.E., Liang, T.P., Sharda, R. - Decision Support and Business Intelligence Systems, Pearson
Prentice Hall, New Jersey, 2007.
4) Metadatele (programe soft pentru date i reguli pentru organizarea rezumatelor de date.
Sunt uor de indexat i regsit, inclusiv prin instrumente Web);
5) Instrumente de tip middleware, ce asigur accesul la depozitul de date (OLAP, Data
Mining, instrumente soft de ntocmire a rapoartelor i de vizualizare a datelor).

Necesitatea depozitelor de date este dat de volumul imens de date acumulat n timp de
organizaiile economice. Integrarea acestor date istorice ale organizaiei ntr-o structur care s
stea la baza lurii deciziilor a devenit principala preocupare a noilor tehnologii informatice.
Depozitele de date integreaz diferitele tipuri de baze de date din organizaie, asigurnd date
oportune i relevante (n timp real sau aproape de rspuns n timp real) pentru sistemele
informatice pentru asistarea deciziei manageriale, SIAD. Implementarea depozitelor de date
confer valoare strategic organizaiei economice. De asemenea, depozitele de date contribuie la
reducerea costurilor. De exemplu, n primul an de operare a depozitelor de date, aceast reducere
a costurilor este similar cu investiiile n sistem pe timp de ase ani9.

APLICAII:
Rafturi
de date OLAP
EDW Interfee de
aplicaii Web
middleware
Data Mining

Instrumente de
interogare
ETL relaionale

Instrumente de
SURSE DE DATE raportare
(OLTP, externe, motenite
de la sistemele informatice vechi)

Vizualizare
rezultate

Fig.3.1. Conceptul de depozit de date (Data Warehouse)

9
Turban E., op.cit.
Sistemele de asistare a deciziei care au la baz analiza i sinteza datelor realizeaz
comasarea, sistematizarea, corelarea i gruparea datelor pentru a obine informaii care s
reliefeze factorii care influeneaz pozitiv sau negativ performanele companiei. Ca urmare a
obinerii unor astfel de informaii se poate adopta o strategie de ameliorare a factorilor cu
influen negativ asupra performanelor organizaiei economice.
Obinerea rezultatelor, sub form de rapoarte care conin informaii utile factorilor de
decizie sunt ntr-o form accesibil i sunt rezultatul tehnicilor speciale de explorare a masivelor
de date. Aceste tehnici conduc la evidenierea unor corelaii ntre date, pot face estimri i
prognoze precum i atenionri ale managerilor asupra unor disfuncii.
Caracteristicile fundamentale ale depozitelor de date (Inmon 2005, Tuban 2007) sunt
urmtoarele:
a) orientarea pe subiecte (de exemplu, produse, clieni, vnzri etc.) coninnd numai informaia
relevant pentru procesul de decizie managerial; prin aceasta, managerii, n calitate de
utilizatori finali, calculeaz sau evalueaz performanele obinute n afaceri, formulnd i
explicaiile justificative pentru aceste performane.
b) integrarea, nemijlocit legat de caracteristica orientarea pe subiecte; datele provenite din
surse diverse sunt dispuse ntr-un format consistent, eliminndu-se astfel conflictele i
discrepanele ce pot apare datorit unitilor de msur diferite. Un depozit de date se presupune
c este total integrat.
c) nonvolatilitatea: odat ce datele au fost introduse (scrise) ntr-un depozit de date,
utilizatorii nu mai pot modifica sau actualiza datele. Un depozit de date este proiectat din
perspectiva utilizatorului, n mod exclusiv, numai pentru acces la date.
d) variabilitatea n timp (serii de timp). Un depozit de date menine datele istorice ale
organizaiei economice. Datele nu trebuie s asigure, n mod necesar, starea curent (excepie
fac doar sistemele n timp real). Pe baza depozitelor de date sunt detectate trenduri, deviaii,
relaii pe termen lung pentru comparaii i prognoze ce conduc la luarea deciziei. Pentru fiecare
depozit de date exist o calitate temporal. Timpul reprezint una din dimensiunile importante pe
care trebuie s le posede toate depozitele de date. Datele pentru analize ce provin din surse
multiple conin referine de timp multiple (de exemplu, vizualizri zilnice, sptmnale, lunare
etc.).
e) includerea aplicaiilor bazate pe Web.
f) utilizarea arhitecturii client/server.
g) utilizarea structurilor de baze de date relaionale sau de baze de date multidimensionale.
h) folosirea metadatelor (date despre date).
Caracteristicile depozitelor de date rezult din faptul c ele pot nmagazina volume mari
de date preluate din arhive i/sau din bazele de date ale aplicaiilor informatice specifice
activitii curente a ntreprinderii (sunt volume de ordin 1012 terabytes), precum i din surse
externe organizaiei economice. Exploatarea acestor volume uriae de date, provenind de la surse
de date diverse, este asigurat de existena unor motoare speciale care dau posibilitatea ca
masivele s poat fi interogate, precum i existena unor servicii speciale de analiz on-line a
datelor (OLAP). Suporturile software susin performanele acestor servicii prin transformarea
datelor, corelarea i completarea lor precum i prin crearea dicionarului de date, toate acestea
asigurnd accesul la structurile primare. Datele sunt extrase din baze de date heterogene create
de sistemele informatice deja existente n organizaie pe diversele platforme hard i soft.
Se poate remarca faptul c datele sunt introduse nu la ntmplare ci sub controlul unor
aplicaii i al SGBD-ului. Acestea asigur prin serviciile de integritate, stocarea i lucrul n
condiii de siguran maxim. Datele care formeaz suportul pentru tranzaciile primare sunt
apoi prelucrate pentru a se obine informaiile de sintez necesare planificrii i lurii deciziilor
i sunt tratate de instrumentele SGBD.
Deoarece exploatarea unui volum enorm de date, pentru a obine diverse rapoarte, este
asigurat de integritatea i coerena bazei de date, reuniunea tuturor acestor date duce la
exploatarea unui mare numr de tabele, la crearea unor multiple legturi virtuale i tabele
temporare. Acest volum mare de munc conduce la principalul inconvenient al depozitelor de
date i anume timpul mare necesar exploatrii lor. Un alt inconvenient l constituie i
aglomerarea motorului bazei de date cu task-uri de centralizare care ncetinete astfel
tranzaciile curente.
Astfel a aprut necesitatea stocrii datelor care sunt dedicate planificrii i deciziilor
strategice ntr-un sistem diferit de sistemul operaional n aa fel nct funcionarea celor dou
sisteme s se fac fr inconveniente. n depozitul de date se pot stoca att arhive de date privind
activitatea anterioar ct i date referitoare la tranzacii ulterioare fr ca utilizatorul s poat
interveni.
Depozitele de date sunt o concentrare de date care organizeaz, consolideaz i
centralizeaz datele din surse eterogene i care vor constitui baza procesrilor analitice att de
necesare proceselor de decizie. Depozitul de date se construiete progresiv adic el permite
completri i dezvoltri ulterioare. Pentru a se asigura o calitate sporit a datelor acestea sunt
supuse unui proces de curire i transformare, menionnd i maniera de obinere a unor date
colectate pe baza celor existente, acest proces ducnd la micorarea timpului cerut pentru
obinerea unor rapoarte finale. n depozitele de date se face transformarea codurilor n date
explicite precum i integrarea datelor din nomenclatoare n datele referitoare la tranzacii. Acesta
este numit i proces de denormalizare i este caracterizat de faptul c nu modific integritatea
datelor i grbete procesul de regsire. ntr-un depozit de date redundana datelor este permis.
Literatura de specialitate prezint mai multe arhitecturi de depozite de date, grupate n
dou categorii: depozitele de date de tip ntreprindere, EDW (Enterprise Data Warehouse) i
rafturi de date (Data Marts). Un exemplu de arhitectur de depozit de date bazat pe Web
(Turban, 2007) este prezentat n fig.3.2. Aceast arhitectur pe 3-entiti (three-tiers) cuprinde
clientul, serverul Web i serverul de aplicaie. Pe partea de client exist o conexiune Internet i
un navigator Web bazat pe o interfa grafic de tip GUI (Graphical User Interface). Mediul de
comunicaie dintre client (atenie: aici client are sensul de staie de lucru Work Station - pentru
utilizatorul final) i servere este de tipul Internet/Intranet/Extranet. Pe partea de server se
folosete un server Web pentru gestionarea fluxurilor informaionale dintre client i server,
urmat de serverul de aplicaie i depozitul de date.
Navigator Server Web Depozit de
Web date

1. Client
2. Server Web 3.Server de aplicaie

Pagini Web Server de


aplicaie

Fig.3.2 Arhitectura unui depozit de date bazat pe Web

O arhitectur generalizat a depozitului de date (Thalheim i Lenz, 2005) este prezentat


n fig.3.3. Aceast arhitectur are n vedere aplicarea triadei stocare-prelucrare-prezentare, cu
sistemul de management al coninutului, CMS (Content Management System) ca element central
al prelucrrii datelor.
Sistemul de management al coninutului, CMS, reprezint n exen un sistem informatic
folosit pentru a gestiona coninutul unui site Web (Web Content Management). Prin extensie,
CMS se refer i la depozitele de date i rafturile de date. Coninutul gestionat de CMS cuprinde
fiiere, imagini media, fiiere audio, documente electronice, coninut Web. CMS poate, de
asemenea, s fie folosit la fel de bine n calitate de arhiv electronic pentru forme non-
proprietare ale fiierelor10.
De regul, un CMS const din dou elemente de baz: aplicaia de management al
coninutului, CMA (Content Management Application) i aplicaia de livrare a coninutului,
CDA (Content Delivery Application)11. Un CMS indexeaz toate datele din interiorul sistemului
informatic integrat al organizaiei economice. Prin CMS sunt folosite abloanele sau seturile de
abloane (templates) aprobate de managementul organizaiei, ca i ghidurile de lucru (wizards) i
alte instrumente pentru crearea i modificarea coninutului Web.
Prin caracteristica de gestionare a formatelor documentelor, CMS asigur lucrul cu
formate de documente vechi (motenite), a documentelor pe hrtie scanate ce pot fi convertite n

10
www.wikipedia.com
11
searchsoa.target.com
format HTML sau PDF (Portable Document Format). Prin CMS se asigur actualizarea cu
ultima versiune a unui document sau restaurarea unui document n versiunea precedent.

Instrumente Sistem de Extractoare


Date de import- management de date
OLTP export
al Data
date
(nivel coninutului, Mining
micro) CMS (nivel macro)
Date
Sistem OLAP/DW
externe

Utilizator Unilizator Utilizator


Date al unitii ESS/DSS
motenite anonim
de afaceri

Fig.3.3 Arhitectura generalizat a depozitului de date (Thalheim i Lenz)

Decizie de alegere a unei arhitecturi de depozit de date este influenat de mai muli
factori, dintre care se menioneaz:
- cerinele de informaie ale managementului de vrf (top-management);
- interdependenele informaionale existente ntre departamentele i entitile funcionale
ale organizaiei economice;
- gradul de limitare a resurselor organizaiei economice;
- existena compatibilitii cu sistemele informatice aflate deja n exploatare n organizaie;
- motivaia profund a angajailor n dezvoltarea unui depozit de date.
Integrarea datelor ntr-un depozit de date conine trei procese majore:
a) accesul la date;
b) realizarea federaiei de date;
c) reflectarea oportun n depozitul de date a modificrilor semnificative ale datelor
provenite din sursele de date de tip ntreprindere.
Exist mai multe tehnologii de integrare a datelor i metadatelor n depozit de date:
1) integrarea aplicaiilor de tip ntreprindere, EAI (Enterprise Application Integration);
2) arhitectura orientat pe servicii, SOA (Service-Oriented Architecture);
3) extragerea, transformarea i ncrcarea datelor n depozitul de date, ETL (Extraction,
Transformation and Load);
4) integrarea informaiilor de tip ntreprindere, EII (Enterprise Information Integration).
Integrarea aplicaiilor de tip tip ntreprindere, EAI (Enterprise Application Integration)
asigur modalitatea unitar de preluare a datelor din surse diverse i stocarea lor n depozitul de
date de tip ntreprindere, DEW. Aceast integrare a aplicaiilor de tip ntreprindere se realizeaz
la nivelul interfeei de programare a aplicaiei, API (Application Programming Interface). EAI
este combinat cu arhitectura orientat pe servicii, SOA (Service-Oriented Atchitecture) care
estre focalizat pe un ansamblu coerent de procese de afaceri orientate pe servicii Web.
Extragerea, transformarea i ncrcarea datelor n depozitul de date, ETL (Extraction,
Transformation and Load) reprezint componenta integral a oricrui proiect centrat pe
organizarea, stocarea i prelucrarea datelor, aa cum este depozitarea datelor (Data
Warehousing). Aceast component ETL consum circa 70% din perioada de lucru la un proiect
centrat pe date12.
Extragerea datelor nseamn citirea datelor destinate depozitului de date din una sau mai
multe baze de date.
Transformarea datelor reprezint conversia datelor extrase din forma iniial n forma
standard necesar pentru stocarea n depozitul de date sau n alte baze de date cu care depozitul
de date lucreaz direct.
ncrcarea datelor nseamn stocarea datelor, anterior transformate n forma standard,
curate i rafinate, n depozitul de date.
Pot constitui surse de date relevante pentru depozitul de date (raftul de date): baze de
date tranzacionale (provenite din sistemul informatic de procesare a tranzaciilor, TPS), baze de
date provenite din aplicaii ERP, din aplicaii CRM, din tabele Excel (ntr-un cadru mai larg, din
baze de date specifice OAS), din baze de cunotine specifice KWS, din iruri de mesaje, din
fiiere externe etc.
Datele stocate n depozitul de date sunt conforme (prin forma standard dobndit prin
intermediul procesului ETL) cu regulile de afaceri ce definesc modul de folosire a datelor
stocate, cu regulile de ntcomire a rezumatelor (sintezelor, rapoartelor), cu regulile de
standardizare a atributelor codificate, cu regulile de efectuare a calculelor. Toate aceste reguli
sunt memorate ntr-o baz de metadate i sunt aplicate unitar n ntreg depozitul de date.
Turban (2007) difereniaz trei tipuri principale de depozite de date: rafturile de date,
DM (Data Marts), memoriile-tampon de date operaionale, ODS (Operational Data Stores) i
depozitele de date de tip ntreprindere, EDW (Enterprise Data Warehouse).

3.2.2. Rafturile de date

Aa cum s-a artat n primul capitol al lucrrii, organizaia economic este structurat pe
departamente i entiti funcionale, figurate ca domenii de gestiune ale organizaiei economice.
La nivelul acestor departamente i entiti funcionale, datele ce prezint caracteristicile
prezentate n paragraful anterior sunt depuse n rafturi de date, DM (Data Marts). n unele
lucrri, noiunea romneasc asociat lui Data Marts este de magazie de date, Altfel exprimat,

12
Turban, E., Op.cit.
dac depozitele de date (Data Warehouse) combin baze de date la nivelul ntregii organizaii
economice (adic la nivelul sistemului informatic integrat al organizaiei economice), n schimb
rafturile de date cu dimensiuni mai mici dect depozitele de date, sunt destinate unui anumit
departament al organizaiei economice sau unui anumit subiect definit la dorina utilizatorului
final.
Utilizarea magaziilor sau rafturilor de date (Data Marts) conduce la creterea
performanelor n exploatare. Aceste depozite de date se construiesc de obicei cu tehnologii
relaionale.
Majoritatea rafturilor de date sunt rafturi de date dependente (adic sunt generate direct
din depozitul de date). Exist, ns, i rafturi de date independente de depozitul de date al
organizaiei ce sunt realizate special pentru o unitate strategic de afaceri, SBU (Strategic
Business Unit) i care nu folosesc date din depozitul de date al organizaiei economice. Raftul de
date independent poate constitui o alternativ low cost pentru firmele care nu-i pot permite
achiziionarea, meninerea i exploatarea unui depozit de date.

3.2.3. Memorii-tampon de date operaionale

ntre bazele de date operaionale (tranzacionale) de pe nivelul operaional al


organizaiei economice i depozitele de date de pe nivelul de management mediu organizaional
se pot constitui memorii-tampon de date operaionale, ODS (Operational Data Stores).
Memoriile-tampon de date operaionale servesc, de exemplu, pentru realizarea i
utilizarea fiierelor cu informaii despre client, CIF (Customer Information File) ce pot fi
actualizate n funcie de evoluia afacerii respective. Ca urmare, memoriile-tampon de date
operaionale servesc pentru asistarea deciziei pe termen scurt, n special n aplicaiile cu puncte
critice.
Memoriile-tampon de date operaionale stocheaz cele mai recente date referitoare la
subiectul considerat, date ce provin din surse multiple. Datele din memoriile-tampon de date
operaionale sunt date din surse diverse ce au fost supuse unui proces de extragere, transformare
i ncrcare, ETL (Extraction, Transformation and Load), similar cu procesul de la depozitele de
date. Cnd datele operaionale sunt analizate multidimensional, memoriile-tampon de date
operaionale devin rafturi de date operaionale (Operational Marts sau Oper Marts)13.

3.2.4. Depozite de date de tip ntreprindere

Un depozit de date de tip ntreprindere, EDW (Enterprise Data Warehouse) este un


depozit de date integrat pe scar larg, cu un nvolum de date foarte mare, care se folosete la
nivelurile de management mediu i strategic pentru asistarea lurii deciziei.

13
Turban, E., 2007, Op.cit.
EDW utilizeaz date n format standard ce provin de la surse diverse. Datele din EDW
sunt folosite ca date de intrare pentru majoritatea tipurilor de sisteme informatice pentru asistarea
deciziei economice, cum sunt sistemele informatice pentru managementul relaiilor cu clienii,
CRM (Customer Relationship Management), sistemele informatice pentru managementul
lanului de aprovizionare, SCM (Supply Chain Management), sistemele informatice pentru
managementul performanelor afacerilor, BPM (Business Performance Management), sistemele
informatice pentru managementul ciclului de via al produselor, PLM (Product Lifecycle
Mangement), sistemele informatice pentru monitorizarea activitilor afacerilor, BAM (Business
Activity Monitoring), sistemele (aplicaiile) informatice pentru managementul veniturilor,
sistemele informatice pentru automatizarea lucrrilor de birou, OAS (Office Automation
Systems), sistemul informatic de lucru cu cunotine, KWS (Knowledge Work Management)14
etc.

3.2.5 Diferenierea depozitului de date de baza de date

Diferenele dintre depozitul de date i baza de date sunt urmtoarele:


a) datele coninute de un sistem de prelucrare a tranzaciilor, OLTP (On-Line Transaction
Processing) sunt de tip operaional, iar datele coninute de un depozit de date sunt specifice
asistrii deciziilor, sunt date centralizate sau derivate din date operaionale, nu se modific n
timp i sunt destinate utilizatorilor finali;
b) n cazul sistemelor tranzacionale, performanele se refer la integritate, confidenialitate,
siguran i timp de rspuns ntruct un numr mare de utilizatori introduc date n sistem, n
timp ce n cazul SIAD (deci a depozitelor de date) numrul de utilizatori finali (manageri) este
foarte mic. Astfel i securitatea i sigurana n exploatare nu sunt supuse unor riscuri majore,
procedurile de salvare i restaurare fiind mai puin utilizate dect n cazul sistemelor
tranzacionale.
c) datele procesate n sistemele tranzacionale sunt n seturi relativ mici, introduse recent i
compact, astfel nct prelucrarea se face destul de rapid. n procesele decizionale, datele
necesare acestora sunt n volum mare, stocate dispersat ceea ce duce la o prelucrare mai lent;
d) bazele de date construite pentru sisteme tranzacionale sunt proiectate i realizate pe baza
unor cerine cunoscute i certe, modificrile care intervin datorit adaptrii sistemului la
schimbrile intervenite reiau anumite faze ale ciclului de via. Dar odat implementate ele
funcioneaz perioade lungi de timp fr modificri. n SIAD cerinele sunt cunoscute doar
parial n momentul proiectrii i realizrii lor, ceea ce oblig depozitul de date s se adapteze
din mers cerinelor. De aceea se observ c datele gestionate pentru sisteme tranzacionale sunt
privite ca un ntreg, pe cnd cele din depozitele de date sunt organizate pe seciuni deoarece ele
sunt organizate n funcie de subiectul de analiz.
e) Sistemele tranzacionale reflect de obicei fluxul datelor din activiti curente, pe cnd
depozitele de date sunt orientate pe subiecte cum ar fi de exemplu: resurse, produse, clieni,
furnizori.
f) n cadrul sistemelor informatice operaionale dedicate domeniilor de gestiune ale
organizaiei, datele sunt adesea fragmentate, astfel nct managerii iau decizii pe baza unor

14
Idem.
informaii pariale (incomplete). Depozitele de date elimin acest dezavantaj prin accesarea,
integrarea i organizarea datelor operaionale cu rol-cheie ntr-o form care se caracterizeaz
prin consisten, fiabilitate, oportunitate, disponibilitate rapid i cu referin n timp (timely).

3.2.6. Ciclul de via al depozitelor de date

Depozitul de date (Data Warehouse) este o colecie de date orientate pe subiecte,


integrate, corelate n timp i non-volatile care sprijin decizia.* Datele care fac obiectul unui
depozit sunt integrate n acesta utiliznd convenii pentru msurtori, atribute. Structura de care
dispune depozitul de date prevede identificarea punctual a datelor stocate i, mai ales, un acces
rapid la ele. Proiectarea structurii depozitului de date se face prin modelare multidimensional,
structura implementndu-se ca o baz de date care asigur stocarea unui volum mare de date i
un acces rapid la ele, aa numitele baze de date client/server.
Popularea depozitelor de date se face prin preluare din sisteme tranzacionale, dar care
vor fi supuse unor procese complexe de transformare care s corespund structurii depozitului
care a fost proiectat. Dup aceast etap, depozitul va putea intra n exploatare pentru a obine
analize i rapoarte. Etapele enumerate anterior (proiectare, populare, exploatare) sunt asistate de
un soft specializat de la browsere i generatoare de rapoarte pn la instrumente specifice Data
Mining.
n exploatarea curent a depozitului frecvent vor apare noi cerine informaionale care
vor duce neaprat la extinderea structurii, la popularea cu extensii cuprinznd date istorice,
precum i la integrarea noilor date ncorporate n aplicaii de analiz. Pe parcursul existenei
sale, un depozit de date este incremental i ciclic.

3.3. Modelarea conceptual a depozitului de date

n etapa de concepie a unui depozit de date se folosesc modele dimensionale care


grupeaz datele din tabelele relaionale n scheme de tip stea sau fulg de zpad. n aceste
scheme pot fi regsite date cantitative cum ar fi cantiti sau valori sau grupate dup diverse alte
criterii (pe client, pe produs, pe tipuri de servicii etc.). Datele cantitative din bazele de date
dimensionale sunt de tip medii, numr de tranzacii, centralizri dup anumite caracteristici,
totaluri i reprezint msuri ale activitii. Pe de alt parte, criteriile de agregare vor fi denumite
dimensiuni. Msurile identificate prin dimensiuni vor fi stocate ntr-o tabel relaional care este
denumit tabel de fapte, iar codurile utilizate sau asociate criteriilor de agregare sunt date de
tabelele de tip nomeclator asociate fiind cu tabelele de fapte i n acest fel schema relaional va
fi de tip stea. Dac se reunesc mai multe scheme de tip stea care utilizeaz aceleai
nomenclatoare formeaz un model tip constelaie. Dac nomenclatoarele se pot divide n
subnomenclatoare atunci exist o dependen ntre acestea. De remarcat c pentru acelai cod

*
Dinu Airinei Oper citat
pot exista mai multe nomenclatoare alternative. Dac se integreaz aceste subdimensiuni i
dimensiuni alternative, se creeaz o schem sub form de fulg de zpad.
Schemele de tip stea, fulg de nea sau constelaie sunt modele conceptuale
multidimensionale ale depozitelor de date, avnd ca rol organizarea datelor pe subiecte, necesar
procesului de decizie. Schema este deschis, adic ea se poate modifica pe tot parcursul vieii
depozitului de date.

3.4. Modul de utilizare a depozitului de date

Depozitele de date conin structuri unice, integrate i cumulative necesare procesului de


decizie. Administratorul depozitului de date are ca principal sarcin stabilirea accesului partajat
al categoriilor de manageri prin asigurarea de parole i drepturi de acces. Datele din depozit sunt
accesate selectiv de manageri n funcie de necesitile acestora. n acest fel se creaz colecii
specializate pe diverse domenii care se numesc magazii de date (Data Marts). Magaziile de date
se pot utiliza i ca structuri intermediare pentru colectarea datelor din surse primare i al cror
coninut este descrcat periodic n depozitul de date. Depozitele de date pot lua natere i printr-
o stocare exhaustiv a datelor din sistemele tranzacionale n vederea aplicrii tehnologiei Data
Mining. Utilizarea tehologiei Data Mining presupune c procesarea datelor se face fr
intervenia utilizatorilor, n background, iar rezultatele sunt pstrate pentru a fi consultate ulterior
la cerere.

3.5. Mediul de depozitare al datelor

Mediul n care se contruiete i se exploateaz un depozit de date conine urmtoarele


elemente: surse de date tranzacionale, instrumente de proiectare-dezvoltare, instrument de
extracie i transformare a datelor, sistemul de gestiune al bazei de date, instrumente de acces i
analiz a datelor i instrumente de administrare *.
n cazul suitei ce aparine firmei Microsoft, toate componentele enumerate sunt integrate
pe o n mediul de lucru pentru depozitarea datelor (Data Warehousing), pentru diversele versiuni
ale SQL Server (SQL Server 7.0, SQL Server 2000, SQL Server 2005). Acest mediu de lucru
ofer asistarea proiectrii, implementrii i administrrii depozitelor de date pe ntregul ciclu de
via al acestora. Se poate concluziona c acest cadru de lucru pentru Data Warehousing ofer o
arhitectur care se poate integra relativ simplu cu produse ce provin de pe alte platforme, asigur
sevicii de import-export cu validare i transformarea datelor, asigur metadate integrate pentru
proiectarea depozitului i gestioneaz suportul, task-uri i evenimente.
n cazul suitei firmei Oracle, produsul Oracle Express reprezint un sistem de gestiune a
bazelor de date multidimensionale, SGBDMD, ce este fundamentat pe modelul de date
multidimensional, pe arhitectura client/server, cu posibiliti de dezvoltare a aplicaiilor Web.

*
Zaharie D, Albescu F, colectiv Oper citat
Produsul Oracle Express cuprinde urmtoarele componente arhitecturale: utilitare pentru
administrare (Express Instance Manager, Express Administrator i Relational Access Manager),
instrumente pentru dezvoltare (Oracle Express Analyser, Oracle Express Objects etc) i nucleul
(limbajul de programare Express). Instrumentul OLAP denumit Oracle Express Analyser
asigur selectarea, analiza i vizualizarea datelor memorate n baza de date multidimensional,
iar instrumentul Oracle Express Objects asigur dezvoltarea de aplicaii OLAP cu ajutorul
limbajului de programare Express. Prin integrarea instrumentului Oracle Express Objects cu
Oracle Discoverer, este facilitat realizarea aplicaiilor destinate cercetrii (inteligente) a
afacerilor (Oracle Integrated Business Intelligence Tools). Este prevzut, de asemenea, un editor
de conexiuni, Express Connection Editor, care asigur definirea conexiunilor la baza de date
multidimensional.
Pentru ca un depozit de date s poat fi procesat este necesar existena unui set
specializat de instrumente pentru: descrierea fizic i logic a surselor de date, a depozitelor sau
a magaziei de date n care acestea urmeaz s fie ncorporate; validarea, curirea i
transformarea datelor care urmeaz a fi stocate n depozitul de date; utilizatorii finali,
instrumente care permit acestora accesul la datele stocate n depozitul respectiv. Astfel de
instrumente sunt specializate pentru medii de dezvoltare a aplicaiilor, produse program
specializate pe analiza datelor precum i pentru aplicaii personale (individuale).

3.6. Abordarea multidimensional a datelor stocate n depozite.


3.6.1. Definirea i caracterizarea OLAP (On-Line Analytical Processing)

Dac se analizeaz tehnologia relaional se observ c cea mai mare parte a problemelor
tratate relaional sunt n realitate multidimensionale. n modelul relaional problemele sunt
tratate n tabele care au dou dimensiuni: linie i coloan. Problemele reale, care n cea mai mare
parte a lor sunt multidimensionale, nu impun limite stocrii spaiale a datelor. Astfel, un SGBDR
obinuit nu poate face fa cerinelor de agregri de date, sintetizri, consolidri i proiecii
multidimensionale. De aceea, a aprut necesitatea extinderii funcionalitii unui SGBDR prin
adugarea unor componente speciale care s permit modelare i analiz multidimensional
(OLAP) i Data Mining.
La modul general, termenul de procesare analitic online, OLAP (OnLine Analytical
Procesing) se refer la o varietate de activiti ce sunt realizate de ctre utilizatorii finali n
sistemele informatice interactive (online). n mod obinuit, OLAP cuprinde activiti ca
generarea i obinerea rspunsurilor la interogri i cererile ad-hoc de rapoarte i grafice.
Obinerea acestor rspunsuri la interogri, rapoarte i grafice se fundamenteaz pe metodele
moderne ale statisticii i cercetrilor operaionale, precum i pe tehnologiile de construire a
prezentrilor vizuale. Unele lucrri de specialitate includ analizele i prezentrile
multidimensionale, sistemele informatice pentru suportul executivului, ESS (Executive Support
Systems) sau EIS (Executive Information Sytstems) i Data Mining n tehnologia OLAP15. n
esen, produsele de firm OLAP furnizeaz posibiliti de modelare, analiz i vizualizare

15
Lungu, I. .a., Sisteme informatice executive, Editura ASE, Bucureti, 2007.
pentru volume mari de date din baze de date (prin intermediul SGBDR) sau din depozite de date.
OLAP asigur vederi conceptuale multidimensionale asupra datelor. Modelele de date asociate
sistemelor OLAP se ncadreaz astfel n dou categorii: extensii ale modelului de date relaional
i modelele bazate pe cuburi n-dimensionale. Din categoria extensiilor modelului de date
relaional pentru OLAP fac parte, ntre altele:
- modelul Kimball (fundamentat pe schema tip stea ca o reprezentare relaional a cubului
n-dimensional; din aceasta s-au dezvoltat schema tip fulg de nea i schema tip
constelaie);
- modelul Gary (fundamentat pe operatorii CUBE i ROLLUP ai clauzei Group By din
limbajul de interogare structurat SQL);
- modelul Gyssens i Lakshmanan (fundamentat pe o extensie ale algebrei relaionale).
Din categoria modelelor bazate pe cuburi n-dimensionale se pot meniona, ntre altele:
- modelul lui Agrawal, Gupta i Sarawagi (fundamentat pe o mulime de operatori
asemntori cu cei din algebra relaional, cu organizarea datelor bazat pe cuburi n-
dimensionale);
- modelul Cabbibo i Torlone (fundamentat pe o schem multidimensional compus din
mulimea de dimensiuni, tabelele de fapte i descrierile nivelurilor ierarhice)16.
Tehnologia OLAP permite utilizatorilor navigarea rapid de la o dimensiune la alta i
faciliti sporite de obinere a celor mai detaliate informaii din depozitul de date. Tehnologia
OLAP se bazeaz pe 12 principii formulate de Ted Codd (1993), extinse la 18 principii n anul
1995. Acestea sunt:
1. abordarea conceptual multidimensional a datelor; ca urmare, se folosesc modele
multidimensionale;
2. asigurarea unei transparene sporite prin existena unei arhitecturi deschise a sistemului;
3. accesibilitatea asigurat utilizatorului prin asistarea implicrii acestuia n modalitile
tehnice de furnizare a datelor (utilizatorul final reprezint i el o surs de date); trebuie s se
realizeze o singur viziune logic a datelor din organizaie (enterprise);
4. complexitatea dimensional a analizei ofer performane stabile; instrumentele OLAP
trebuie s aib implementate patru modele de analiz: direct, explicativ, contemplativ i
formativ;
5. utilizarea arhitecturii client-server, unde server-ul are ca scop omogenizarea datelor;
6. posibilitatea de a efectua aceleai operaii asupra tuturor dimensiunilor i care poart
numele de prelucrare generic a dimensiunilor;
7. dimensiunile trebuie s fie echivalente operaional i structural (dimensionalitate
generic); prin intermediul acestui principiu sunt astfel asigurate ierarhii multiple;
8. gestionarea dinamic a matricilor ncruciate prin facilitatea de a elimina combinaiile
dimensionale nule, pentru a nu ncrca memoria calculatorului; indiferent de sursa lor, valorile
lips sunt ignorate;
9. posibilitile de acces simultan al mai multor utilizatori (multi-user) la aceeai faz
(etap) de analiz;
10. operaii nerestrictive, ceea ce d posibilitatea executrii fr restricii a calculelor pentru
toate combinrile de dimensiuni i niveluri ierarhice;
11. posibilitatea manipulrii intuitive a datelor;

16
Muntean, M., Iniiere n tehnologia OLAP. Teorie i practic, Editura ASE, Bucureti, 2004.
12. numr nelimitat de niveluri de agregare i de dimensiuni 1.
13. valorile lips sunt diferite de valorile invalide i de valorile zero (mprtiere); valoarea
zero este valid; modelele OLAP satisfac regula referitoare la valorile NULL din modelul
relaional. Ca urmare, datele lips i invalide trebuie tratate n mod individual;
14. denormalizarea datelor, la introducerea lor n depozitul de date;
15. memorarea rezultatelor generate de OLAP; sistemele OLAP stocheaz datele n depozite
de date separat de sistemele tranzacionale;
16. flexibilitatea rapoartelor, prin selectarea axelor la raportare la dorina utlizatorului final;
17. caracteristici superioare ale raportrii, n funcie de locaia procesrii datelor (client sau
server) i de modul de efectuare a calculelor (dup modele de preprocesare sau calcule executate
n momentul interogrii depozitului de date);
18. ajustarea automat a nivelului fizic, n funcie de volumul datelor i de tipul de model
logic folosit.
OLAP este tehnologia de agregare a datelor stocate n depozite de date ntr-o manier de
abordare multidimensional cu faciliti referitoare la accesul la informaii a managerilor n mod
interactiv i flexibil. Legtura dintre OLAP i depozitele de date este aceea c OLAP le
completeaz prin transformarea volumului imens de date stocate i gestionat n depozite n
informaii utile procesului de decizie. Cele 12 reguli (iniiale, din 1993) ale lui Codd au fost apoi
regrupate ntr-un test cu 5 reguli denumit FASMI (Fast Analysis Shared Multidimensional
Information).
OLAP presupune existena unor tehnici care permit de la o navigare i selecie simpl a
datelor pn la analiza detaliat i complex. Aplicaiile care se rezolv pe baza acestei
tehnologii au la baz analiza rapid a informaiei multidimensional dispersat n locaii multiple
dar accesibile unui mare numr de utilizatori. Pentru utilizarea acestor faciliti, OLAP dispune
de eficacitatea bazelor de date multidimensionale i de posibilitatea de a construi alternative
pentru diverse probleme de decizie. OLAP presupune c analiza datelor (care pot fi de tip
numeric sau statistic) poate fi predefinit de cel care creeaz aplicaia sau chiar de utilizatorul
final.
OLAP se caracterizeaz prin: perspectiva multidimensional a datelor, capacitatea de
calcul intensiv i orientare n timp (time intelligence).* Aspectul multidimensional al datelor este
dat de posibilitatea de a integra multiplele aspecte care caracterizeaz activitatea unei
ntreprinderi i care sunt considerate din perspective multiple ca: timp, bani, produse. Fiecare
dimensiune este definit n genere prin mai multe niveluri ca de exemplu: timpul este divizat n
an, trimestre, luni, sezoane; produsul n: categorii, clas. Conceptul de dimensiune este folosit ca
neles de aspect, dimensiunile fiind independente i cu uniti de msur specifice dimensiunii
respective.

1
Grupul BDASEID Oper citat i M.Muntean, Iniiere n tehnologia OLAP. Teorie i practic, Editura ASE,
Bucureti, 2004.
*
Zaharie D, Albescu F, colectiv Oper citat
Fig.3.4. Hipercubul de date

Unitile de msur pot constitui criterii de agregare a datelor, iar nivelele unei
dimensiuni formeaz ierarhia care la rndul ei poate constitui criteriu de agregare a datelor.
Privite din punct de vedere multidimensional, datele sunt reprezentate n hipercuburi de date
(fig.3.4), prin extinderea cubului tridimensional la cel n-dimensional.
Pe acest tip de cub se pot efectua calcule prin aplicarea unor algoritmi compleci asupra
datelor structurate n acesta. Acestea implic posibilitatea de adresare multidimensional direct
a cuburilor unitare i optimizarea timpului de rspuns.
Caracteristica de orientare n timp (time intelligence) presupune flexibilitatea exploatrii
acestei dimensiuni care este necesar pentru comparaii i aprecieri de valoare n analizale
economice. Aceast dimensiune este luat de obicei din calendarele tranzaciilor economice aa
cum se afl n bazele de date ale sistemului informatic al companiei. Se pot face astfel grupri pe
dimensiuni ca: trimestre, luni, ani, sezoane. Se pot utiliza i dimensiuni speciale cum sunt:
perioada curent, perioada precedent, aceeai perioad din anul..., care trebuie neaprat luate n
considerare la proiectarea hipercubului. Bazele de date multidimensionale folosite de OLAP sunt
suprapuse depozitelor de date i stocheaz straturi de date agregate pe diferite criterii ierarhice.
De asemenea, aceste baze de date multidimensionale conin i date statistice pentru fiecare nivel
de agregare.
Un server OLAP reprezint un motor de manipulare a datelor multiutilizator de mare
capacitate ce a fost proiectat pentru a sprijini i funciona cu structuri de date multidimensionale.
O structur de date multidimensional este astfel aranjat nct fiecare articol (item) de date este
localizat i accesat pe baza interseciei membrilor dimensiunii care definesc acel articol (irem).
Proiectarea serverului i a structurii de date sunt optimizate pentru regsirea rapid (ad-hoc) a
dalelor n oricare dintre orientrile dorite, pentru calculul flexibil i rapid, precum i
transformarea rndurilor de date pe baza relaiilor de tip formul. O formul este un obiect al
bazei de date (calcul, regul sau alt expresie) destinat pentru manipularea datelor n interiorul
bazei de date multidimensionale. Serverul OLAP poate s reprezinte, fie o etap fizic a
procesrii informaiei multidimensionale pentru a furniza timp de rspuns rapid i consistent
utilizatorilor finali, fie poate s populeze structurile sale de date n timp real avnd ca surse baze
de date relaionale sau alte tipuri de baze de date. De asemenea, serverul OLAP poate s fie o
reprezentare a ambelor alternative de mai sus.

3.6.2. Modelarea dimensional cuburi OLAP

Modelarea dimensional presupune conceptualizarea i reprezentarea aspectelor


msurabile ale activitii studiate n interdependen cu contextul n care acesta se desfoar,
aspect identificat prin parametrii activitii. Legtura dintre valorile nregistrate ale activitii
(valori vnzri, cheltuieli comune, costul produselor) i contextul de desfurare al acesteia
formeaz baza numeroaselor rapoarte de sintez care sunt produse de sistemele tranzacionale.
Prin modelare dimensional se ofer un model conceptual comun acestor rapoarte i agreagarea
lor ntr-o structur uniform i flexibil. Totodat se pstreaz i legtura cu sursele iniiale de
date, deci posibilitatea de descompunere a datelor centralizate pe niveluri din ce n ce mai mici
pn se ajunge la setul de tranzacii iniiale (drill-down).
Cubul OLAP (fig.3.4) se consider a fi element structural pentru datele din procesul on-
line. Acesta este o structur multidimensional, un hipercub prin care se modeleaz complexul
de activiti pe o perioad ndelungat de timp. Acest tip de modelare este caracterizat de cteva
concepte de baz:
cuantificarea activitii (aspectul cantitativ) care se face prin utilizarea unitilor de
msur clasice ca de exemplu: m, m3, kg, uniti monetare. Msuri cantitative sunt: volum
vnzri, volum salarii, cost materiale, cost produs etc.
dimensiunile activitii sunt de fapt parametrii activitii msurate ca de exemplu: zi,
lun, trimestru, client sau grup de clieni. Dimensiunile sunt de obicei de natur diferit i
rspund la ntrebri de tipul: unde?, cnd?, cu ce? etc.
faptele sunt colecii ale cuantificrii activitii precum i dimensiunile care identific
modul n care acestea s-au desfurat. Sursa de existen a faptelor este constituit din
nregistrrile stocate n tabelele de tranzacie ale aplicaiilor operaionale care susin activitatea
respectiv. Se pot folosi i dimensiuni scenarii care pot stoca n tabelele de fapte i msuri
imaginare alturi de cele reale, pentru ca utilizatorul s poat stoca valori estimate pentru o
msur.
n bazele de date tranzacionale, dimensiunile sunt de fapt cmpuri care conin
caracteristicile unei tranzacii adic datele de identificare ale tranzaciilor care sunt de obicei chei
externe care fac legtura cu nomenclatoarele care le expliciteaz.
Ca atare, se poate afirma c dimensiunile se materializeaz n setul de valori posibile care
formeaz domeniul caracteristicii respective, valori care poart numele de membrii dimensiunii.
O alt caracteristic a dimensiunii este aceea c poate avea multipli adic sunt grupe de
valori ale dimensiunii cu o caracteristic comun. Grupele pot fi identificate prin atribute care
se afl n nomenclatorare i pot lua aceeai valoare pentru mai multe valori ale cheii primare.
Multiplii unei dimensiuni nu trebuie s fie neaprat de aceeai natur cu dimensiunea primar,
aceasta putnd avea mai multe tipuri de multipli n funcie de caracteristicile luate n considerare.
Se poate afirma c dimensiunile mpreun cu multiplii lor formeaz structuri arborescente care
sunt recunoscute de OLAP ca fiind ierarhii. Ierarhiile pot fi regulate, adic toate ramurile au
acelai numr de ramificaii sau neregulate dac pe anumite ramuri lipsete un nivel de
semnificaie. La rdcina arborelui se afl o caracteristic cu aceeai valore pentru toi membrii
dimensiunii de baz. Acest tip de caracteristic este una implicit ca, de exemplu, unitatea care
are ca activitate cea analizat sau all. Frunzele arborelui formeaz membrii dimensiunii
iniiale, iar dimensiunile intermediare pot fi pe mai multe nivele. Dac arborele este neregulat,
pentru a uniformiza ierarhia se poate introduce un membru de tip alte. n acest fel se constata
c centralizrile pe nivelul respectiv nu vor fi de 100% din valoarea centralizat pe nivelul cel
mai de jos. Atributele care definesc ierarhia sunt atribute derivate din atributul care definete
dimensiunea aciunilor msurate, prin referire la nomenclatoare sau prin clasificri ale valorilor
pe care le poate lua atributul respectiv. De exemplu, furnizorii se pot clasifica n furnizori stabili
dac compania face tranzacii cu ei de mai mult de 4 ani, furnizori noi dac au vechime cuprins
ntre 1 i 4 ani i furnizori volatili sau ocazionali dac n cmpul respectiv din Furnizori nu este
completat nimic. Din acest exemplu se observ c asemenea clasificri conduc la obinerea unor
atribute derivate prin calcul din caracteristicile aflate n nomenclatoare. n acest fel se vor obine
seturi de membri calculai ai dimensiunii. Dimensiunile ierarhizabile se constituie n ierarhii
alternative. Nivelele ierarhiilor sunt vzute ca nivel de agregare pentru valorile stocate n tabele
de fapte. Membrii dimensiunilor identific msura activitii stocat n tabelul de fapte. Dac
unui fapt i sunt asociate mai multe dimensiuni, identificarea unic a acestuia va necesita valori
precise pentru fiecare dimensiune. Ca urmare, din tabelele de fapte sunt selectate mai multe
nregistrri, adic toate valorile posibile asociate dimensiunilor nespecificate.
Pentru dezvoltarea unui depozit de date, modelarea datelor are un rol important deoarece
permite vizualizarea structurii nainte ca ea s fie construit. Modelul multidimensional
reprezentat prin el va fi prezentat desfurat n seciuni sau n proiecii tridimensionale.
Seciunea unui hipercub este definit ca o seciune din cub dat prin coordonatele sale.
Proiecia este definit ca o seciune care centralizeaz datele de pe toate dimensiunile suprimate.
Vizualizarea on-line se face de fapt tot n seciuni sau proiecii tridimensionale. Datele
din celule sunt prezentate numai n seciuni sau proiecii transversale bidimensionale. Hipercubul
ar putea fi imaginat ca un set de tabele-pivot grupate pe dimensiunea cerut. Pentru procesul de
modelare, hipercubul se poate prezenta n form tabelar n care msurile sunt evideniate pe
coloane iar liniile reprezint combinaiile de dimensiuni. De asemenea, n plan fizic, hipercubul
poate fi stocat ntr-un tabel cu coloane multiple n care se stocheaz msurile i cu identificatori
pe rnduri. Identificatorii de rnduri sunt de fapt chei formate din toate combinaiile posibile de
valori ale dimensiunilor. Utilizarea indecilor pentru acces rapid nu are prea mare eficien
ntruct cheia este compus din mai multe caracteristici, iar cmpurile de valoare sunt puine i
numerice, astfel c tabelul de indeci este aproape de aceeai dimensiune cu tabelul iniial. De
aceea, se utilizeaz tabelul bitmap pentru un acces direct rapid. Datele modelate ca hipercuburi
formeaz baze de date multidimensionale.
Tipurile majore de OLAP sunt17:
- OLAP multidimensional (MOLAP) atunci cnd cubul OLAP este implementat prin
intermediul unei baze de date multidimensionale specializate (sau memorie-tampon de
date data store);
- OLAP relaional (ROLAP) atunci cnd o baz de date OLAP este implementat n
vrful unei baze de date relaionale existente;
- OLAP hibrid (HOLAP) combinaie ntre MOLAP i ROLAP;
- OLAP baz de date (DOLAP) atunci cnd se refer la un SGBDR care este proiectat
pentru a gzdui structuri OLAP i a permite calcule OLAP;
- OLAP Web (WOLAP) atunci cnd se refr la date OLAP ce sunt accesibile prin
intermediul unui navigator Web;
- OPAP pe desktop reprezint o variant de OLAP cu pre sczut, atunci cnd
instrumentele OLAP i bazele de date sunt localizate pe staia de lucru (desktop) a
utilizatorului final.

3.6.3. Baze de date multidimensionale

Baza de date multidimensional este format din dou structuri: structura datelor n care
se stocheaz msurile activitilor preluate din tabela de fapte a depozitului de date. Datele vor fi
prezentate utilizatorului n celulele tabelelor pivot; structura metadatelor care este format din
totalitatea dimensiunilor i membrilor acestora precum i din structurile ierarhice ale
dimensiunilor. Utilizatorul poate vizualiza aceast structur ca nume de coloane i linii care
reprezint informaiile de pe axele cuburilor.
Numerotarea nivelurilor ncepe de la rdcin (nivel 0) ctre frunze (unde va apare
nivelul maxim). Ierarhiile posed propriile lor seturi de niveluri, chiar dac unele ramuri sunt
comune. De exemplu: ierarhia Calendar este format din nivelele (0-5): Timp, An, Semestru,
Trimestru, Lun, Dat calendaristic, ierarhia Anotimp este format din nivelele (0-4): Timp,
An, Sezon, Lun, Dat calendaristic, iar ierarhia Anotimp este format din nivelele (0-3): Timp,
Sptmn, Zi, Dat calendaristic. Pe fiecare nivel se stocheaz membrii dimensiunilor
respective. Rdcina care se observ c este comun (Timp) este nivelul de agregare maxim
avnd ca unic membru implicit all. Orice nod n arbore este un membru al unei subdimensiuni.
Nodurile subordonate unui nod formeaz un set, iar orice membru al unui set are un numr de
ordine ncepnd cu 0. De asemenea, orice membru poate avea proprieti ca de exemplu unele
zile sunt srbtori legale, unii ani sunt biseci. Exemplul prezentat presupune o structur strict
arborescent ntruct fiecare membru al unei dimensiuni are submembri distinci, chiar dac
acetia au aceleai valori. De exemplu fiecare an are setul lui de luni, fiecare sptmn are setul
ei de zile. Ca mod de identificare, membrii vor fi calificai cu numele membrului de pe nivelul
precedent cruia acesta i se subordoneaz: 2007-feb, 2008-feb. Tipul acesta de dimensiuni care
au membri ce se repet se pot crea i ulterior prin combinarea a dou nivele din ierarhie sau din
ierarhii diferite pentru a crea un nivel nou, virtual.

17
Turban E., Op.cit.
Pentru a se putea naviga pe o structur arborescent, sistemele de gestiune pun la
dispoziie operatori ierarhici. De exemplu, pentru exploatarea datelor, sistemele de gestiune
ofer operatori pe hipercuburi. Fizic, datele sunt stocate ntr-un fiier cu acces direct pe baza
adresei fizice absolute sau relative a nregistrrii obinute prin exploatarea tabelelor bitmap
obinute n urma creerii structurii de date. Aceste tabele sunt puntea de legtur dintre structura
de date i structura de metadate. Iat cum se face aceast legtur: se tie c pentru fiecare
membru al fiecrei dimensiuni exist o coloan (1 bit) n tabele bitmap pentru fiecare nregistrare
exist un rnd n acelai tabel n care se stocheaz 1 n dreptul biilor asociai membrilor
dimensiunii existente n nregistrare. Datorit acestui procedeu, cmpul respectiv nu trebuie
stocat n nregistrare, iar structura datelor este redus la un minim necesar. Din tabelul de msuri
se vor putea selecta acele nregistrri care au un bit 1 n poziia corespunztoare biilor 1 din
masc. Un inconvenient al tabelelor bitmap este acela c ele sunt greu de obinut, iar apariia
unor noi membri sunt greu de inserat n poziia corespunztoare. Procesul de refacere a unui
tabel bitmap este mare consumator de timp avnd n vedere c tabelul de fapte din depozit (care
se va transforma n baza multidimensional) poate avea un numr imens de nregistrri.
Masca de interogare se obine prin exploatarea structurii ierarhice a metadatelor de unde
se pot extrage seturi de membri pentru dimensiunile desemnate prin specificatorii de axe.
Adresarea tabelului de msuri se face n mod direct pe baza unui set de adrese de nregistrri
care se suprapun cu tiparul mtii. Din tabel se preiau n aceast manier valorile care se
centralizeaz pentru celula cubului cu dimensiunile sale.
Se poate afirma c structura metadatelor este de tip ierarhic, fiecare dimensiune fiind
stocat ntr-o structur arborescent cu o singur rdcin (all) i cu o multitudine de ramuri care
pot conine frunze comune (ierarhii alternative). Orice nivel al unei ierarhii poart un nume i
conine un set de membri. De altfel i ierarhiile alternative poart un nume pentru a putea fi
distinse. Structura n care sunt stocate datele este o structur cu acces direct prin tabele bitmap
exploatate prin mti.

3.6.4. Operaii OLAP asupra hipercubului

Un hipercub este proiectat astfel nct el s aib n vedere nivelul de detaliu necesar n
procesul de analiz. Nivelul de detaliu (granularitatea) reprezint numrul de membri ai unei
dimensiuni. Datele pot fi vizualizate printr-o selecie n hipercub pe baza unui criteriu ierarhic
care ar putea fi de exemplu structura organizaional pe care o conduce un anumit manager. Dac
de la pornire, granularitatea este prea mare, datele vor fi mult prea centralizate i nu se va putea
face dect o analiz grosier. Ajustarea nivelului de granularitate este realizat de OLAP prin
exploatarea ierarhiilor dimensiunilor prin comasri i descompuneri ale msurilor prin proceduri
care poart numele de roll-up i drill-down. Prin intermediul acestor proceduri se face o
deplasare a proieciei cubului n sus sau jos pe nivelele ierarhice ale fiecrei dimensiuni (zoom
in; zoom out), executnd de fiecare dat centralizri ale msurilor stocate la cea mai mic
granularitate dup criterii ierarhice stabilite n prealabil.
Este stabilit un nivel de granularitate iniial sub care nu se poate cobor. Din acest motiv
este important ca dimensiunile de baz s fie ct mai rafinate sau s se creeze Data Marts unde
hipercuburile sunt proiectate la nivelul de detaliu stabilit de managementul operaional. Pentru
managementul superior se va construi un depozit cu hipercuburi centralizatoare cu granularitate
mare. Prin drill-down se obin detalii, iar prin roll-up se obin date sintetice.
Un alt grup de operaii oferit de OLAP este secionarea (slicing) i defalcarea (dicing).
Prin secionare, se creeaz posibilitatea selectrii prin vizualizare doar pentru un membru al unei
dimensiuni, adic un plan din cubul tridimensional. Seciunea astfel obinut va apare ca un tabel
pilot cu valorile dimensiunilor pe laturi i cu specificarea valorii alese pentru dimensiunea
suprimat. Defalcarea (dicing) este operaia de proiectare a unei dimensiuni pe o alta. De obicei
o dimensiune din primul plan este combinat cu o alt dimensiune din adncime. Acest proces se
mai numete imbricarea dimensiunilor.
Dimensiunile unui cub pot fi private sau pot fi utilizate n comun i de alte cuburi (ele
provin din depozitele cu schema de tip constelaie). Proiectarea structurilor depozitelor de date i
a cuburilor OLAP este un proces ce se desfoar continuu pe tot parcursul existenei (vieii)
aplicaiei, dimensiunile cuburilor fiind n strns dependen cu detaliile activitii structurate.
Aplicaiile construite cu tehnologia OLAP i gsesc locul n multiplele domenii ale
activitii ntreprinderilor, de la finane, bnci, marketing pn la producie i vnzri. De
exemplu, activitatea de producie poate fi susinut de aplicaii OLAP cum sunt: planificarea
operaiilor, controlul calitii produselor, analiza rebuturilor, analiza optimizrii raportului dintre
cost-beneficii.
OLAP, utiliznd tehnici inteligente de optimizare, beneficiaz de avantajul timpului de
rspuns mic.

3.7. Aplicaie privind analiza datelor cu Microsoft OLAP


3.7.1. Analiza problemei de rezolvat

O societate comercial i propune s analizeze, cu tehnica OLAP, datele referitoare la


gestionarea mijloacelor fixe. Gestiunea mijloacelor fixe ale societii este realizat ntr-o baz
de date relaional, MIFIX (baz de date operaional). Datele operaionale sunt curate,
transformate, consolidate i selectate dup criterii prestabilite, dup care sunt memorate ntr-un
depozit de date, denumit MIFIX. Tabelul de fapte al depozitului de date se refer la
componentele gestiunii - micarea mijloacelor fixe (intrare mijloc fix sau ieire mijloc fix) i
calculul amortizrilor. Cu ajutorul aplicaiei informatice se vor realiza, dup analiza datelor cu
cubul OLAP, rapoarte diverse (de exemplu, Situaia mijloacelor fixe la data de ..., Situaia
amortizrilor mijloacelor fixe n luna..., ).
Se reamintete faptul c mijloacele fixe se amortizeaz ncepnd cu luna urmtoare
punerii n funciune (data calendaristic este specificat n procesul verbal de punere n
funciune a mijlocului fix). Rata lunar de amortizare se calculeaz n funcie de regimul de
amortizare fixat pentru fiecare tip de mijloc fix prin reglementrile legale n vigoare la data
efecturii operaiunii. Aceast rat lunar de amortizare se calculeaz prin aplicarea cotelor de
amortizare asupra valorii iniiale (de intrare) a mijloacelor fixe i se include n cheltuielile de
exploatare. Atunci cnd se execut modernizri (adugare de valoare) asupra unui anumit mijloc
fix, rata de amortizare lunar se modific prin adugarea valorii acestor modernizri. Legea de
amortizare aplicat poate s fie liniar (sume fixe, proporionale cu numrul de ani ai ciclului de
via normat sau duratei normale de utilizare a mijlocului fix) sau degresiv (cotele de
amortizare liniar sunt multiplicate cu coeficientul k ce este funcie de durata normal de
utilizare a mijlocului fix).

3.7.2. Definirea schemei bazei de date multidimensionale

Cubul OLAP este o structur multidimensional de date care se definete printr-o


mulime de dimensiuni i msuri. Accesul la date este realizat prin intermediul interogrilor i
prin accesul utilizatorului la ierarhiile de date. Datele cubului sunt stocate ntr-o structur de date
multidimensional. Cubul poate fi realizat cu Cube Wizard sau cu Cube Editor. Schema cubului
conine o tabel de fapte i cel puin o dimensiune.

Analiza de tipul OLAP are la baz schema multidimensional definit nc de la


construirea cubului. Sunt necesare definirea sursei de date, a tabelului de fapte (cu msuri de tip
coloan numeric i nivel de detaliere) i a dimensiunilor. O msur apare ca rezultat al unor
combinaii ntre mai multe coloane, sub forma unor expresii.
Definirea modului n care este memorat cubul OLAP se poate realiza cu General tab prin
intermediul casetei de dialog Storage Options din BIDS. Opiunile de memorare sunt MOLAP
(se memoreaz att datele ct i agregrile n structuri multidimensionale), ROLAP (datele
rmn memorate n baza de date relaional alturi de memorarea agregrilor) i HOLAP (datele
rmn memorate n baza de date relaional, iar agregrile sunt memorate n structurile
multidimensionale).

Crearea bazei de date tranzacionale n Microsoft SQL Server 2005

Datele referitoare la gestiunea mijloacelor fixe sunt stocate ntr-o baz de date
tranzacional ce st la baza construirii cuburilor de date. Datele sunt organizate n tabele care
corespund dimensiunilor, ierarhiilor i tabelelor de fapte ale cuburilor multidimensionale.
Aceast baz de date tranzacional este denumit MIFIX i conine urmtoarele tabele
(fig. 3.5):
Dbo.fapte_miscare_MF conine faptele referitoare la micarea mijloacelor fixe (intrri
i ieiri), precum i la valoarea de inventar i amortizarea acestora.
Dbo.PV_intrare conine date referitoare la intrarea mijloacelor fixe;
Dbo.PV_iesire conine date referitoare la ieirea mijloacelor fixe;
Dbo.Gestionari - conine date cu privire la identificarea gestionarilor care rspund de
mijloace fixe;
Dbo.Timp - datele coninute n acest tabel reprezint perioadele de timp de manipulare a
mijloacelor fixe; pe baza acestor date se realizeaz dimensiunea Timp cu urmtoarea ierarhie: an,
luna, trimestru, sezon.
Fig.3.5 Structura bazei de date MIFIX realizat n Microsoft SQL Server 2005

n crearea i dezvoltarea depozitelor de date (Data Warehouse) pe Microsoft SQL Server


2005, se folosesc, n principal, urmtoarele componente:
a) Business Intelligence Development Studio, pentru dezvoltarea de proiecte de
Analysis Services;
b) SQL Server Management Studio, pentru gestionarea proiectelor de Analysis
Services.

4. DATA MINING TEHNOLOGII DEDICATE EXTRAGERII


CUNOTINELOR DIN DATE
4.1. Problematica general
Data Mining este rezultatul firesc al evoluiei tehnologiilor informaiei i ale
comunicaiilor (IT&C) determinat de creterea volumului de date produs de societatea uman
pentru desfurarea activitilor sale, urmat de nevoia iminent de transformare a datelor
respective n informaii i cunotine utile n aplicaii din gama analizei i controlului produciei,
analizei de pia, detectrii fraudei, explorrilor tiinifice etc. n acest context, industria
sistemelor informatice cu baze de date a evoluat n direcia dezvoltrii urmtoarelor
funcionaliti1: sisteme cu baze de date avansate, analiza avansat a datelor (Data Warehousing
i Data Mining) i baze de date bazate pe Web.
Condiia esenial pentru dezvoltarea mecanismelor profesionale de stocare, de regsire i
de tranzacionare a datelor o reprezint dezvoltarea coleciilor de date i a mecanismelor de
creare a bazelor de date, fr de care analiza avansat a datelor este practic imposibil. Bazele de
date i tehnologia informaiei au evoluat sistematic, de la sisteme simple de procesare a
coleciilor de date la sisteme cu baze de date puternice i sofisticate, care ofer utilizatorilor
accesul direct la datele stocate, lucru convenabil i foarte avantajos. Metodele eficiente utilizate
pentru procesarea on-line a tranzaciilor de date, OLTP (On-Line Transaction Processing) au
contribuit semnificativ la evoluia i acceptarea tehnologiei bazelor de date relaionale ca
instrument de stocare eficient, de regsire i de management al cantitilor mari de date.
ncepnd din 1990 tehnologia bazelor de date relaionale a fost unanim acceptat, iar
activitile de cercetare n domeniu au fost canalizate ctre sisteme cu baz de date mai
puternice i mai eficiente, dezvoltate n jurul unor modele avansate de date care au creat
posibilitatea de realizare a aplicaiilor orientate pe rezolvarea problemelor. Totodat, s-au
obinut rezultate spectaculoase legate de distribuia, diversificarea i partajarea datelor, care au
contribuit la dezvoltarea sistemelor de informaii globale, bazate pe Internet, ca de exemplu
WWW.
Pe de alt parte, progresul n domeniul tehnologiei digitale a condus la apariia unor
calculatoare puternice, a echipamentelor de colectare a datelor i a mediilor de stocare n mas
care reprezint suportul fizic, att pentru bazele de date de informaii i de cunotine, ct i
pentru aplicaiile care le gestioneaz. i mpreun, ansamblul hardware- software i de
comunicaii, cunoscut sub denumirea generic de tehnologiile informaiei i ale comunicaiilor,
IT&C (Information Technology and Communications), face posibil analiza cantitilor uriae de
informaii i de date, stocate n diferitele tipuri de baze de date i n depozite de informaii, n
vederea regsiri cunotinelor i informaiilor utile.
O arhitectur de depozit de date a condus la data warehouse, un depozit de surse multiple
de date heterogene organizat unitar, cu scopul de a uura asistarea informatizat a deciziei.
Tehnologia data warehouse include tergerea datelor, integrarea datelor i procesarea analitic
on- line (On- Line Analytical Processing- OLAP), precum i posibilitatea de vizualizare a datelor
i informaiilor. Dei instrumentele OLAP suport analiza multidimensional i formularea
deciziilor, volumele imense de date creaz nevoia unor instrumente de analiz efectiv i
eficient a datelor respective mai n detaliu, ca de exemplu clasificarea, gruparea i
caracterizarea datelor care variaz n timp.
Creterea rapid i continu a volumelor de date, care a depit capacitatea uman de a le
interpreta, a impus apariia i utilizarea instrumentelor data mining pentru extragerea
informaiilor i cunotinelor utile din cantitile enorme de date colectate i stocate n depozite
de date de dimensiuni mari i foarte mari.
n esena lor, instrumentele data mining realizeaz analiza datelor i pun n eviden
modele de date importante pentru stabilirea direciilor de evoluie a diferitelor domenii de
activitate (economic, tiinific, medical, educaional etc.) pe care le desfoar organismele
economice pentru a- i atinge obiecticele specificate n documentele de constituire.

1
Han, J., Kamber, M. - Data Mining- Concepts and Technique, Second Edition, Morgan Kaufmann Publishers,
USA, San Francisco CA 2006.
Existena unor volume imense de date a pus problema reorientrii utilizrii lor de la un
proces de exploatare retrospectiv ctre unul prospectiv. Data Mining poate avea mai multe
definiii, ns toate converg n esen ctre miezul problemei i anume c acest concept
reprezint un proces de extragere de informaii noi din coleciile de date existente. Termenul de
dat are semnificaia de descriere a unui eveniment bine determinat care se produce n lumea
real i este perfect verificabil. Prin tehnologia Data Mining se prelucreaz date care refer
perioade anterioare (date istorice), care sunt examinate i sunt deja cunoscute, pe baza lor
constituindu-se un model sau ablon. Acest model sau ablon va putea fi aplicat situaiilor noi de
acelai tip cu cele deja cunoscute. Informaiile care se pot obine prin Data Mining sunt
predictive sau descriptive. De exemplu direcionarea aciunilor de marketing pot constitui o
problem tipic predictiv.1 Detectarea fraudelor produse cu carduri bancare reprezint o
problem tipic de aplicaie descriptiv.
Dezvoltarea tehnicilor de Data Mining se explic prin acumularea de volume imense de
date pe care organizaiile economice le-au derulat de-a lungul anilor. De asemenea, concurena
tot mai acerb precum i creterea exigenelor pieei au determinat firmele s ia tot mai mult n
considerare potenialul uria pe care l ofer arhivele de date. Alturi de arhivele de date
memorate pe suporturi informatice mai exist nc doi factori care au dus la necesitatea Data
Mining: existena i perfecionarea algoritmilor i a produselor-program dedicate precum i
creterea capacitii de memorare i prelucrare a calculatoarelor electronice care permit tratarea
corelativ a volumelor mari de date.
Este de remarcat c depozitele de date pot fi surse pentru Data Mining, iar rezultatele
obinute pot completa cmpurile nregistrrilor din depozitele de date, care apoi pot fi
valorificate prin proieciile multidimensionale specifice OLAP.
Potenialul oferit de Data Mining se ncorporeaz n procesele comerciale ale firmelor,
iar cutarea informaiilor i cunotinelor nu devine un scop n sine ci este util doar dac este
transformat ca aciune. Astfel firmele pot alege s reacioneze sau nu la situaiile diverse create
de realitate (diminuarea numrului de clieni, scderea vnzrilor, pierderea unor piee de
desfacere etc.). Pasul urmtor dup aceast alegere este exploatarea propriu-zis a datelor
utiliznd diveri algoritmi. De multe ori, aciunea de Data Mining poate fi un eec i nu o reuit,
fiind posibil ca msurile luate s nu fie adecvate informaiilor obinute.
Prin Data Mining, oamenii de afaceri reuesc s se focalizeze mai bine pe cei mai buni
clieni ai lor, s depisteze i s previn fraudele, s descopere caracteristicile de influen care
afecteaz cel mai mult indicatorii-cheie de performan, KPI (Key Performance Indicators) ai
afacerii, respectiv ai societii, s gseasc informaia ascuns n baza de date/depozitul de date.
Cu ajutorul tehnicilor Data Mining, orice proces sau fenomen reflectat n bazele de date,
respectiv depozitele de date, constituie tem de analiz i raportare n cadrul unei platforme
dedicate pentru cercetarea afacerilor, BI (Business Intelligence), impropriu dar sugestiv tradus
n unele lucrri romneti sub denumirea de inteligena afacerilor.
Spre deosebire de tehnicile OLAP (abordate n capitolul anterior) care abordau interogri
i raportri standard (care sunt clienii cei mai valoroi, care produse s-au vndut cel mai mult
sau care sunt zonele de costuri cele mai ridicate), tehnicile Data Mining exploreaz volumele
foarte mari de date heterogene cu scopul de a previziona, a nelege i de a dezvolta noi abordri

1
Zaharie D, Albescu F, colectiv Oper citat
asupra problematicii supuse soluionrii. Pe piaa actual extrem de competitiv, companiile
trebuie s-i administreze i s exploateze cu eficien cele mai valoroase active (assets) i
depozite de date (Data Warehouse), cu precdere informaia valoroas ascuns n aceste
depozite.
Instrumentele tradiionale de cercetare a afacerilor rapoarte, interogri i raportri
interactive permiteau sintetizarea a ceea ce s-a ntmplat n trecut, aspecte reflectate de datele
istorice ale companiei i de unele date curente. Prin tehnica OLAP se obin analize asupra unor
tendine, bazate n special pe rezumate, comparri, analize i previziuni ce au la baz valori
medii, sume i grupri de date prin agregare. Prin Data Mining se adncete explorarea
depozitelor de date prin descoperirea informaiei ascunse cu ajutorul abloanelor (patterns),
factorilor de influen, clusterelor, profilelor i prediciilor aplicate volumului mare de date. De
exemplu, prin analiza profilurilor celor mai buni clieni actuali, prin Data Mining se pot construi
modele i aplicaii integratoare destinate identificrii clienilor care au cele mai mari anse s
devin performani n viitor, cu toate c, n prezent, nu fac parte din portofoliul cu cei mai buni
clieni ai companiei. Managerii organizaiilor economice lucreaz astfel, n deciziile lor, cu
valoarea strategic a clienilor actuali prin care se previzioneaz nsi viitorul afacerii.
Toate elementele considerate anterior conduc spre ideea de ciclu n utilizarea Data
Mining n cursul cruia sunt patru etape:
definirea oportunitilor comerciale i a datelor pe care se face exploatarea;
obinerea de informai i cunotine din coleciile de date existente prin tehnici Data
Mining;
adoptarea deciziilor i aciunilor n urma informaiilor rezultate;
cuantificarea ct mai corect a rezultatelor concrete pentru a identifica i alte ci de
exploatare a datelor.

4.2. Definirea conceptului Data Mining


Aa cum s-a artat deja n paragraful precedent, conceptul Data Mining (mineritul
datelor) definete procesul de descoperire a modelelor de cunotine i/sau informaii utile
dintr-o cantitate mare de date, colectate i stocate n diferite tipuri de depozite de date (baze de
date, Data Warehouses, WWW etc.), n vederea folosirii lor pentru fundamentarea deciziilor
manageriale pe toate nivelele de competen din cadrul unei organizaii economice. n literatura
de specialitate modelele de cunotine i/sau de informaii obinute ca rezultat al desfurrii unui
proces Data Mining sunt denumite, mai simplu, modele de cunotine, pornind de la definiiile
conceptelor informaie (care exprim elementele din realitatea nconjurtoare n momentul n
care sunt percepute pentru prima dat de utilizator, adic atunci cnd au caracter de noutate, de
tire), cunotin (care desemneaz informaia relevant, informaie cu neles i informaie care
acioneaz1, pentru un domeniu de interes, dup momentul aflrii acestei informaii) i dat (care
desemneaz informaia sau cunotina nregistrat n vederea evidenei, prelucrrii i/sau
analizei).
Data Mining este o expresie improprie care asociaz ntr-un mod foarte sugestiv
procesul de descoperire2(cutare i gsire) a cunotinelor dintr-o cantitate mare de date cu
1
Mihai Drgnescu, Societatea Informaional Societatea cunoaterii, www.academiaromana.ro,
Studii tematice.
2
www.dexonline.ro - DEX online: Dicionar explicativ al limbii romne.
procesul de extragere a mineralelor din roci, spre a-l face mai uor de neles. Aceast asociere
se bazeaz pe faptul c ambele procese, n realitate foarte diferite deoarece materia prim folosit
este de natur diferit (dat-cunotin i roc-mineral), sunt procese de extracie care constau
primul n extragerea cunotinelor utile din cantiti mari de date, iar al doilea n extragerea de
minerale din cantiti mari de roci (procesul clasic de exploatare minier, denumit pe scurt
minerit). Practic, cantitile enorme de date disponibile, care conin cunotine utile n procesul
decizional, sunt asemnate cu rocile scoarei terestre, care conin substane minerale necesare n
procesul industrial, n timp ce cunotinele necesare procesului decizional, care se extrag din
depozitele de date, sunt asemnate cu mineralele care se extrag din rocile respective. Ca urmare a
acestei similitudini, denumirea cea mai adecvat pentru procesul de descoperire a cunotinelor
dintr-o cantitate mare de date este exploatarea cunotinelor din date (Knowledge Mining from
Data), o expresie mai lung i mai puin sugestiv. Pentru desemnarea procesului respectiv se
pot folosi i alte expresii, cu semnificaie similar sau uor diferit de Data Mining, ca de
exemplu extragerea cunotinelor (knowledge extraction), analiza datelor/modelelor (data/
pattern analysis) sau arheologia datelor (data archaeology). Dintre toate acestea, cea mai uzual
expresie este Data Mining, fiind cea mai scurt i cea mai sugestiv datorit asocierii implicite
cu procesul clasic de minerit, vechi de sute de ani, neles n esena sa chiar i de ctre
nespecialitii n domeniu minier.
Expresia Data Mining este sinonim cu expresia descoperirea cunotinelor din date,
KDD (Knowledge Discovery from Data) ce este uzual folosit n literatura de specialitate prin
abrevierea sa KDD, care face s-i piard semnificaia implicit, motiv pentru care se prefer
utilizarea primei expresii (Data Mining) pentru a desemna procesul de descoperire a
cunotinelor din cantitile mari de date stocate n depozitele de date disponibile.
n realitate, procesul de descoperite a cunotinelor din cantiti mari de date este un
proces complex format, n principal, din urmtoarele procese mai simple, care se succed din
punct de vedere cronologic (fig. 4.1)1:
1. curirea datelor (data cleaning): nlturarea datelor inutile i a celor inconsistente;
2. integrarea datelor (data integration): combinerea datelor provenite de la mai multe surse
de date diferite;
3. selectarea datelor (data selection): extragerea datelor relevante pentru analiz din
depozitele de date disponibile (baze de date, data warehouses, WWW etc.);
4. transformarea datelor (data transformation): punerea datelor n formate unitare,
corespunztoare pentru mining (analiza n vederea descoperirii de cunotine) prin
realizarea unor operaii rezumative i/sau de agregare (de unificare);
5. mineritul datelor (Data Mining): extragerea unor modele de date aplicnd asupra
datelor rezultate dup parcurgerea etapelor anterioare metode inteligente, denumite
generic metode Data Mining; acest proces este esenial pentru descoperirea cunotinelor
utile ascunse n depozitele de date;
6. evaluarea modelelor (pattern evaluation): evaluarea modelelor de date extrase pentru
identificarea celor care reprezint cunotinele care intereseaz n mod real;
7. prezentarea cunotinelor (knowledge presentation): prezentarea cunotinelor astfel
obinute utilizatorilor lor, prin folosirea unor tehnici de vizualizare i de reprezentare
adecvate.

1
Han, J., Op.cit.
UTILITATOR
pentru

cunotine

evaluare modele i prezentare

MODELE
DE DATE

Data Mining (mineritul datelor):


se extrag o parte din date

selecie, transformare
i eventual reducere

Data
Warehouse
curire i integrare

Database Database Database

Fig. 4.1. Data Mining- parte a procesului de descoperire a cunotinelor

n mod uzual, datele rezultate din procesele de curire i integrare sunt stocate n Data
Warehouses, caz n care transformarea i unificarea lor se realizeaz nainte de procesul de
selecie. Pentru a obine o reprezentare mai mic a datelor originale poate fi realizat i
reducerea datelor (data reduction), fr a le afecta integritatea datelor.
Procesul Data Mining interacioneaz cu utilizatorul prin baza de cunotine destinat
acestuia, dintre modelele de date descoperite, cele cu importan pentru utilizator reprezentnd,
de fapt, cunotine noi care se stocheaz n baza de cunotine spre a-i fi prezentate.
Procesul Data Mining este o parte esenial a procesului de descoperire a cunotinelor
din date deoarece descoper modelele de date ascunse pentru a fi evaluate, n conformitate cu
cerinele utilizatorilor.
Din punctul de vedere al funcionalitii sale, Data Mining este procesul de descoperire a
cunotinelor care intereseaz dintr-o cantitate mare de date stocat n baze de date, Data
Warehouses sau n alte tipuri de depozite de date.
Privit din perspectiva depozitului de date - Data Warehouse, procesul Data Mining
reprezint un stadiu avansat de procesare analitic on-line (OLAP). Data Mining depete ns
procesul analitic limitat, de tip rezumativ, al sistemelor Data Warehouse prin tehnicile specifice
de analiz a datelor, mult mai avansate.
Data Mining implic o integrare de tehnici din mai multe domenii. Practic, Data Mining
reprezint un domeniu interdisciplinar, principalele discipline cu care se intersecteaz fiind cele
cuprinse generic sub denumirea de Tehnologia Bazelor de Date - Databases (DB), Tehnologia
depozitelor de date - Data Warehouse (DW), Tehnologia Digital, Tehnologiile Informaiei i
ale Comunicaiilor (IT&C) i Statistic (fig. 4.2).

Calculatoare Modelarea
datelor
Statistic
Vizualizarea
Tehnologiile datelor
Bazelor de Date Tehnologia
(DB) i Data Tehnologia Analiza
Digital i datelor
Warehouses Data Mining
(DW)
IT&C
Procesarea
imaginilor
Alte domenii
Machine Reele Regsirea
learning neurale informaiilor
or

Fig. 4.2. Principalele domenii (discipline) care se


intersecteaz cu domeniul Data Mining

Cunotinele i informaiile descoperite n procesul data mining se folosesc n formularea


deciziilor, n controlul unui proces economic sau industrial, n managementul informaiei etc.
Tehnicile de Data Mining se pot aplica att ascendent ct i descendent. Pentru
abordarea descendent se iau n considerare ipotezele formulate n prealabil prin alte mijloace.
Abordarea ascendent urmrete extragerea de cunotine sau informaii noi din date disponibile,
aceast cutare putnd fi dirijat sau nedirijat. Cutarea dirijat presupune c se ia n
considerare un atribut sau un cmp, ale crui valori se explic prin celelalte cmpuri. Cutarea
nedirijat identific relaiile sau structurile din datele examinate fr a asigura prioritate unui
cmp sau a altuia. Ceea ce se exploateaz prin Data Mining sunt colecii de date constituite
pentru alte scopuri (exemplu tranzacii derulate pe o perioad de timp). Deseori la acest tip de
date se adaug i cele provenite din alte surse cum statistici oficiale care privesc evoluia n
ansamblu a economiei, date privind concurena sau msuri legislative. De aceea se folosete tot
mai des noiunea de informaie ascuns n sensul c este aproape imposibil detectarea
corelaiilor sau raporturile pe care datele le ncorporeaz n mod intrinsec. Rezultatea obinute
sunt cu att mai relevante cu ct ele se bazeaz pe un volum mare de date. Datele pot fi
exploatate pentru a obine informaii prin diverse tehnici cum sunt: reele neuronale, arbori de
decizie, algoritmi genetici, analiza grupurilor, raionamente bazate pe cazuri, analiza legturilor.
Aceste tehnici pot fi asociate cu tehnici statistice cum sunt regresiile sau analiza factorial.
Data Mining nu este capabil, ca tehnic, s rezolve orice problem de gestiune. De fapt
ceea ce poate oferi se rezum la cteva aciuni cum sunt: clasificarea, estimarea, predicia,
gruparea, analiza gruprilor, care folosite la locul potrivit pot deveni utile pentru o mulime de
probleme din domeniul decizional18.
Herb Edelstein de la Two Crows Corporation definete Data Mining ca un ansamblu de
tehnici de descoperire a abloanelor ascunse (hidden patterns) i a relaiilor existente ntre date
cu scopul de a asista luarea celor mai bune decizii n afaceri.
Clasificarea are ca scop plasarea obiectelor prelucrate ntr-un grup limitat de clase
predefinite. De exemplu, vnzarea unui produs nou se poate ncadra ntr-una din urmtoarele
categorii de risc: sczut, mediu, ridicat. Obinute n mod clasificat vor fi reprezentate sub form
de nregistrri care la rndul lor sunt compuse din atribute sau cmpuri. Ca tehnici de Data
Mining pentru clasificare sunt arborii de decizie i raionamentul bazat pe cazuri.
Estimarea va atribui o valoare unei variabile pe baza celorlalte date de intrare.
Rezultatele obinute n urma estimrii sunt valori continue. Pentru acest tip de prelucrri se pot
utiliza reelele neuronale.
Predicia poate clasa nregistrrile luate n considerare n funcie de un anumit
comportament sau o valoare viitoare estimat. De aceea se va recurge la o colecie de exemple
care vizeaz date din trecut, n care valorile variabilei de previzionat sunt deja cunoscute. Cu
ajutorul lor se va construi un model care va putea explica comportamentul observat. Aplicnd
acest model nregistrrilor care fac obiectul prelucrrii, se va obine o predicie a
comportamentului sau a valorilor acestora n viitor.
Gruparea poate duce la determinarea acelor obiecte care apar cel mai fecvent mpreun.
Un exemplu este analiza coului gospodriei n evalurile statistice.
Analiza grupului urmrete o divizare a populaiei eterogene n grupuri mai omogene
care poart numele de clustere.
n aceast tehnic nu se pleac de la un set predeterminat de clase i nici din exemple din
trecut. Segmentarea pe grupuri se face n funcie de similitudinile obiectelor.

4.3. Categorii de date care pot fi minerite


n principiu, procesul Data Mining poate fi aplicat asupra oricrui tip de depozit de date,
precum i asupra fluxurilor de date (trectoare). Dintre acestea cele mai uzuale sunt:
bazele de date relaionale;
bazele de date tranzacionale;
depozitele de date - Data Warehouses;
bazele de date obiecturale;
bazele de date n tehnologii avansate.
Tehnicile Data Mining pot fi comune sau diferite de la o categorie la alt categorie de
date, fiind determinate de caracteristicile specifice fiecreia dintre aceste categorii.

4.4. Categorii de modele de date care pot fi minerite

n termeni generali, modelul reprezint o simplificare a realitii. Practic, descrierea


elementelor i fenomenelor din realitatea nconjurtoare, reduse la caracteristicile lor eseniale
pentru un anumit domeniu de activitate, definete un model.

18
Two Crows: Data Mining Glossary.
Modelarea este o tehnic general acceptat de specialitii din toate domeniile de
activitate. Se construiesc modele arhitecturale pentru a ajuta utilizatorii lor s vizualizeze
cldirile. Se construiesc modele matematice pentru a analiza traiectoria navetelor spaiale n
cosmos sau tendinele de evoluie a pieei. n era comunicaiilor digitale i a internet- ului, se
construiesc modele software care conduc la realizarea unor sisteme informatice flexibile, uor
adaptabile la schimbrile rapide de tehnologice i la cerinele utilizatorilor, mereu n cretere.
Dup cum, se construiesc modele de date pentru a descoperi cunotinele ascunse n depozitele
de date, utile n fundamentarea deciziilor manageriale strategice i de perspectiv.
Extragerea modelelor de date, aplicnd asupra datelor stocate n baze de date, data
warehouse sau n orice alt tip de depozit de date tehnici inteligente (avansate) de analiz,
denumite generic tehnici data mining, este un proces laborios denumit, n mod uzual, proces
data mining sau, pe romnete, proces de minerit, prin similitudine cu procesul clasic de
minerit care urmrete extragerea minereurilor din roci. n acest context, se spune, n mod uzual,
c modelele de date care pot fi extrase printr-un proces de minerit sunt minate, adic
sunt cutate i extrase din datele stocate n depozitele de date ale utilizatorului, aa cum sunt
cutate i extrase minereurile din roci.
Modelele de date care pot fi minerite sunt grupate pe categorii determinate de funciile
sistemului Data Mining, denumite pe scurt funcii Data Mining, care urmresc extragerea
modelelor de date din datele utilizatorului stocate n depozite de date. Pentru ndeplinirea
(realizarea) funciilor sale, sistemul Data Mining execut sarcini specifice, denumite n mod
uzual sarcini Data Mining, care au ca rezultat modele de date care pot fi minerite de
utilizator.
O sarcin Data Mining se definete ca fiind o activitate sau un set de activiti care se
execut pentru ndeplinirea sau realizarea unei funcii a sistemului Data Mining. Practic, sarcina
Data Mining reprezint partea procesului Data Mining care se desfoar pentru ndeplinirea
unei funcii Data Mining. La modul general, sarcinile Data Mining pot fi clasificate n dou mari
categorii:
- sarcini descriptive, cele care descriu caracteristicile generale ale datelor stocate
n baza de date, Data Warehouse sau n orce alt tip de deposit de date;
- sarcini predictive, cele care realizeaz deduceri de date din datele curente cu
scopul de a face previziuni, determinnd tendinele de evoluie ale acestora.
Principalele funcii Data Mining, sarcinile Data Mining care trebuie executate pentru
realizarea lor i categoriile de modele Data Mining care se pot obine ca rezultat, sunt
urmtoarele:
- descriere clas/concept este funcia sistemului Data Mining realizat prin
executarea sarcinilor Data Mining - caracterizare date i discriminare date care au
ca rezultat un model Data Mining de tip descriere, denumit n mod uzual descriere;
- mineritul modelelor frecvente este funcia sistemului Data Mining realizat prin
executarea sarcinilor Data Mining asociaie date i corelaie date care au ca rezultat
modele Data Mining frecvente;
- clasificarea i predicia, este funcia sistemului Data Mining realizat prin
executarea sarcinilor Data Mining de clasificare date i predicie care au ca rezultat
modele Data Mining de clasificare (clasificator) i predicie (predictor);
- analiza grupurilor, este funcia sistemului Data Mining realizat prin executarea
sarcinii Data Mining de grupare a datelor cu caracteristici representative
commune, care are ca rezultat un model Data Mining de grupare;
- analiza excepiilor, este funcia sistemului data mining realizat prin executarea
sarcinii Data Mining de analiz a excepiilor care are ca rezultat un model Data
Mining al excepiilor (date atipice);
- analiza evoluiei, este funcia sistemului Data Mining realizat prin executarea
sarcinii Data Mining de analiz a evoluiei datelor care are ca rezultat un model
Data Mining tendinelor de evoluie (a datelor).
De cele mai multe ori, utilizatorii nu tiu ce modele de date prezint interes pentru ei i
doresc s extrag mai multe categorii diferite de modele din datele stocate n depozitlele de date
la dispoziia lor (baze de date, Data Warehouse etc.). De aceea, este important ca un sistem Data
Mining s poat mineri categorii variate de modele de date pentru a rspunde diverselor
aplicaii i/sau ateptrilor diferiilor utilizatori. Este important ca un sistem Data Mining s
permit extragerea de modele de date pe diferite nivele de abstracie, corespunztoare nivelelor
de detaliu solicitate de utilizatori. i este important ca un sistem Data Mining s accepte
sugestiile utilizatorilor pentru a direciona cutrile ctre modelele de date care i intereseaz.

4.4.1. Descriere clas/concept

ntr-un sistem Data Mining datele stocate n baze de date, Data Warehouse sau n orice
alt tip de depozit de date sunt grupate n clase sau asociate la concepte. Spre exemplu, datele
stocate n baza de date de eviden a produciei organismului economic definit generic pot fi
grupate n dou clase care conin produse de categoria a I-a i produse de categoria a II-a, iar
datele stocate n baza de date de eviden a clienilor pot fi asociate conceptelor mariClieni i
bugetClieni. Dup cum, datele stocate n baza de date de eviden a articolelor unui magazin de
tehnic de calcul pot fi grupate n ase clase care conin calculatoare, imprimante, scannere,
camere video i produse software, i pot fi asociate conceptelor articolePentruCasa,
articoleProfesionale, articoleScumpe i articoleCuPreRedus.
Descrierea clas/concept este funcionalitatea sistemului Data Mining care se realizeaz
prin executarea urmtoarelor sarcini Data Mining:
- caracterizarea datelor, este sarcina Data Mining care const n rezumarea datelor din clasa
analizat, denumit n mod uzual clas-int;
- discriminarea datelor, este sarcina Data Mining care const n compararea datelor din clasa
int cu datele dintr-una sau din mai multe clase de comparat;
- caracterizarea i discriminarea datelor, este sarcina Data Mining care const att n
rezumarea datelor din clasa int, ct i n compararea acestora cu cu datele dintr-una sau din
mai multe clase de comparat.
Caracterizarea datelor este rezumarea, n termeni ct mai concii i mai precii cu
putin, a caracteristicilor sau trsturilor generale, eseniale, aferente datelor din clasa int.
Datele din clasa int, specificate de utilizator, se pot colecta, n mod tipic, printr-o interogare a
bazei de date (database query) n care sunt stocate. Spre exemplu, pentru caracterizarea
produselor fabricate de un organism economic ale cror vnzri au crescut cu mai mult 20% n
ultimul an, utilizatorul colecteaz datele de analizat prin executarea unei interogri (query) SQL
asupra bazei de date de eviden a vnzrilor.
Caracterizarea efectiv a datelor stocate ntr-o baz de date, Data Warehouse sau n orice
alt tip de depozit de date se realizeaz prin aplicarea urmtoarelor metode de analiz a datelor:
- rezumarea simpl a datelor, bazat pe msurtori statistice i pe eantionare;
- cubul de date, bazat pe operaiile OLAP roll- up i drill- down, care poate fi utilizat pentru
rezumarea datelor, proces controlat de utilizator, de-a lungul dimensiunilor specificate de
acesta;
- tehnica de inducie orientat pe atribut, care poate fi utilizat pentru a realiza caracterizarea
i generalizarea datelor fr interaciunea direct a utilizatorului cu sistemul Data Mining.
Caracterizarea datelor, ca sarcin Data Mining descriptiv, are ca rezultat descoperirea
unui model Data Mining de tip descriere (denumit n mod uzual descriere), care poate fi
prezentat utilizatorului sub diferite forme denumite n mod uzual forme de caracterizare, cele
mai uzuale fiind diagramele, graficele, tabelele, cuburile de date, relaiile generalizate sau
regulile de caracterizare.
Discriminarea datelor este comparaia caracteristicilor generale, eseniale, aferente
datelor din clasa int cu caracteristicile generale, eseniale, aferente datelor dintr-una sau mai
multe clase de comparat. Datele din clasele int i de comparat, specificate de utilizator, se pot
colecta, n mod tipic, prin interogarea bazei de date (database query) n care sunt stocate. De
exemplu, pentru compararea trsturilor generale ale studenilor cu medie de promovare n anul
universitar anterior, cu trsturile generale ale studenilor cu medie sub media de promovare n
aceeai perioad de timp, utilizatorul poate colecta datele de analizat prin executarea unei
interogri (query) SQL asupra bazei de date de eviden a studenilor.
Metodele de analiz a datelor, utilizate pentru discriminarea datelor stocate ntr-o baz de
date, Data Warehouse sau n orice alt tip de depozit de date, sunt similare celor utilizate pentru
caracterizarea datelor, i anume:
- compararea simpl a datelor, bazat pe rezumarea acestora, obinut prin msurtori
statistice i de eantionare efectuate asupra datelor din clasele int i de comparat;
- cubul de date, bazat pe operaiile OLAP roll- up i drill- down, care poate fi utilizat pentru
rezumarea i compararea datelor prin controlul utilizatorului, de-a lungul dimensiunilor
specificate de acesta;
- tehnica de inducie orientat pe atribut, care poate fi utilizat pentru a realiza discriminarea
i generalizarea datelor fr interaciunea direct a utilizatorului cu sistemul Data Mining.
Discriminarea datelor, ca sarcin Data Mining descriptiv, are ca rezultat descoperirea unui
model Data Mining de tip descriere (denumit n mod uzual descriere), care poate fi prezentat
utilizatorului sub aceleai forme ca i modelul data mining rezultat prin caracterizarea datelor,
cu deosebirea c formele de prezentare obinute n acest caz sunt denumite, n mod uzual, forme
de discriminare (grafice de discriminare, reguli de discriminare etc.) i descrierile
discriminrilor pot conine msuri de comparaie care ajut la deosebirea clasei int de clasele
de comparat.

4.5. Sistemul Data Mining

Sistemul Data Mining este sistemul informatic format din ansamblul componentelor
hardware i software care interacioneaz i comunic ntre ele pentru descoperirea (extragerea)
modelelor de date care reprezint cunotinele ce intereseaz dintr-o cantitate mare de date
stocat n baze de date, Data Warehouses sau n alte tipuri de depozite de date. Altfel spus, este
sistemul informatic n cadrul cruia se desfoar procesul Data Mining.
4.5.1. Structura sistemului Data Mining
Structura sistemului Data Mining (model de principiu) reprezint, prin definiie, modul
de organizare intern a acestuia pentru ndeplinirea funciei sale: aplicarea tehnicilor Data
Mining asupra datelor stocate n baze de date, Data Warehouses sau n alte tipuri de depozite de
date, cu scopul de a descoperi modele de date care intereseaz n fundamentarea deciziilor
manageriale, proces denumit generic proces Data Mining (fig. 4.3).

INTRRI asupra PRELUCRRI IEIRI


(de date) cruia (de date) rezult (de date)
setul de date care se aplic tehnici modele de date
trebuie minerit
(analizat n detaliu Data Mining (cunotine extrase prin
pentru descoperirea aplicarea de tehnici Data
(operaii care se Mining asupra setului de
cunotinelor care aplic asupra
intereseaz) date analizat n procesul
setului de date n Data Mining)
procesul
Data Mining)

Fig. 4.3. Structura sistemului Data Mining

Setul de date care trebuie minerit, tehnicile Data Mining i modelele de date
descoperite n procesul Data Mining reprezint componentele structurale ale sistemului Data
Mining.

Intrrile sistemului Data Mining


Intrrile sistemului Data Mining specific sarcinile Data Mining care se execut pentru
ndeplinirea sau realizarea funciilor sistemului Data Mining de descoperire (extragere) a
modelelor de date ascunse n datele utilizatorului stocate n depozite de date, cel mai adesea de
tip baz de date sau depozit de date.
Intrrile sistemului Data Mining sunt, prin definiie, interogri Data Mining (Data
Mining query) deoarece se formuleaz sub form de ntrebri, fie folosind un limbaj de
interogare adecvat, fie cu asistena unei interfee grafice dedicate. Practic, fiecare ntrebare
(query) se transform pe durata procesului Data Mining ntr-un set de operaii care definesc o
sarcin Data Mining ce se execut pentru ndeplinirea sau realizarea unei funcii a sistemului
Data Mining.
O interogare Data Mining este format din aa numitele primitive Data Mining care, prin
definiie, reprezint elementele fundamentale (de baz) necesare pentru specificarea unei sarcini
Data Mining sub form de interogare Data Mining. Acestea sunt:
- setul de date relevante pe sarcin Data Mining, care cuprinde specificaiile datelor
minerite prin execuia sarcinii Data Mining de ctre sistemul Data Mining;
cuprinde:
denumirea depozitului de date (baz de date, data warehouse etc.) care stocheaz
datele care se mineresc;
tabele baz de date sau cuburi data warehouse;
atribute baz de date sau dimensiuni data warehouse de interes pentru utilizator
denumite, n mod curent, atribute sau dimensiuni relevante;
condiii de selecie a datelor;
criterii de grupare a datelor;
- categoria de cunotine care trebuie minerit; reprezint categoria de modele de
date de interes pentru utilizator care se extrag prin execuia sarcinii Data Mining de
ctre sistemul Data Mining (caracterizare/discriminare, asociere/corelare,
clasificare/predicie, grupare etc);
- cunotinele de baz - sunt cunotine despre domeniul care trebuie minerit
necesare pentru direcionarea procesului Data Mining i pentru evaluarea modelelor
de date; cea mai uzual form a cunotinelor de baz este ierarhia, care permite
mineritul datelor pe mai multe nivele de abstracie, corespunztoare nivelelor de
detaliu specificate de utilizator;
- msurile interesului pe care l reprezint un model de date pentru utilizator; se
utilizeaz pentru direcionarea procesului Data Mining ctre extragerea modelelor de
date care prezint interes pentru utilizator, precum i pentru evaluarea modelelor de
date extrase; spre exemplu, regulile de asociere cu suport i ncredere sub limitele
specificate de utilizator sunt considerate neinteresante;
- reprezentarea modelului extras pentru vizualizare; specific forma n care sunt
prezentate utilizatorului modelele de date extrase; poate cuprinde reguli, tabele, hri,
grafice, arbori decizionali i cuburi de date.
Formularea interogrilor Data Mining formate din primitive Data Mining se face cu
ajutorul unui limbaj de interogare Data Mining (Data Mining Query Language- DMQL) orientat
pe interaciunea utilizatorilor cu aplicaiile Data Mining. Practic, limbajul de interogare Data
Mining permite utilizatorului s formuleze cereri (Data Mining) sub form de ntrebri
(interogri) pentru executarea sarcinilor Data Mining specificate prin primitivele Data Mining.
Un asemenea limbaj trebuie s furnizeze comenzi pentru specificarea fiecreia dintre primitivele
Data Mining.
Limbajul de interogare Data Mining, cu editorul corespunztor, permit utilizatorului
uman i aplicaiilor- utilizator din cadrul altor sisteme informatice s interogheze sistemul Data
Mining n mod compilativ i/sau interactiv. Comunicarea interactiv a utilizatorului cu sistemul
Data Mining se poate face fie direct, prin formularea de interogari Data Mining, fie prin
intermediul unei interfee grafice dedicate, construit pe baza unui limbaj de interogare Data
Mining. Practic, se poate construi o interfa grafic prietenoas pentru fiecare tip de limbaj de
interogare Data Mining definit.

4.5.2. Arhitectura sistemului Data Mining


Sistemul Data Mining este, n esena sa, un produs software cu funcii Data Mining
denumit generic aplicaie Data Mining care cuprinde:
- interfaa Data Mining, modulul software care asigur interaciunea (comunicarea) cu
utilizatorii care formuleaz cereri Data Mining (solicitri de execuie a sarcinilor Data
Mining pentru extragerea de modele de date);
- serverul Data Mining, modulul software care gestiuneaz cererile Data Mining efectuate
de utilizator;
- tehnicile Data Mining, module software care fac analiza datelor stocate n depozitele de
date pentru descoperirea modelelor de date i evluarea acestora, att ca interes pentru
utilizator, ct i ca baz de cunotine, rspunznd astfel cererilor data mining efectuate
de utilizator
Aplicaia Data Mining este singura component a sistemului Data Mining care integreaz
tehnici de analiz avansat a datelor pentru extragerea modelelor de date ascunse n datele
utilizatorului i pentru evaluarea acestora, motiv pentru care, din punctul de vedere al
utilizatorului, sistemul Data Mining se reduce la acest produs software. Altfel spus, aplicaia
Data Mining reprezint pentru utilizatorul final sistemul Data Mining i este referit ca atare.
Sistemul Data Mining este, n ansamblul su, o interfa software ntre utilizator i
depozitul de date minerit pentru extragerea modelelor de date care reprezint cunotine cu
importan n managementul decizional, fie c este vorba de o aplicaie utilizator sau de
utilizatorul uman.
Arhitectura sistemului Data Mining (model constructiv) cuprinde, n principal,
urmtoarele componente (fig.4.4):
DataBase, Data Warehouse, World Wide Web sau alt tip deposit de informaii; este
vorba de una sau mai multe baze de date, data warehouses, spreadsheets sau alte categorii
de depozite de date;
Serverul Database sau Data Warehouse; este sistemul de calcul responsabil pentru
extragerea datelor relevante (semnificative), n funcie de cererea Data Mining efectuat
de utilizator;
Knowledge Database (baza de date de cunotine); reprezint domeniul de cunotine
utilizat pentru direcionarea cutrii modelelor de date sau pentru evaluarea importanei
acestora n raport cu solicitrile utilizatorului;
Data Mining engine: set de module funcionale necesare pentru analiza sarcinilor
specifice procesului Data Mining: asocierea, corelarea, caracterizarea, clasificarea,
predicia, analiza grupurilor (cluster analysis), analiza excepiilor (outlier analysis),
analiza evoluiei etc.;
Modul de evaluare a modelului (att ca interes ct i ca baz de cunotine): este
componenta care interacioneaz cu modulele Data Mining pentru a focaliza cutarea
ctre modelele de date care intereseaz; poate utiliza limite de importan pentru a filtra
modelele de date descoperite la iesire; pentru eficiena procesului Data Mining este
recomandat s se mping analiza importanei modelului de date ct mai adnc posibil
(mai n detaliu), astfel nct s se limiteze cutarea numai la modelele care intereseaz;
Interfaa utilizator (grafic): este componenta care asigur comunicarea sistemului
Data Mining cu utilizatorii si, crora le permite:
- s furnizeze informaiile necesare pentru direcionarea cutrii i realizarea explorrii
datelor, prin intermediul unei interogri sau unei sarcini Data Mining;
- s baleieze schemele bazelor de date, data warehouses sau altor structuri de date, pentru
extragerea setului de date care prezint nteres n procesul Data Mining;
- s evalueze modelele de date extrase (minerite) i s le vizualizeze n diferite forme,
ct mai prietenoase pentru utilizator.
O arhitectur bine stabilit (model constructiv), nc din faza de proiectare, conduce la un
sistem Data Mining capabil s utilizeze optim performanele mediului informatic implicat pentru
desfurarea eficient a procesului Data Mining, ceea ce impune:
- asigurarea eficient a schimbului de date cu alte sisteme informatice (spre exemplu, baz
de date sau data warehouse);
- dezvoltarea i utilizarea tehnicilor Data Mining impuse de specificul datelor aspupra
crora se aplic procesul Data Mining;
- adaptarea funcionalitii la cerinele de minerit solicitate de utilizatori.

Interfaa utilizator

Evaluarea modelului
Baz de
Data mining engine cunotine

Database sau data warehouse server

data cleaning, integration and selection

Data World Alte depozite


Database
Warehouse Wide Web de informaii

Fig. 4.4. Arhitectura unui sistem Data Mining tipic

4.5.3. Clasificarea sistemelor Data Mining


Clasificarea sistemelor Data Mining se face n funcie de criterii astfel stabilite nct s
ofere fiecrui utilizator posibilitatea de a identifica cu uurin sistemul Data Mining cel mai
potrivit pentru necesitile sale manageriale. Principalele criterii de clasificare a sistemelor Data
Mining sunt urmtoarele:
1. categoria de depozit de date care conine datele asupra crora se aplic procesul
Data Mining i care, la rndul lor, se clasific n funcie de:
- modelul de date n jurul cruia este construit depozitul de date, caz n care se
deosebesc sisteme Data Mining relaionale, tranzacionale, data warehouse,
obiecturale, relaional- obiecturale sau heterogene;
- tipul datelor manipulate, caz n care se deosebesc, n principal, sisteme Data Mining
temporale, secveniale sau time-series, text sau multimedia, pentru fluxuri i secvene
de date, precum i pentru Web;
2. categoria de tehnici Data Mining integrate pentru ndeplinirea funciilor Data
Mining, care caz n care se deosebesc sisteme Data Mining care:
- integreaz o singur categorie de tehnici Data Mining care realizeaz funciile Data
Mining pentru descoperirea unei singure categorii de modele de date, ca de exemplu
tehnici pentru caracterizarea i discriminarea datelor, pentru asociaerea i corelaia
datelor, pentru clasificare i predicie, pentru grupare i analiz excepii sau pentru
analiza evoluiei datelor;
- integreaz tehnici Data Mining multiple care realizeaz funciile Data Mining pentru
descoperirea unor categorii variate de modele de date necesare n diverse aplicaii
i/sau pentru a rspunde ateptrilor diferiilor utilizatori (sisteme Data Mining
complexe);
3. nivelul de abstracie la care se mineresc datele, caz n care se deosebesc sisteme
Data Mining care asigur extragerea modelelor de date:
- pe un singur nivel de abstractie, corespunztor unui singur nivel de detaliu care este
specificat de utilizator, caz n care se obin cunotine generalizate- la un nivel ridicat
de abstracie sau cunotine primare- la cel mai de jos nivel de abstracie;
- pe mai multe nivele de abstractie, corespunztoare nivelelor de detaliu solicitate de
utilizatori (sisteme Data Mining avansate);
4. frecvena de apicare a procesului Data Mining, caz n care se deosebesc sisteme
Data Mining care mineresc datele:
- regulat (frecvent sau ritmic), pentru extragerea modelelor de date respectate de
majoritatea datelor din setul de date selectat de utilizator pentru analiz; n general,
tehnicile Data Mining de tip caracterizare i discriminare, asociaie i corelaie,
clasificare i predicie, precum i grupare mineresc datele cu regularitate, rejectnd
excepiile;
- neregulat (la nevoie), pentru extragerea datelor aflate n afara modelelor de date
respectate de majoritatea datelor din setul de date selectat de utilizator pentru analiz,
considerate excepii; n acest caz n care se folosesc, n mod uzual, tehnicile Data
Mining de analiz a excepiilor;
5. modul de interaciune cu utilizatorul implicat, caz n care se deosebesc sistemele
Data Mining care
- nu interacioneaz cu utilizatorul implicat pe durata procesului Data Mining
(autonome sau independente);
- interacioneaz cu utilizatorul implicat pe durata procesului Data Mining
(interactive); spre exemplu, interaciunea bazat pe interogare (query- driven);
6. metoda de analiz a datelor utilizat, caz n care se deosebesc sisteme Data Mining
care folosesc metode de analiz a datelor orientate pe:
- modelul de date n jurul cruia este construit depozitul de date care conine datele
asupra crora se aplic procesul Data Mining, care, la modul general, poate fi
bidimenional- pentru baze de date sau multidimensional- pentru data warehouse;
- forma de analiz a datelor asupra crora se aplic procesul Data Mining, caz n care
se deosebesc sisteme Data Mining pentru analiz statistic sau vizual, pentru reele
neurale etc.
7. domeniul de aplicabilitate, caz n care se deosebesc sisteme Data Mining adaptate la
specificul domeniilor de activitate care utilizeaz forme avansate de analiz a datelor
pentru eficientizarea meanagementului decizional, ca de exemplu finane, comer,
telecomunicaii, e- mail, pentru Web etc.
4.5.4. Explorarea datelor coninut i etape
Programele care realizeaz implementarea algoritmilor pentru Data Mining nu sunt
suficiente. Ele trebuie alimentate cu date care provin din diverse surse organizate pentru alte
scopuri. De aceea este necesar un proces de curare a acestora i de uniformizare pentru a fi
explorate aa cum sunt ele furnizate de programe, coninutul lor trebuind a fi analizat de
specialiti care vor identifica informaiile utile pe care acestea (rezultatele) le conin. Avnd n
vedere aceste particulariti, tehnicile de Data Mining se pot utiliza numai n procese specifice
complexe i de cele mai multe ori neliniare. Se pot astfel distinge etapele: definirea problemei;
identificarea surselor de date; colectarea i selectarea datelor; pregtirea datelor; definirea i
construirea modelului; evaluarea modelului; integrarea modelului.
Definirea problemei const n sesizarea unei oportuniti sau necesiti de afaceri. De
aceea se va delimita ceea ce urmeaz a fi rezolvat prin Data Mining, obiective urmrire i
rezultate scontate. Problema ce urmeaz a fi rezolvat prin Data Mining este o parte component
a oportunitii organizaiei, dar nu se identific cu ea. De asemenea problema trebuie s
primeasc o form adecvat pentru a putea fi tratat cu aceast tehnic.
Identificarea surselor de date const n stabilirea structurii generale a datelor necesare
pentru rezolvarea problemei precum i regulile de constituire a acestora i localizarea lor. Fiecare
surs de date va fi exeminat pentru o familiarizare cu coninutul su i pentru identificarea
incoerenelor sau a problemelor de definire.
Colectarea i selecia datelor este etapa n care se face extragerea i depunerea ntr-o
baz comun a datelor care urmeaz a fi utilizate ulterior. Aceast etap ocup un timp mare,
cam 80% din timpul total, iar existena depozitelor de date constituie un real avantaj.
n funcie de limitele echipamentelor de calcul folosite, de produsele program aplicate
coleciilor de date i nu n ultimul rnd de bugetul disponibil se poate prelucra ntregul fond de
date disponibil sau un eantion. Dac opiunea aleas este dirijat spre lucrul cu eantionare,
atunci trebuie respectate toate regulile i cerinele de selectare a acestora.
Pregtirea datelor. Datele sunt de obicei stocate n colecii de date care au fost construte
pentru alte scopuri. De aceea firesc este s existe o faz preliminar de pregtire nainte de
extragere prin Data Mining. Transformrile la care sunt supuse datele pentru Data Mining se
refer la: valori extreme, valori lips, valori de tip text, tabele. Traterea valorilor extreme se
poate face prin ncadrarea ntre anumite limite cuprinse ntre medie i un numr de abatere
standard prin excludere sau limitare sau prin izolarea vrfurilor.
n cazul valorilor lips se pot elimina cmpurile cu valori nule din nregistrri, sau se pot
completa cmpurile cu date de valori medii, deoarece existena lor poate duce la o funcionare
incorect a algoritmilor de Data Mining.
Valorile de tip text ridic probleme ntruct separarea prin spaii a cuvintelor duc la
apariia de valori diferite. Din acest motiv este indicat eliminarea lor, dar dac prelucrarea lor
nu poate fi eliminat, soluia cea mai pertinent este de codificare prin tabele de corespondene,
n care s se evidenieze toate irurile valide de caractere.
Rezumarea se aplic atunci cnd datele sunt considerate a reprezenta detalii
nesemnificative pentru rezolvarea problemei, sau cnd numrul de exemple este insuficient.
Codificarea incoerent apare n momentul n care obiecte identice sunt reprezentate
diferit n unele din sursele utilizate.
Incompatibilitile arhitecturale informatice se refer la diferenele existente ntre modul
de reprezentare intern a valorilor datorat crerii lor cu sisteme din generaii diverse.
Definirea i construirea modelului este etapa care se apropie cel mai mult de noiunea
de Data Mining i se refer la crearea modelului informatic care va efectua exploatarea. Etapa
de definire i construire a modelului este nsoit de faza de instruire sau nvare, depinznd de
tehnicile de Data Mining utilizate. Indiferent de aceste tehnici toate au de parcurs dou etape:
nvarea i testarea. Invarea presupune existena unui set suficient de reprezentativ de exemple
complete de la care se pornete pentru a identifica relaiile de legtur ntre valorile cmpurilor
sau atributelor. Se consider ca fiind ncheiat procesul de nvare, n momentul n care
rezultatele obinute prin model se apropie suficient de mult de soluiile coninute de datele dup
care s-a nvat. Nu ntotdeauna rezultatele sunt cele scontate i atunci modelul va fi supus
testrii cu date diferite de cele folosite pentru nvare, dar care aparin aceleiai colecii. n
aceast etap sunt formulate alte dou obiective i anume: obinerea de date preclasate i
distribuirea acestora n seturi de nvare, testare sau evaluare.
Evaluarea modelului are ca scop de a determina corect valorile n care modelul are
capacitatea de a determina corect valorile pentru cazurile noi. Modelul va fi astfel aplicat asupra
ultimei pri din datele preclasate care sunt dedicate evalurii. Procentul de eroare ce se stabilete
acum va fi considerat c va fi acceptat i pentru datele noi. Performanele unui model se vor
aprecia cu matricea de confuzie care are rolul de a compara situaia real cu cea pe care
modelul o furnizeaz.
Integrarea modelului este etapa n care se finalizeaz procesul, prin ncorporarea
modelului n SIAD ca element de baz, sau prin includerea sa ntr-un proces decizional general
din organizaie.

4.5.5 Raionamentul bazat pe cazuri


Prin aceast tehnic se caut o rezolvare a problemelor aprute prin analogie cu
experiena acumulat. Aceast metod se poate aplica pentru clasificri i pentru predicii.
Cazurile pe care este bazat raionamentul sunt memorate ca nregistrri compuse din setul de
atribute care descriu fiecare caz. Un caz nou este prezentat tot ca o nregistrare, numai c n
cmpurile n care valoarea trebuie determinat sunt vide. Pentru a determina aceste valori se
caut nregistrrile cu care nregistrarea caz nou se aseamn i coninutul acestora se
consider a fi rspunsul. Prin urmare se poate afirma c exist dou funcii fundamentale de
prelucrare:
a) msurarea distanei dintre membrii fiecrui cuplu de nregistrri, pentru a afla vecinele
cele mai apropiate;
b) combinarea rezultatelor obinute de la vecine n rspunsul propus pentru cazul curent;1
Msurarea distanei dintre cmpuri. Se numete distan expresia modului n care se
evalueaz similitudinea. Distana are ca proprieti: poate fi definit i se prezint ca un numr
real; distana de la un element la el nsui este totdeauna nul; sensul de msurare este fr

1
Zaharie D, Albescu F, colectiv Op. Cit.
semnificaie n maniera c distana de la elementul A la elementul B este egal cu distana de la
B la A i nu exist un punct C intermediar lui A i B prin a crei parcurgere s se scurteze
drumul de la A la B. Ca moduri de calcul pentru distana cmpurilor numerice se enumer:
diferena ntre valoare absolut |A-B|;
ptratul diferenei (A-B)2
diferena ntre valoare absolut normalizat |A-B| (diferena maxim). Ultima variant
produce rezultate cu valori cuprinse ntre 0 i 1.
Msurarea distanei ntre nregistrri. Cnd apare necesitatea de a considera simultan
mai multe cmpuri ale nregistrrii, se calculeaz distana pentru fiecare cmp n parte, iar
rezultatul se combin ntr-o valoare mic care reprezint distana nregistrrii respective.
Se vor enumera cteva procedee de combinare a distanei cmpurilor: nsumarea,
nsumarea normalizat (suma distanelor/suma maxim), distana euclidian (rdcina ptrat din
suma ptratelor distanelor). Distana euclidian evideniaz cel mai bine nregistrrile pentru
care toate cmpurile sunt vecine.
Combinarea rezultatelor presupune aflarea celor mai apropiai vecini, iar soluia
problemei se obine prin combinarea rspunsurilor obinute de la acetia. Fiecare vecin poate
avea diverse variante de rspuns, dar se vor lua n calcul doar cei care sunt mai apropiai.
Rezultatul ce obine majoritatea va fi atribuit cazului curent. Cerina minim este ca numrul
votanilor s fie impar, pentru a evita situaiile de nedeterminare.
Metodele care se bazeaz pe vot dau rezultate satisfctoare n situaiile n care
rspunsurile ateptate sunt de tip enumerativ. O alt soluie posibil este interpolarea valorilor
nregistrrilor vecine care ns introduce o aplatizare a rezultatelor care se nscriu ntre cele dou
limite folosite n calcul. De asemenea, se poate constata c rezultate bune se obin prin metode de
regresie statistic aplicate asupra valorilor date de vecinii cei mai apropiai. Se obine ecuaia
unei drepte sau a unei curbe care permite calcularea mai precis a valorilor aferente cazului
curent.
Se poate concluziona c raionamentul bazat pe cazuri este o tehnic de Data Mining
suficient de bun i care se poate aplica unui mare numr de probleme, caz n care conduce la
soluii acceptabile. Toate acestea sunt valabile dac volumul de date pe care se bazeaz este bine
ales i concludent. Ca avantaje pentru aceast metod se pot enumera:
aplicarea unui mare numr de tipuri de date, pe structuri de date complexe, iar cmpurile
tip text sunt mai bine tratate dect n alte tehnici;
luarea n considerare a orict de multor cmpuri;
rezultatele obinute sunt explicite;
elementele de noutate care apar n procesul de nvare sunt uor de nglobat i de folosit
n raionamente.
Ca orice metod prezint i unele dezavantaje dintre care se pot meniona: volumul mare
de memorie i resurs timp de prelucrare relativ mare, i de asemenea, timpul de prelucrarea
mare pentru aplicarea funciilor de distan asupra tuturor nregistrrilor i cmpurilor necesare
pentru obinerea rezultatelor.

S-ar putea să vă placă și