Sunteți pe pagina 1din 74

Cuprins

Cuprins ...................................................................................................................................1
Introducere .............................................................................................................................2
Unitatea 1-Rolul sistemelor informatice de asistare a deciziilor în procesul decizional
financiar-contabil: decizia, procesul decizional, decidentul, definiţii ale sistemelor
informatice de asistare a deciziilor .........................................................................................3
Răspunsuri la teste de autoevaluare .................................................................................14
Unitatea 2- Arhitectura unui sistem informatic de asistare a deciziilor: componenta de
gestiune a datelor..................................................................................................................16
Răspunsuri la teste de autoevaluare ................................................................................18
Unitatea 3- Arhitectura unui sistem informatic de asistare a deciziilor: componenta de
gestiune a modelelor ............................................................................................................19
Răspunsuri la teste de autoevaluare ................................................................................21
Unitatea 4-Arhitectura unui sistem informatic de asistare a deciziilor : componenta de
gestiune a dialogului şi componenta de gestiune a cunoştinţelor .........................................22
Răspunsuri la teste de autoevaluare ................................................................................24
Unitatea 5- Clasificarea SIAD..............................................................................................25
Răspunsuri la teste de autoevaluare .................................................................................27
Unitatea 6- Caracteristici SIAD ...........................................................................................28
2. http://en.wikipedia.org/wiki/Decision_support_systems .........................................29
Teste de autoevaluare .......................................................................................................29
Unitatea 7- Depozite de date: definiţii, arhitectura ..............................................................30
Răspunsuri la teste de autoevaluare .................................................................................37
Unitatea 8- Depozite de date: tipuri de depozite de date ......................................................39
Răspunsuri la teste de autoevaluare .................................................................................44
Unitatea 9- Tehnologii OLAP ..............................................................................................46
Răspunsuri la teste de autoevaluare .................................................................................51
Unitatea 10- Data mining: definiţii, arhitectura sistemelor de data mining .......................54
Răspunsuri la teste de autoevaluare .................................................................................62
Unitatea 11- Data mining: metode şi tehnici de data mining ..............................................64
Răspunsuri la teste de autoevaluare .................................................................................71
Bibliografie ..........................................................................................................................73
Introducere
Cursul Sisteme informatice de asistare a deciziilor este destinat
studenţilor din anul 3, specializarea Contabilitate şi Informatică de Gestiune.
Materialul este structurat pe 11 unităţi de învăţare, menite să ajute
studenţii să dobândească cunoştinţele în mod gradual.
La finalul semestrului 2, studentul va avea urmatoarele cunoştinţe:
 conceptul de decizie,
 conceptul sistem informatic de asistare a deziciei
 structura unui sistem informatic de asistare a deziciei
 clasificarea SIAD
 caracteristici SIAD
 organizărea datelor în depozite de date
 conceptul OLAP
 aspectele particulare ale sistemelor de procesare analitică
on-line (OLAP) ;
 conceptul de Data Mining
 metode de data mining
 tehnici de data mining
Fiecare unitate de învăţare conţine obiective, timp alocat studiului,
rezumat, teste de autoevaluare, teste de verificare şi bibliografie care vin în
sprijinul studentului.

2
Unitatea 1-Rolul sistemelor informatice de asistare a deciziilor în
procesul decizional financiar-contabil: decizia, procesul decizional,
decidentul, definiţii ale sistemelor informatice de asistare a deciziilor

Obiective
După parcurgerea acestei unităţi studentul:
- va înţelege conceptul de decizie;
- va înţelege modalităţile de clasificare a deciziilor
- va înţelege particularităţile procesului de luare a
deciziilor si etapele procesului
- va înţelege conceptul de SIAD

Timp alocat studiului: 3 ore

1.1. Decizia. Concept, clasificare

Orice organizaţie economică este compusă din trei sisteme: decizional,


informaţional, operaţional. La nivel operaţional, datele sunt colectate din
diverse surse, apoi transmise către sistemul informaţional. Următorul pas este
transformarea informaţiilor în decizii. Relaţia dintre sistemul informatic şi
sistemul informaţional trebuie privit ca de la parte la intreg. Sistemul
informatic este o parte a sistemului informaţional care foloseşte echipamente
automate de prelucrare a informaţiilor1.
În cadrul activităţii economice se poate defini decizia ca rezultat al
unor activităţi conştiente de alegere a unei direcţii de acţiune din mai multe
direcţii posibile, alegere care presupune alocarea şi consumarea unor resurse,
cu riscul pierderii acestora dar şi cu posibilitatea obţinerii unui câştig.
Decizia reprezintă rezultatul prelucrării unor informaţii şi cunoştinţe
specifice domeniului de activitate respectiv. Ea poate aparţine unei singure
persoane sau unui grup de persoane, care dispun de autoritatea necesară, şi care
au responsabilitatea pentru utilizarea eficientă a resurselor în anumite situaţii

1
Teodorescu Ana-Maria, Information, the Resource of the New Economy, Annals Economic
Science Series. Timisoara, XXI, 2015/I.S.S.N. 1582 – 6333, p.409

3
date2. Decizia este o activitate umană specifică celui care urmăreşte, în mod
conştient, atingerea unor obiective bine definite.
Test de autoevaluare nr. 1
Ce este decizia?

Clasificare

În funcţie de extinderea domeniului de activitate al persoanei care


decide, putem avea o clasificare a deciziilor, după cum urmează:
- decizii personale, atunci când deciziile se referă la viaţa
personală a unui om, iar resursele alocate sunt timpul,
energia, banii, renumele, cunoştintele profesionale;
- decizii manageriale, atunci când deciziile se referă la o
organizaţie economică, iar resursele alocate sunt de tipul
resurselor umane, materiale, financiare şi informaţionale
(dintre cele informaţionale, cele mai importante fiind
cunoştinţele stocate la nivelul organizaţiei)
Dupa gradul de complexitate al deciziilor, acestea pot fi simple sau
complexe. O decizie simplă este o decizie care se referă la alegerea unei
singure direcţii de acţiune. Decizia complexă reprezintă un ansamblu de
decizii simple care se adoptă pentru îndeplinirea unui obiectiv sau a unui grup
de obiective.
După numărul de participanţi, deciziile sunt:
- cu decident individual; când decizia este adoptată de o
singură persoană ;
- cu decident multiplu; decizii care se iau de către mai
mulţi participanţi (multiparticipant) sau de către echipe
decizionale.
În funcţie de nivelul decizional, corelat cu orizontul de timp alocat
luării deciziilor, putem avea următoarea clasificare a deciziilor:
a) decizii strategice- decizii care se referă la modul în care se vor defini
obiectivele, resursele sau politicile organizaţiei pe termen mediu şi lung (ani

2
Acad. Florin Gheorghe FILIP, Decizie asistată de calculator, decizii, decidenţi, metode şi
instrumente de bază, Editura Tehnică şi Editura Expert, Bucureşti, 2002

4
de zile). Elaborarea şi adoptarea acestor decizii presupune participarea unui
număr redus de decidenţi ce lucrează, de regulă, într-o manieră creativa şi
nerepetitivă. Pentru luarea acestor decizii se folosesc date şi informaţii
puternic agregate, provenite, în principal, din surse externe organizaţiei
economice respective;
b) decizii tactice; decizii care determină cât de eficiente au fost folosite
resursele. Aceste decizii sunt specifice nivelului mediu de management şi au ca
orizont de timp lunile anului. Pentru luarea acestor decizii se folosesc date şi
informaţii mediu agregate, provenite atât din surse interne cât şi din surse
externe organizaţiei;
c) decizii de conducere operaţională; prin care se determină modul în care
sunt duse la îndeplinire sarcinile primite de către executanţi de la nivelele de
management superioare. Orizontul de timp avut în vedere pentru aceste decizii
este de săptămâni şi zile, iar pentru luarea acestor decizii se folosesc date şi
informaţii provenite, în principal, din surse interne organizaţiei.

Test de autoevaluare nr. 2


Prezentaţi clasificarea deciziilor în funcţie de nivelul decizional
implicat.

În funcţie de gradul de structurare al deciziilor:


a) decizii structurate sau programabile; adica decizii pentru execuţia
cărora care există proceduri clare, ce pot fi implementate cu uşurinţă. Acest tip
de decizie intervine în cazul proceselor cunoscute, structurate, care se
desfăşoară conform unui algoritm cunoscut.
b) decizii nestructurate (neprogramabile); sunt acele decizii care se
bazează pe experienţa decidentului care analizează problema. Acest tip de
decizie se refera la probleme atipice pentru organizaţie şi pentru care nu există
proceduri prestabilite. O decizie este considerata nestructurată atunci când
elementele sale sunt de tip calitativ, iar obiectivele şi finalitatea acestora nu
sunt precise şi nici nu există un algoritm bine precizat pentru rezolvarea lor;
c) decizii semistructurate ; sunt decizii care pot fi rezolvate doar parţial
prin proceduri cunoscute, deoarece acestea au elemente predominant calitative,
scopurile nu sunt clar precizate, iar procedura de rezolvare nu acoperă

5
ansamblul elementelor problemei. Gradul de structurare al unei deciziei
depinde de experienţa anterioară, acumulată de decident, precum şi de nivelul
şi importanţa ei. Conform terminologiei introduse de H. Simon3, în cazul
proceselor semistructurate apare nevoia unui “asistent” al managerului, acesta
fiind de fapt un proces de “asistare a deciziei”. Termenul de “asistare a
deciziei” se referea iniţial, la o serie de operaţii cum sunt sortarea, clasificarea,
selectarea, evaluarea informaţiilor, operaţii care aveau ca scop organizarea
acestoara, reducerea incertitudinii şi obţinerea mai multor variante de
rezolvare. Conceptul s-a dezvoltat prin folosirea metodelor cercetării
operaţionale, care s-au dovedit greu de aplicat în practică. De aceea a aparut o
altă modalitate de abordare a asistării deciziei şi anume “asistarea interactivă”.
Pe baza acesteia au apărut sistemele informatice de asistare a deciziei sau
Decision Support Systems (DSS), situate generic pe nivelul de management
mediu.
O altă clasificare a deciziilor poate fi făcută în funcţie de nivelul
cunoştinţelor de care dispune decidentul, cunoştinţe referitoare la evoluţia
problemei pe care o are de rezolvat. În funcţie de acest criteriu, deciziile pot fii:
1. decizii luate în condiţii de certitudine; acestea presupun o cunoaştere a
evoluţiei fenomenelor viitoare, aspect care se întâlneşte mai rar în realitatea
economica. O astfel de decizie se bazează pe folosirea unui criteriu de
optimizare a procesului economic (profit maxim, costuri de productie minime
etc.);
2. decizii luate în condiţii de incertitudine; acestea presupun
cunoaşterea evoluţiei anterioare a fenomenului economic. Cunoaşterea
evoluţiei anterioare permite o previziune şi o alegere aproximativ corectă a
variantei de decizie.
3. decizii luate în condiţii de risc; aceste decizii presupun că decidentul
cunoaşte doar aproximativ evoluţia viitoare a procesului economic, posibilul
trend al variabilelor necontrolabile şi chiar rezultatele pe care le are fiecare
strategie analizată pe baza criteriului probabilităţii maxime de realizare.
După modul de abordare a problemelor care trebuie rezolvate:

3
Simon H.A., The Behavioral alternative, Reason in Human Affairs, Basil Blackwell
Publisher, Oxford, 1983

6
1. decizii apărute ca rezultat al unor activităţi de management
întâmplătoare;
2. decizii apărute ca rezultate ale activităţilor de management bazate pe
rutină; în acest caz se folosesc şabloane ale activităţilor din trecut;
3. decizii apărute ca rezultate ale activităţilor de management bazate pe
instruire; în acest caz, modelele de decizii din trecut sunt modificate în funcţie
de achiziţionarea de cunoştinte, experienţe şi tehnici noi;
4. decizii apărute ca rezultate ale activităţilor de management
paradigmatice; în acest caz, modele din trecut ale deciziilor de succes luate în
cadrul firmei sunt preluate ca exemple de bune practici pentru analiza situaţiei
actuale;
5. decizii bazate pe analiza deciziilor (analiza şi modelarea sistemică şi
previzională); analiza deciziilor ajută decidentul în înţelegerea problemelor
decizionale şi în pregătirea acestuia pentru a face faţă situaţiilor neaşteptate şi
nefavorabile.
Dupa gradul de urgenţă al necesităţii luării deciziilor, acestea pot fi:
-decizii luate strict în timp real; acest tip de decizie este folosită pentru
managementul situaţiilor de criză (de exemplu, pentru gestionarea efectelor
unor calamităţi naturale – inundaţii, cutremure, incendii etc.);
- decizii luate aproape în timp real; sunt decizii adoptate în cazul gestionării
unor situaţii decizionale importante pentru organizaţie, cum ar fi, de exemplu,
apariţia de noi oportunităţi de afaceri, lansarea unui produs nou, apariţia stării
de faliment al firmei etc;
-decizii care nu sunt urgente; în acest caz, timpul aflat la dispoziţia decidentului
este suficient pentru realizarea unei analize detaliate a problemei de rezolvat şi
pentru alegerea variantei optime a problemei decizionale.
Dupa criteriul de secvenţialitate a deciziilor4, se
deosebesc:
a) decizii independente, apar în situaţia în care
decidentul ia decizii care nu depind unele de altele
şi sunt complet implementabile;
b) decizii dependent-secvenţiale, sau în cascada
(deciziile se iau una după alta);
4
Acad. Florin Gheorghe FILIP, Sisteme suport pentru decizii, Editura Expert, Bucureşti, 2004

7
c) decizii interdependente, se referă la o serie de
decizii independente care contribuie împreună la
atingerea unor obiective.
Test de autoevaluare nr. 3
Prezentaţi câteva criterii de clasificare a deciziilor.

1.2. Procesul decizional

Luarea deciziilor rămâne una dintre activităţile de bază ale


managerilor, înţelegănd prin acesta o persoană sau un grup de persoane ce
prezintă autoritatea necesară şi care au responsabilitatea folosirii resurselor
aflate la dispoziţia lor în situaţii bine precizate.
Decidentul uman, care este elementul fundamental al procesului
decizional, prezintă mai multe limite care determină necesitatea şi
oportunitatea asistării informatizate a deciziilor. Se deosebesc astfel limitele
cognitive (acestea se referă la capacitatea limitată a omului de a
memora şi prelucra date, informaţii şi cunoştinţe), limitele de timp (de multe
ori deciziile trebuie adoptate de către decidentul uman sub presiunea timpului
aflat la dispoziţie, timp care poate fi extrem de redus; ca urmare, aceste decizii
pot fi eronate în raport cu problema decizională) şi limitele economice (acestea
sunt deciziile determinate de costurile obţinerii, stocării, prelucrării,
transmiterii şi diseminării datelor, informaţiilor şi cunoştinţelor către toţi
membrii echipi de management).
Procesul de adoptare a deciziilor este format din următoarele etape sau
faze ale procesului decizional (cu caracter generic):
1. Informarea generală (sau „intelligence”, dupa H.Simon), aceasta
este etapa în care sunt analizate evenimentele aparute în organizaţia economică
şi sunt identificate cauzele lor de apariţie. În această etapă sunt stabilite
obiectivele, este identificată problema, este descompusă, sunt stabilite
responsabilităţile echipei şi, ca rezultat al acestei etape, se obţine descrierea

8
formală a problemei decizionale, a categoriei din care aceasta face parte şi a
tuturor responsabilităţilor care decurg din aceasta.
2. Proiectarea (design-ul) sau elaborarea procesului de asistare a
deciziei – presupune alegerea sau construcţia unui model pentru asistarea
deciziei precum şi etapele de testare şi validare a acestuia. Prima etapă a
proiectării este modelarea. În această etapă problema este abstractizată
cantitativ şi/sau calitativ. Experienţa anterioară a decidentului influenţează
modul de alegere a modelului dintr-o multitudine de modele, permiţând
încadrarea problemei de rezolvat într-o anume clasă de modele existente.
3. Alegerea (choice) este etapa principală pentru adoptarea deciziei
deoarece în cadrul ei rezultatele obţinute în celelalte etape se concretizează.
Decidentul trebuie să aleagă o singură acţiune din multitudinea de acţiuni
posibile, în funcţie de criteriul de selecţie propus şi de modelul decizional pe
care l-a selectat (dintre modelele avute la dispoziţie). El va alege dintre
posibilităţile existente, în funcţie de soluţia obţinuta la rezolvarea modelului şi
tot el selectează planul pentru implementare. Pentru alegere sunt evidenţiate
mai multe metode de căutare ca de exemplu: tehnici analitice, metode de
căutare exhaustive prin care sunt analizate toate rezultatele obţinute de fiecare
alternativă sau metode euristice, care sunt aplicabile în metodele descriptive.
Metodele analitice sunt utilizate deseori datorită utilizării modelelor
matematice pentru a găsi soluţia optimă. Utilizarea lor este însă restricţionată
de natură problemelor analizate, deoarece acestea trebuie să se încadreze în
categoria problemelor structurate. Se pot aplica astfel de metode pentru
probleme de gestiune a stocurilor sau de alocare a resurselor. Algoritmii care
stau la baza acestor metode conduc la obţinerea unor soluţii viabile pentru
modelul ales.
Metodele de căutare exhaustivă sunt utilizate, în general, la luarea în
considerare a tuturor căilor de acţiune necesare pentru a ajunge la scopul
propus. Aceste metode au la bază un proces neghidat, proces în urma căruia se
alege o soluţie optimă sau apropiată de aceasta. Căutarea de obicei este
incompletă deoarece posibilităţile de căutare sunt limitate de timp sau spaţiu de
memorie, şi procesul de căutare se va opri când se va găsi o soluţie apropiată de
cea optimă (numită suboptimă sau optim parţial).

9
Metodele de căutare euristice se bazează pe o riguroasa analiză a
problemei sau prin tehnici de căutare prin încercări (trial-and-error) succesive a
spaţiului soluţiilor. Raţionamentul făcut realizează o parcurgere a spaţiului
soluţiilor care trece de la stare la alta pe baza unor criterii particularizate pentru
tipul de problemă analizat. Starea finală obţinută poate fi un rezultat
satisfăcător sau o nereuşită (eşec). În general metoda de căutare implementată
de un sistem de asistare a deciziilor este o metoda euristică.
4. Implementarea deciziei şi evaluarea (review) este etapa care se
desfăşoară după declanşarea acţiunii alese (propuse) de decident. Rolul acestei
etape este de a realiza acţiuni corective dacă implementarea alegerii iniţiale nu
conduce la rezultatele scontate. De obicei, aceasta etapă este o mare
consumatoare de timp, resurse şi în cursul ei poate apare o diversitate de alte
probleme de rezolvat, cum ar fi scaderea gradului de suport al nivelului
superior de management.
Analiza deciziilor este o tehnică ce asigură un cadru sistematic de abordare,
structurare, descompunere şi rezolvare a problemelor decizionale, ajutându-l şi
stimulându-l pe decident să gândească şi să preia critic alternativele propuse de
echipa managerială sau de către un
sistem informatic de asistare a deciziei. Analiza deciziilor se bazează pe
metode, tehnici şi instrumente informatice specifice sau preluate din alte
discipline (cercetări operaţionale, statistică, probabilităţi, simulare etc.).
Adoptarea deciziilor constituie un proces care, pe lângă suportul tehnic, are
nevoie în principal de un decident uman, ca o componentă integrantă a
sistemului decizional. Suportul cognitiv înglobează cunoştinţele şi experienţa
decidentului precum şi capacitatea acestuia de raţionament. Suportul cognitiv
este sprijinit şi marcat în ultimele decenii de apariţia sistemelor informatice de
lucru cu cunoştinţe, KWS (Knowledge Work System) care se ocupă de probleme
de stocare, clasificare, menţinere şi calitate a cunoştinţelor.
Dacă în sistemele informatice de asistare a deciziei se includ şi bazele de
cunoştinţe, se obţin astfel sisteme informatice de asistare a deciziei orientate pe
cunoştinţe sau aşa numitele sisteme informatice de asistare inteligentă a deciziei.

10
Test de autoevaluare nr 4
Descrieţi procesul de adoptare a deciziilor

1.3. Conceptul de Sistem Informatic pentru Asistarea


Deciziei

Sistemul informaţional economic reprezintă ansamblul de metode şi


procese utilizate într-o organizaţie economică pentru colectarea şi prelucrarea
datelor necesare obţinerii informaţiilor care vor fi folosite la toate nivelurile de
decizie ale conducerii şi controlului activităţii organizaţiei respective.
Conceptul de sistem suport de decizie (SSD), sau de sistem informatic
pentru asistarea deciziei, este extrem de larg şi definiţia sa variază în funcţie de
cel care a formulat o definiţie anume. Încă din anii ’70 specialiştii au încercat să
definească cât mai complet sistemele suport de decizie şi să le stabilească
caracteristicile.
Prima definiţie a sistemelor suport de decizie a fost dată de Little, la
începutul anilor ’705. El definea SSD-ul ca fiind “un model bazat pe un set de
proceduri pentru procesarea datelor şi pentru asistarea unui manager în
procesul decizional. Un SSD trebuie să fie simplu, robust, uşor de întreţinut,
adaptiv, uşor de comunicat cu el”.
Turban defineşte un SSD ca fiind6 “un sistem informatic interactiv,
flexibil şi adaptabil, special proiectat pentru a oferi suport în soluţionarea unor
probleme manageriale nestructurate sau Iniţiere în tehnologia OLAP-teorie şi
practică semistructurate, cu scopul de a îmbunătăţi procesul decizional.
Sistemul utilizează date (interne şi externe) şi modele, oferă o interfaţă simplă şi
uşor de utilizat, permite decidentului să controleze procesul decizional şi oferă
suport pentru toate etapele procesului decizional”.
Test de autoevaluare nr. 5
Definitii SIAD

5
E. Turban, Decision Support Systems and Intelligent Systems, 5th ed., Englewood Cliffs, New
Jersey, Prentice Hall, 1998
6
E. Turban, Decision Support Systems and Intelligent Systems, 5th ed., Englewood Cliffs, New
Jersey, Prentice Hall, 1998

11
Din punct de vedere semantic, un sistem informatic de asistare a deciziei
este o arhitectură complexă, abordată unitar, care presupune un dialog
permanent cu utilizatorul, şi în care decizia finală este adoptată de
utilizator şi nu de sistem.
Diferenţa dintre un Sistem Informatic pentru Management (MIS) şi un
Sistem Informatic pentru Asistarea Deciziei (SIAD) constă în faptul că MIS
este orientat pe date şi pe relaţiile dintre acestea, în timp ce SIAD-ul porneşte de
la decident şi de la decizie. Sistemele suport pentru întreprindere (ESS –
Enterprise Support System sau EIS – Enterprise Information System) sunt
sisteme destinate asistării deciziilor pe cel mai înalt nivel al managementului
organizaţional. Ele ajută la identificarea şi rezolvarea problemelor facilitând
sesizarea de noi oportunităţi. De asemenea, acest tip de sisteme au posibilitatea
de a oferi managerului tendinţe, previziuni, analize pentru activitatea
concurenţei.

Test de verificare

1. Explicaţi deciziile luate în condiţii de incertitudine

Rezumat

Decizia reprezintă rezultatul prelucrării unor informaţii şi cunoştinţe


specifice domeniului de activitate respective. Decizia este o activitate umană
specifică celui care urmăreşte, în mod conştient, atingerea unor obiective bine
definite.
Clasificare decizii:
- extinderea domeniului de activitate al persoanei care decide:
personale, manageriale
- gradul de complexitate al deciziilor: simple sau
complexe
- numărul de participanţi, deciziile sunt:cu decident
individual, cu decident multiplu

12
- nivelul decizional: decizii strategice , decizii tactice,
decizii de conducere operaţională;
- gradul de structurare: decizii structurate sau programabile,
decizii nestructurate , decizii semistructurate
- nivelul cunoştinţelor de care dispune decidentul: decizii luate în
condiţii de certitudine; decizii luate în condiţii de incertitudine, decizii
luate în condiţii de risc
- modul de abordare a problemelor care trebuie rezolvate:
decizii apărute ca rezultat al unor activităţi de management
întâmplătoare; decizii apărute ca rezultate ale activităţilor de
management bazate pe rutină; decizii apărute ca rezultate ale
activităţilor de management bazate pe instruire; decizii apărute ca
rezultate ale activităţilor de management paradigmatice, decizii
bazate pe analiza deciziilor
- gradul de urgenţa: -decizii luate strict în timp real; decizii luate
aproape în timp real, decizii care nu sunt urgente;
- criteriul de secvenţialitate a deciziilor: independente, dependent
secventiale, decizii interdependente,
Decidentul uman, care este elementul fundamental al procesului
decizional, prezintă mai multe limite care determină necesitatea şi oportunitatea
asistării informatizate a deciziilor.
Etape proces decizional: Informarea generală, Proiectarea, Alegerea,
Implementarea deciziei şi evaluarea.
Un sistem informatic de asistare a deciziei este o arhitectură
complexă, abordată unitar, care presupune un dialog permanent cu
utilizatorul, şi în care decizia finală este adoptată de utilizator şi nu de sistem.

13
Bibliografie

1. E. Turban, Decision Support Systems and Intelligent Systems, 5th ed.,


Englewood Cliffs, New Jersey, Prentice Hall, 1998
2. Florin Gheorghe FILIP, Sisteme suport pentru decizii, Editura Expert,
Bucureşti, 2004
3. Simon H.A., The Behavioral alternative, Reason in Human Affairs, Basil
Blackwell, Publisher, Oxford, 1983
4. Teodorescu Ana-Maria, Information, the Resource of the New Economy,
Annals Economic Science Series. Timisoara, XXI, 2015/I.S.S.N. 1582 –
6333, p.409

Răspunsuri la teste de autoevaluare

1. Decizia reprezintă rezultatul prelucrării unor informaţii şi cunoştinţe


specifice domeniului de activitate respectiv. Ea poate aparţine unei singure
persoane sau unui grup de persoane, care dispun de autoritatea necesară, şi care au
responsabilitatea pentru utilizarea eficientă a resurselor în anumite situaţii date.
Decizia este o activitate umană specifică celui care urmăreşte, în mod conştient,
atingerea unor obiective bine definite.

2. Deciziile strategice sunt decizii care se referă la modul în care se


vor defini obiectivele, resursele sau politicile organizaţiei pe termen mediu şi lung
- decizii tactice, decizii care determină cât de eficiente au fost
folosite resursele. Aceste decizii sunt specifice nivelului mediu de
management şi au ca orizont de timp lunile anului
- decizii de conducere operaţională, prin care se determină modul în
care sunt duse la îndeplinire sarcinile primite de către executanţi de
la nivelele de management superioare.
3.Criterii clasificare decizii: gradul de complexitate; nivelul decizional;
numărul de participanţi,

4. Adoptarea deciziilor constituie un proces care, pe lângă suportul


tehnic, are nevoie în principal de un decident uman, ca o componentă integrantă
a sistemului decizional. Suportul cognitiv înglobează cunoştinţele şi experienţa
decidentului precum şi capacitatea acestuia de raţionament. Suportul cognitiv
14
este sprijinit şi marcat în ultimele decenii de apariţia sistemelor informatice de
lucru cu cunoştinţe, KWS (Knowledge Work System) care se ocupă de
probleme de stocare, clasificare, menţinere şi calitate a cunoştinţelor.
5. Prima definiţie a sistemelor suport de decizie a fost dată de Little, la
începutul anilor ’70. El definea SSD-ul ca fiind “un model bazat pe un set de
proceduri pentru procesarea datelor şi pentru asistarea unui manager în
procesul decizional. Un SSD trebuie să fie simplu, robust, uşor de întreţinut,
adaptiv, uşor de comunicat cu el”.
1.
Turban defineşte un SSD ca fiind “un sistem informatic interactiv, flexibil şi
adaptabil, special proiectat pentru a oferi suport în soluţionarea unor probleme
manageriale nestructurate sau Iniţiere în tehnologia OLAP-teorie şi practică
semistructurate, cu scopul de a îmbunătăţi procesul decizional. Sistemul
utilizează date (interne şi externe) şi modele, oferă o interfaţă simplă şi uşor de
utilizat, permite decidentului să controleze procesul decizional şi oferă suport
pentru toate etapele procesului decizional”.
2.
Din punct de vedere semantic, un sistem informatic de asistare a deciziei
este o arhitectură complexă, abordată unitar, care presupune un dialog
permanent cu utilizatorul, şi în care decizia finală este adoptată de
utilizator şi nu de sistem.

15
Unitatea 2- Arhitectura unui sistem informatic de asistare a
deciziilor: componenta de gestiune a datelor

Obiective
După parcurgerea acestei unităţi studentul:
-va înţelege structura unui SIAD

-va înţelege subsistemul de gestiune a datelor

Timp alocat studiului: 2 ore

2.1 Arhitectura unui SIAD

Arhitectura unui SIAD are rolul de a prezenta ansamblul elementelor


componente, tipuri de sarcini allocate fiecarei componente si modul de
interactionare a acestora. Funcţiile unui SIAD sunt: gestiunea datelor, gestiunea
modelelor, gestiunea cunoştinţelor şi gestiunea comunicării între utilizator şi
sistem, precum şi între date şi modele sau cunoştinte.
Un sistem de tip SIAD este format din următoarele subsisteme: subsistemul
de gestiune a datelor; subsistemul de gestiune a modelelor; subsistemul de
gestiune a cunoştinţelor; subsistemul de gestiune a dialogului (sau interfaţa cu
utilizatorul)7

Test de autoevaluare nr. 1


Structura unui SIAD

2.1.1 Subsistemul de gestiune a datelor

Subsistemul de gestiune a datelor este format din următoarele


componente:
a) baza de date care poate fi proprie SIAD-ului sau se poate genera prin
extragere de date din alte colecţii de date (baze de date sau depozit de date). Ea
poate fi utilizată de unul sau mai mulţi decidenţi pentru diverse aplicaţii. Datele

7
Zaharie D, Albescu F, colectiv –Sisteme informatice pentru asistarea deciziei
, Editura Dual Tech, Bucureşti, 2001.
16
pot proveni din surse interne organizaţiei sau din afara ei, acestea putând fi
introduse în baza de date proprie, sau pot fi accesate doar în momentul în care se
utilizează sistemul.
b) sistemul de gestiune a bazelor de date, SGBD, modul care este de
obicei încorporat în SIAD.
c) dicţionarul de date; acesta conţine un catalog al datelor bazei de date,
împreună cu definiţia lor, şi care este utilizat în prima fază a procesului
decizional - faza de identificare a problemelor.
d) facilităţile de integrare a datelor, care se referă la existenţa limbajelor
declarative de interogare.

Factorii de diferenţiere a datelor, pe diferitele niveluri de management


organizaţional, sunt structurile de date, dimensiunea datelor (unidimensionale
sau multidimensionale), orizontul de timp pentru provenienţa datelor,
posibilitatea de agregare a datelor şi metadatele. Metadatele sunt descrieri
despre colecţiile de date. Pentru acest scop este realizat un dicţionar al
metadatelor ce poate conţine inclusiv metadatele partajate. Dacă se utilizează un
server comun de metadate, atunci orice aplicaţie poate utiliza aceste metadate.

Teste de verificare

1. Explicaţi subsistemul de gestiune a datelor

Rezumat

Arhitectura unui SIAD are rolul de a prezenta ansamblul elementelor


componente, tipuri de sarcini alocate fiecarei componente si modul de
interactionare a acestora.
Subsistemul de gestiune a datelor:

 baza de date
 sistemul de gestiune a bazelor de date,
 dicţionarul de date;
 facilităţile de integrare a datelor

17
Bibliografie

1. Zaharie D, Albescu F, colectiv, Sisteme informatice pentru asistarea


deciziei, Editura Dual Tech, Bucureşti, 2001.

Răspunsuri la teste de autoevaluare

1. Un sistem de tip SIAD este format din următoarele subsisteme:


subsistemul de gestiune a datelor; subsistemul de gestiune a modelelor;
subsistemul de gestiune a cunoştinţelor; subsistemul de gestiune a
dialogului

18
Unitatea 3- Arhitectura unui sistem informatic de asistare a
deciziilor: componenta de gestiune a modelelor

Obiective
După parcurgerea acestei unităţi studentul:
-va înţelege structura unui SIAD

-va înţelege subsistemul de gestiune a modelelor


Timp alocat studiului: 2 ore

3.1Arhitectura unui SIAD

Arhitectura unui SIAD are rolul de a prezenta ansamblul elementelor


componente, tipuri de sarcini allocate fiecarei component si modul de
interactionare a acestora. Funcţiile unui SIAD sunt: gestiunea datelor, gestiunea
modelelor, gestiunea cunoştinţelor şi gestiunea comunicării între utilizator şi
sistem, precum şi între date şi modele sau cunoştinte.
Un sistem de tip SIAD este format din următoarele subsisteme: subsistemul
de gestiune a datelor; subsistemul de gestiune a modelelor; subsistemul de
gestiune a cunoştinţelor; subsistemul de gestiune a dialogului (sau interfaţa cu
utilizatorul).

3.2.Subsistemul de gestiune a modelelor

Subsistemul de gestiune a modelelor este constituit din următoarele


componente8:
a) modelele; care pot fi reprezentate de modele financiare, statistice sau de
previziune, şi stau la baza analizei în vederea obţinerii soluţiilor pentru sistemul
decizional;
b) sistemul de gestiune al modelelor (modul asemănător SGBD), utilizat
pentru crearea de noi modele, cu ajutorul limbajelor specifice, sau pentru
actualizarea modelelor existente;
c) dicţionarul (catalogul) de modele;
d) procesul de execuţie şi integrare a modelelor, acesta este utilizat pentru a
interpreta instrucţiunile create de utilizator pentru un anumit model utilizator şi
pentru transmiterea acestora către sistemul de gestiune a modelelor.

8
Zaharie D, Albescu F, Op. cit.
19
Test de autoevaluare nr.1

Explicaţi subsistemul de gestiune a modelelor

Teste de verificare
1. Arhitectura unui SIAD

Rezumat

Arhitectura unui SIAD are rolul de a prezenta ansamblul elementelor


componente, tipuri de sarcini allocate fiecarei component si modul de
interactionare a acestora. Funcţiile unui SIAD sunt: gestiunea datelor, gestiunea
modelelor, gestiunea cunoştinţelor şi gestiunea comunicării între utilizator şi
sistem, precum şi între date şi modele sau cunoştinte.
Subsistemul de gestiune a modelelor:

 modelele;
 sistemul de gestiune al modelelor
 dicţionarul
 procesul de execuţie şi integrare a modelelor,

Bibliografie

1. Zaharie D, Albescu F, colectiv, Sisteme informatice pentru asistarea


deciziei, Editura Dual Tech, Bucureşti, 2001.

20
Răspunsuri la teste de autoevaluare

1. Un sistem de tip SIAD este format din următoarele subsisteme:


subsistemul de gestiune a datelor; subsistemul de gestiune a
modelelor; subsistemul de gestiune a cunoştinţelor; subsistemul de
gestiune a dialogului (sau interfaţa cu utilizatorul).
Subsistemul de gestiune a modelelor este format din componentele:

 modelele;
 sistemul de gestiune al modelelor
 dicţionarul
 procesul de execuţie şi integrare a modelelor

21
Unitatea 4-Arhitectura unui sistem informatic de asistare a
deciziilor : componenta de gestiune a dialogului şi componenta de
gestiune a cunoştinţelor

Obiective
După parcurgerea acestei unităţi studentul:
-va înţelege structura unui SIAD

-va înţelege subsistemul de gestiune a dialogului şi componenta de


gestiune a cunoştinţelor

Timp alocat studiului: 2 ore

4.1 Arhitectura unui SIAD

Arhitectura unui SIAD are rolul de a prezenta ansamblul elementelor


component, tipuri de sarcini allocate fiecarei component si modul de
interactionare a acestora.Funcţiile unui SIAD sunt: gestiunea datelor, gestiunea
modelelor, gestiunea cunoştinţelor şi gestiunea comunicării între utilizator şi
sistem, precum şi între date şi modele sau cunoştinte.
Un sistem de tip SIAD este format din următoarele subsisteme: subsistemul
de gestiune a datelor; subsistemul de gestiune a modelelor; subsistemul de
gestiune a cunoştinţelor; subsistemul de gestiune a dialogului (sau interfaţa cu
utilizatorul).

4.1.1. Subsistemul de gestiune a cunoştinţelor

Subsistemul de gestiune a cunoştinţelor înglobează sisteme expert ce oferă, la


probleme, soluţii pentru aspectele calitative nestructurate, care nu pot fi rezolvate
prin metode deterministe.
Sistemele expert utilizate în acest context se vor axa pe analiza problemei şi
pe selecţia modelelor care pot oferi soluţii pentru problema respectivă, precum şi
pe realizarea modelelor propriu-zise.

22
4.1.2. Interfaţa cu utilizatorul

Subsistemul de dialog cu utilizatorul, sau interfaţa utilizator, este o


componentă care asigură interactivitatea SIAD. Datorita rolului pe care îl are în
SIAD, utilizatorul este considerat o parte componenta a acestuia.
Pentru SIAD, utilizatorul devine manager sau decident, iar comunicarea
cu acesta reprezintă un aspect important al activităţii de asistare a deciziei.
Din punct de vedere tehnic, interfaţa unui SIAD este o interfaţă de tip
grafic (GUI-Graphic User Interface). Ca instrumente aflate la dispoziţia SIAD
avem : tabele, diagrame, grafice, imagini etc. Aceste unelte pot fi folosite de către
SIAD pentru prezentarea rezultatelor analizelor efectuate de sistem pentru a oferi
asistenţă decizională managerilor.

Test de autoevaluare nr. 1


Interfaţa unui SIAD

Teste de verificare
1. Subsistemul de gestiune al cunoştinţelor

Rezumat

Funcţiile unui SIAD sunt: gestiunea datelor, gestiunea modelelor,


gestiunea cunoştinţelor şi gestiunea comunicării între utilizator şi sistem,
precum şi între date şi modele sau cunoştinte.
Subsistemul de gestiune a cunoştinţelor înglobează sisteme expert ce
oferă, la probleme, soluţii pentru aspectele calitative nestructurate, care nu pot fi
rezolvate prin metode deterministe.
Subsistemul de dialog cu utilizatorul, sau interfaţa utilizator, este o
componentă care asigură interactivitatea SIAD. Datorita rolului pe care îl are în
SIAD, utilizatorul este considerat o parte componenta a acestuia.

23
Bibliografie

1. Zaharie D, Albescu F, colectiv, Sisteme informatice pentru asistarea


deciziei, Editura Dual Tech, Bucureşti, 2001.

Răspunsuri la teste de autoevaluare

1. Din punct de vedere tehnic, interfaţa unui SIAD este o interfaţă de


tip grafic (GUI-Graphic User Interface). Ca instrumente aflate la dispoziţia
SIAD avem : tabele, diagrame, grafice, imagini etc. Aceste unelte pot fi folosite
de către SIAD pentru prezentarea rezultatelor analizelor efectuate de sistem
pentru a oferi asistenţă decizională managerilor.

24
Unitatea 5- Clasificarea SIAD

Obiective
-după parcurgerea unităţii 5, studentul va inţelege clasificarea SIAD

Timp alocat studiului: 2 ore

5.1. Clasificarea SIAD-urilor

Clasificarea se poate face după mai multe criterii, cel mai des utilizat criteriu
fiind componenta tehnologică dominantă:
1. SIAD-uri orientate pe modele. Aceste SIAD-uri realizează analize de tipul
„what...if” . Activităţile implicate sunt de tipul modelare-simulare
previziune, optimizare. Modelul cantitativ este sprijinit de o interfaţă care
facilitează utilizarea.
2. SIAD-uri orientate pe date se referă la prelucrarea unui volum ridicat de
date (date istorice) stocate în sistemul informatic al organizaţiei şi care oferă
posibilitatea de a extrage informaţii utile din mulţimea de date stocate. Aceste
tipuri de SIAD-uri folosesc depozite de date, iar prelucrarea este asigurată de
tehnologiile informaţionale de tip OLAP (procesare analitică online) şi Data
Mining (explorarea şi căutarea şabloanelor în date).
Test de autoevaluare nr.1
Ce sunt SIAD-urile orientate pe date?

3. SIAD-uri bazate pe cunoştinte ; acestea utilizează tehnologii specifice


inteligenţei artificiale şi de aceea se mai numesc şi SIIAD (sisteme informatice
inteligente de asistare a deciziei).
4. SIAD-uri orientate pe comunicaţii ; la care componenta tehnologică
dominantă este reprezentată de comunicaţiile bazate pe calculatoare şi reţele de
calculatoare. Astăzi componenta de comunicaţie este asigurată prin Internet,
astfel că acestea se mai numesc şi SIAD orientate pe Web.
5. SIAD-uri orientate pe documente (numite şi sisteme de management al
documentelor, DMS, Document Management Systems) care asigură stocarea şi
regăsirea documentelor (inclusiv a paginilor Web) şi a informaţiilor, prin tehnici
speciale de căutare.
25
O altă clasificare, oferită de Holsapple şi Whinston (1998), grupează
sistemele SIAD în cinci tipuri:
1. SIAD bazate pe analiza textelor; toate informaţiile de care are nevoie
decidentul le găseşte sub formă de text ce trebuie analizat; documentele sunt
create, revizuite şi vizualizate automat; de asemenea, documentele sunt grupate,
fuzionate şi expediate sub diferite formate şi cu diferite tehnologii (de exemplu,
hypertext şi agenţi inteligenţi);
2. SIAD care au drept componentă principală baza de date a organizaţiei;
sistemul de gestiune al bazelor de date (SGBD) asigură structurile de date,
modurile de acces la date, specificarea volumului corespunzator colecţiilor de
date, asistarea interogărilor asupra bazelor de date.
3. SIAD bazate pe programe de calcul tabelar; acestea au ca principală
componentă programele de calcul tabelar, care ajută utilizatorul să descrie
modelele folosite pentru analiză. Cel mai utilizat program de calcul tabelar este
MS-Excel, care include modele statistice, financiare, de previziune şi de simulare.
Modelul folosit se generează prin selectarea obiectelor (conceptelor) şi a relaţiilor
(ecuaţiilor) dintre obiecte.
4. SIAD bazate pe funcţii; funcţia care de fapt este o procedură sau un
algoritm scris într-un limbaj de programare şi destinată a fi utilizată pentru
rezolvarea unui anumit tip de probleme;
5. SIAD bazate pe reguli; regulile sunt prevăzute în sistemul de prelucrare a
cunoştinţelor (Knowledge Working System), şi sunt specifice inteligenţei
artificiale.

Teste de verificare
1. Explicaţi SIAD bazate pe calcul tabelar

Rezumat

In functie de componenta tehnologică dominant se disting SIAD-uri


orientate pe modele, pe date, cunostinte, comunicatii, documente

O altă clasificare, oferită de Holsapple şi Whinston (1998):

 SIAD bazate pe analiza textelor


 SIAD care au drept componentă principală baza de date

26
 SIAD bazate pe programe de calcul tabelar;
 SIAD bazate pe funcţii;
 SIAD bazate pe reguli;

Bibliografie
1. Zenovic Gherasim , Sisteme informatice pentru asistarea deciziei,
https://se-b.spiruharet.ro/images/secretariat/2017-
2018/programe_licenta/cig/sinteze/an_3_sem_2/sinteza_siad.pdf

Răspunsuri la teste de autoevaluare

1. SIAD-uri orientate pe date se referă la prelucrarea unui volum


ridicat de date (date istorice) stocate în sistemul informatic al organizaţiei şi care
oferă posibilitatea de a extrage informaţii utile din mulţimea de date stocate.
Aceste tipuri de SIAD-uri folosesc depozite de date, iar prelucrarea este
asigurată de tehnologiile informaţionale de tip OLAP (procesare analitică
online) şi Data Mining (explorarea şi căutarea şabloanelor în date).

27
Unitatea 6- Caracteristici SIAD

Obiective
-studentul va intelege prin ce se caracterizeaza un SIAD

Timp alocat studiului: 2 ore

Caracteristicile principale ale unui SIAD (SSD) ideal sunt9:


- este un sistem informatic asistat de calculator
- asistă decidenţii în probleme semistructurate şi nestructurate;
- asistă managerii la toate nivelurile;
- asistă indivizii şi grupurile;
- asigură suport pentru decizii interdependente sau secvenţiale;
- susţine inteligenţa, proiectul, alegerea şi implementarea ;
- suportă o varietate de procese decizionale şi stiluri;
- sunt adaptabile şi flexibile;
- trebuie să fie interactive şi uşor de folosit;
- asigură eficacitatea echilibrată cu eficienţa (beneficiile
trebuie să depăşească costurile) ;
- decidenţii au control total;
- uşurinţă în dezvoltare de către utilizatorii finali (modificări
care să răspundă nevoilor şi schimbărilor de mediu);
- susţine modelarea şi analiza;
- acces la date ;
- aplicaţie independentă, integrată şi bazată pe Web.

Test de autoevaluare nr. 1

Enumerati 4 caracteristici ale unui SIAD

În anul 1996, Holsapple şi Whiston au definit particularitatile unui


SIAD10:
-contin o baza de cunostinte

9
http://en.wikipedia.org/wiki/Decision_support_systems
10
Holsapple, C.W, Whiston, A.B., Decision support systems. A knowledge+based approach, St
Paul , MN:West Publishing, p. 45
28
-permit achizitionarea si gestionarea unor cunostinte descriptive
-asigura selectarea unui set de cunostinte in scopul vizionarii acestora
pentru extragerea unor informatii necesare procesului decisional
- oferă facilitate de prezentare a unor cunoştinţe ad-hoc sau elaborare
rapoarte

Teste de verificare
1. Particularităţi SIAD în concepţia autorilor
holsapple şi Whiston

Rezumat

Un SIAD este caracterizat prin urmatoarele:

 asistă decidenţii
 sunt adaptabile şi flexibile;
 permit accesul la date
 susţine modelarea şi analiza

Bibliografie

1. Holsapple, C.W, Whiston, A.B., Decision support systems. A knowledge-


based approach, St Paul , MN:West Publishing
2. http://en.wikipedia.org/wiki/Decision_support_systems

Teste de autoevaluare

Caracteristici SIAD

 decidenţii au control total;


 trebuie să fie interactive şi uşor de folosit;
 uşurinţă în dezvoltare de către utilizatorii finali
(modificări care să răspundă nevoilor şi
schimbărilor de mediu);
 asistă managerii la toate nivelurile;

29
Unitatea 7- Depozite de date: definiţii, arhitectura

Obiective
După parcurgerea acestei unităţi studentul:
- va înţelege aspectele particulare ale organizării datelor în
depozite de date
- va înţelege importanta depozitelor de date
- va cunoaste componentele depozitelor de date
- va cunoaşte modalităţile de organizare a datelor în
depozite de date şi etapele de existenţă ale acestora.

Timp alocat studiului: 3 ore

7.1. Aspecte generale

Odată cu extinderea utilizării tehnologiei informaţiei în activităţile curente ale


firmelor, volumul de date de prelucrat a crescut foarte mult, ceea ce a condus la
faptul că metodele clasice de prelucrare au devent ineficiente. Din această cauză
au apărut şi s-au dezvoltat noi tehnologii moderne, cum sunt Data Warehousing
(depozitarea datelor) şi OLAP (On-Line Analytical Processing).
Depozitele de date (Data Warehouse) se pot folosi la:
a) îmbunătăţirea valorii performanţelor organizaţiei
economice cu management centrat pe client, printr-o mai
bună înţelegere a nevoilor clientuluianaliza percepţiilor
clienţilor asupra valorii produselor şi serviciilor care
sunt oferite sau care ar putea fi oferite în viitor;
b) integrarea marketingului cu tehnologiile informaţiei şi
ale comunicaţiilor (IT&C), cu sursele de date
operaţionale, obţinându-se depozite de date de tip
întreprindere, EDW (Enterprise Data Warehouse);
c) contribuie la creşterea valorii strategice a organizaţiei
economice.

30
7.2. Depozitul de date. Concept.

Conceptul de depozit de date (Data Warehouse) este definit de William


Inmon astfel : « o colecţie de baze de date integrate, orientate pe subiecte şi
proiectate să furnizeze informaţiile necesare procesului de luare a deciziei
manageriale ».
Un depozit de date conţine date istorice şi curente, de interes potenţial
pentru manageri în cadrul organizaţiei economice. În mod obişnuit, datele sunt
structurate pentru a putea fi oricând disponibile pentru activitati de prelucrare
analitică online (OLAP), Data Mining, interogări, rapoarte, alte aplicaţii pentru
asistarea luării deciziei11.
Test de autoevaluare nr 1
Conceptul de depozit de date

Trebuie precizat că noţiunea de depozit de date se referă la rezultatul final


– date memorate pe suport de memorie, date ce prezintă caracteristici distincte
faţă de bazele de date tranzacţionale, în timp ce noţiunea de depozitare a datelor
(Data Warehousing) se referă la întregul proces de creare, menţinere şi exploatare
a unui depozit de date.
Depozitele de date reprezintă o tehnică a informaticii aplicate în domeniul
sistemelor informatice pentru asistarea deciziei, SIAD sau DSS, prin intermediul
căreia se asigură:
1) administrarea complexă a afacerilor;
2) accesarea din exterior, oportună şi eficace, a informaţiilor
şi cunoştintelor necesare afacerilor (business information
and business knowledge).
Un depozit de date conţine următoarele componente majore (fig.7.1):
- sursele de date;
- modulul pentru extragerea, transformarea şi încărcarea datelor din
bazele de date operaţionale, (ETL - Extraction,
Transformation and Load);
- depozitul de date de tip întreprindere, (EDW - Enterprise Data
Warehouse);

11
Inmon H.W., Building the Data Warehouse, QED Technical Publishing Group,
1992
31
- metadatele (descrieri despre date şi regulile pentru organizarea
prelucrărilor aplicate datelor. Acestea permit indexarea şi regăsirea uşoară
a datelor, inclusiv prin instrumente Web);
- Instrumente software care asigură accesul la depozitul de date
(OLAP, Data Mining, instrumente pentru întocmirea rapoartelor şi pentru
vizualizarea datelor).

Interfeţe de aplicaţie
(middleware)
Colecţii de date Magazie de date
Data Marts

APLICAŢII
Magazie de date
Data Marts OLAP
Data Mining
Web

Instrumente de
SURSE EXTERNE DE interogare
DATE Instrumente de
raportare

Vizualizare
rezultate

Figura 7.1. Structura unui depozit de date

Test de autoevaluare nr 2
Componente deposit de date

Necesitatea depozitelor de date a apărut datorită acumulării unui volum


foarte mare de date la nivelul organizaţiei economice, volum acumulat de-a lungul
timpului, şi care nu era folosit decât o scurtă perioadă de timp. S-a constatat că
aceste date istorice, în afara informaţiilor punctuale, referitoare la valorile ce
descriu funcţionarea organizaţiei economice la un anumit moment de timp,
informaţii specifice bazelor de date tranzacţionale, ele mai conţin şi informaţii

32
privind evoluţia firmei respective pe o perioadă mai lungă de timp, modul în care
a evoluat firma şi modul în care a reacţionat la diverse provocări apărute din
mediul extern. Toate aceste informaţii se pot constitui într-o experienţă ascunsă în
aceste date, experienţă care poate fi folosită ca ghid în luarea deciziilor
manageriale.
Depozitele de date integrează diferitele baze de date din organizaţie,
asigurând informaţii oportune şi relevante sistemelor informatice pentru asistarea
deciziei manageriale, SIAD.

Depozitele de date pot înmagazina volume mari de date provenite din arhive
şi/sau din bazele de date ale aplicaţiilor informatice specifice activităţii curente a
întreprinderii, precum şi din surse externe organizaţiei economice. Exploatarea
acestor volume uriaşe de date, provenind de la surse de date diverse, necesită
existenţa unor aplicaţii software speciale, care oferă posibilitatea ca masivele de
date să poată fi interogate, precum şi realizarea unor analize on-line a datelor
(OLAP). Aplicaţiile software suport susţin performanţele acestor analize on-line
prin transformarea datelor, prin corelarea şi completarea lor, precum şi prin
crearea şi întreţinerea dicţionarului de date, toate acestea asigurând accesul la
structurile primare.
Datele sunt introduse în depozitul de date sub controlul unor aplicaţii speciale
şi al SGBD-ului. Acestea asigură, prin serviciile de integritate, stocarea şi lucrul
în condiţii de siguranţă maximă. Datele care reprezintă suport pentru tranzacţiile
primare sunt prelucrate pentru a se obţine informaţiile de sinteză necesare
planificării şi luării deciziilor.
Exploatarea unui volum foarte mare de date, pentru a obţine diverse rapoarte,
poate duce la exploatarea unui număr mare de tabele, la crearea unor legături
virtuale multiple şi a unor tabele temporare. Aceasta poate conduce la un volum
mare de muncă şi reprezintă principalul inconvenient al depozitelor de date, şi
anume, timpul mare necesar pentru exploatarea lor.
d) aparut astfel necesitatea stocării datelor care sunt dedicate depozitelor de
date într-un sistem diferit de sistemul de baze de date operaţionale, în aşa fel încât
funcţionarea celor două sisteme să se realizeze fără inconveniente.
În depozitul de date se pot stoca atât volume de date privind activitatea
anterioară cât şi date referitoare la tranzacţii ulterioare fără ca tilizatorul să poată
interveni. Depozitele de date reprezintă o concentrare de date prin care se
organizează, consolidează şi centralizează datele provenite din surse eterogene,
33
date care vor constitui baza procesărilor analitice atât de necesare proceselor de
decizie.
Un depozit de date se construieşte progresiv deoarece el permite completări
şi dezvoltări ulterioare. Pentru a se asigura o calitate sporita a datelor, acestea
sunt supuse unui proces de curăţire şi transformare, acest proces ducând la
reducerea timpului necesar pentru obţinerea rapoartelor finale. În depozitele de
date se face transformarea codurilor în date explicite precum şi integrarea datelor
din nomenclatoare în datele referitoare la tranzacţii. Acest proces este denumit
proces de denormalizare, şi este caracterizat de faptul că nu modifică integritatea
datelor dar accelerează procesul de regăsire a informaţiilor. Într-un depozit de
date, redundanţa datelor este permisă şi chiar încurajată, aceasta facilitând
regăsirea rapidă a informaţiilor.

7.3.Arhitectura
Literatura de specialitate prezintă mai multe arhitecturi de depozite de date,
grupate în doua categorii: depozitele de date de tip întreprindere, (EDW -
Enterprise Data Warehouse) şi magazii de date (Data Marts).
Decizie de alegere a unei arhitecturi de depozit de date este influenţată de mai
mulţi factori, dintre care se menţionează:
 cerinţele de informaţie ale managementului de vârf (top-management);
 interdependenţele informaţionale existente între departamentele şi
entităţile funcţionale ale organizaţiei economice;
 gradul de limitare a resurselor organizaţiei economice;
 existenţa compatibilităţii cu sistemele informatice aflate deja în exploatare
în organizaţie;
 motivaţia profundă a angajaţilor în dezvoltarea unui depozit de date.

Integrarea datelor într-un depozit de date presupune trei procese majore:


1. procesul care asigură accesul la date;
2. procesul pentru realizarea federaţiei de date;
3. procesul care asigură reflectarea în depozitul de date a
modificărilor semnificative ale datelor provenite din sursele
de date de tip întreprindere.
Există mai multe tehnologii de integrare a datelor şi metadatelor într-un
depozit de date:

34
1. integrarea aplicaţiilor de tip întreprindere, (EAI - Enterprise
Application Integration);
2. arhitectura orientată pe servicii, (SOA - Service-Oriented
Architecture);
3. extragerea, transformarea şi încărcarea datelor în depozitul
de date, (ETL - Extraction, Transformation and Load);
4. integrarea informaţiilor de tip întreprindere, (EII -
Enterprise Information Integration).
Integrarea aplicaţiilor de tip tip întreprindere, (EAI - Enterprise Application
Integration) este o tehnologie care asigură modalitatea unitară de preluare a
datelor din surse diverse şi stocarea lor în depozitul de date de tip întreprindere.
Această modalitate de integrare a aplicaţiilor de tip întreprindere se realizează la
nivelul interfeţei de programare a aplicaţiei, (API - Application Programming
Interface). Ea este combinată cu arhitectura orientată pe servicii, (SOA -
Service-Oriented Atchitecture) care este focalizată pe un ansamblu coerent de
procese de afaceri orientate pe servicii Web.
Extragerea, transformarea şi încărcarea datelor în depozitul de date, (ETL -
Extraction, Transformation and Load), reprezintă componenta de integrare a
oricărui proiect centrat pe organizarea, stocarea şi prelucrarea datelor, aşa cum
este depozitarea datelor. Această componenta, ETL, consuma circa 70% din
perioada de lucru la un proiect centrat pe date.
Extragerea datelor înseamnă citirea datelor destinate depozitului de date din
una sau mai multe baze de date.
Transformarea datelor reprezintă conversia datelor extrase, din forma iniţială
în forma standard necesară pentru stocarea în depozitul de date sau în alte baze de
date, cu care depozitul de date lucrează direct.
Încărcarea datelor înseamna stocarea datelor, anterior transformate în forma
standard, curăţate şi rafinate, în depozitul de date.
Pot constitui surse de date relevante pentru depozitul de date următoarele:
1. baze de date tranzacţionale (provenite din sistemul
informatic de procesare a tranzacţiilor, TPS) ;
2. baze de date provenite din aplicaţii ERP ;
3. baze de date provenite din aplicaţii CRM ;
4. date provenite din tabele Excel (într-un cadru mai larg,
din baze de date specifice OAS)

35
5. date provenite din baze de cunostinte specifice KWS
6. date provenite din şiruri de mesaje, din fişiere externe
etc. Datele stocate în depozitul de date sunt conforme (prin forma standard
dobândita prin intermediul procesului ETL) cu regulile de afaceri ce definesc
modul de folosire a datelor stocate, cu regulile de întocmire a sintezelor şi
rapoartelor, cu regulile de standardizare a atributelor codificate, cu regulile de
efectuare a calculelor. Toate aceste reguli sunt memorate într-o bază de metadate
şi sunt aplicate unitar asupra întregului depozitul de date.

Teste de verificare
1. Surse de date relevante pentru depozitul de date

Rezumat
Noţiunea de depozit de date se referă la rezultatul final – date memorate
pe suport de memorie, date ce prezintă caracteristici distincte faţă de bazele de
date tranzacţionale, în timp ce noţiunea de depozitare a datelor (Data
Warehousing) se referă la întregul proces de creare, menţinere şi exploatare a unui
depozit de date.
Depozitele de date reprezintă o tehnică a informaticii aplicate în domeniul
sistemelor informatice pentru asistarea deciziei, SIAD sau DSS, prin intermediul
căreia se asigură:
1) administrarea complexă a afacerilor;
2) accesarea din exterior, oportună şi eficace, a informaţiilor
şi cunoştintelor necesare afacerilor (business information
and business knowledge).
Necesitatea depozitelor de date a apărut datorită acumulării unui volum
foarte mare de date la nivelul organizaţiei economice, volum acumulat de-a
lungul timpului, şi care nu era folosit decât o scurtă perioadă de timp
Un depozit de date conţine următoarele componente majore:
- sursele de date; modulul pentru extragerea, transformarea şi
încărcarea datelor din bazele de date operaţionale, (ETL - Extraction,
Transformation and Load); depozitul de date de tip întreprindere, (EDW
Enterprise Data Warehouse); metadatele (descrieri despre date şi regulile
pentru organizarea prelucrărilor aplicate datelor); Instrumente software
36
care asigură accesul la depozitul de date (OLAP, Data Mining,
instrumente pentru întocmirea rapoartelor şi pentru vizualizarea datelor).
Literatura de specialitate prezintă mai multe arhitecturi de depozite de date,
grupate în doua categorii: depozitele de date de tip întreprindere, (EDW -
Enterprise Data Warehouse) şi magazii de date (Data Marts).
Integrarea datelor într-un depozit de date presupune trei procese
majore:procesul care asigură accesul la date; procesul pentru realizarea federaţiei
de date; procesul care asigură reflectarea în depozitul de date a modificărilor
semnificative ale datelor provenite din sursele de date de tip întreprindere.
Pot constitui surse de date relevante pentru depozitul de date următoarele:
1. baze de date tranzacţionale (provenite din sistemul
informatic de procesare a tranzacţiilor, TPS) ;
2. baze de date provenite din aplicaţii ERP ;
3. baze de date provenite din aplicaţii CRM ;
4. date provenite din tabele Excel (într-un cadru mai larg,
din baze de date specifice OAS)
5. date provenite din baze de cunostinte specifice KWS
date provenite din şiruri de mesaje, din fişiere externe etc.

Bibliografie
1. Inmon H.W., Building the Data Warehouse, QED Technical Publishing
Group, 1992

Răspunsuri la teste de autoevaluare

1. Conceptul de depozit de date (Data Warehouse) este definit ca fiind: “ o


colecţie de baze de date integrate, orientate pe subiecte şi proiectate să furnizeze
informaţiile necesare procesului de luare a deciziei manageriale “
d)
Un depozit de date conţine date istorice şi curente, de interes potenţial
pentru manageri în cadrul organizaţiei economice. În mod obişnuit, datele sunt
structurate pentru a putea fi oricând disponibile pentru activitati de prelucrare
analitică online (OLAP), Data Mining, interogări, rapoarte, alte aplicaţii pentru
asistarea luării deciziei
e)
37
Noţiunea de depozit de date se referă la rezultatul final – date memorate pe
suport de memorie, date ce prezintă caracteristici distincte faţă de bazele de date
tranzacţionale, în timp ce noţiunea de depozitare a datelor (Data Warehousing) se
referă la întregul proces de creare, menţinere şi exploatare a unui depozit de date.

2. Un depozit de date conţine următoarele componente majore:


 sursele de date;
 modulul pentru extragerea, transformarea şi încărcarea datelor din bazele
de date operaţionale, (ETL - Extraction, Transformation and Load);
 depozitul de date de tip întreprindere, (EDW - Enterprise Data
Warehouse); metadatele (descrieri despre date şi regulile pentru
organizarea prelucrărilor aplicate datelor);
 Instrumente software care asigură accesul la depozitul de date (OLAP,
Data Mining, instrumente pentru întocmirea rapoartelor şi pentru
vizualizarea datelor).

38
Unitatea 8- Depozite de date: tipuri de depozite de date

Obiective

După parcurgerea acestei unităţi studentul:


- va înţelege aspectele particulare ale organizării datelor în
depozite de date
- va cunoaşte tipuri de depozite de date
Timp alocat studiului: 3 ore

8.1. Tipuri de depozite de date

Turban (2007) diferenţiază trei tipuri principale de depozite de date:


magazia de date, (DM - Data Marts), memoriile-tampon de date operaţionale,
(ODS - Operational Data Stores) şi depozitele de date de tip întreprindere, (EDW
- Enterprise Data Warehouse).

8.1.1 Magazia de date

O organizaţie economică este structurată pe departamente şi entităţi


funcţionale, acestea reprezentând domenii distincte de gestiune ale datelor
organizaţiei economice.
La nivelul acestor departamente şi entităţi funcţionale, datele sunt depuse
în magazii de date, DM (Data Marts). Un alt termen specific, asociat termenului
de Data Marts, este de raft de date.
Depozitele de date combină baze de date la nivelul întregii organizaţii
economice (adică la nivelul sistemului informatic integrat al organizaţiei
economice), în schimb magaziile de date, cu dimensiuni mai mici decât depozitele
de date, sunt destinate unui anumit departament al organizaţiei economice sau
unui anumit subiect, definit la cererea utilizatorului final.
Utilizarea magaziilor sau rafturilor de date (Data Marts) conduce la
creşterea performanţelor în exploatare.
Magaziile de date sunt dependente de depozitul de date al organizaţiei
(adică sunt generate direct din depozitul de date). Există, însă, şi magazii de date
independente de depozitul de date al organizaţiei, ele fiind realizate special pentru

39
o unitate strategică de afaceri, (SBU - Strategic Business Unit), şi nu folosesc
datele din depozitul de date al organizaţiei economice. Magazia de date
independentă poate constitui o alternativă „low cost” pentru firmele care nu-şi pot
permite construirea, menţinerea şi exploatarea unui depozit de date.
Test de autoevaluare nr. 1
Caraceristici magazii de date

8.1.2. Memorii-tampon de date operaţionale

Între bazele de date operaţionale (tranzacţionale) de pe nivelul operaţional


al organizaţiei economice şi depozitele de date de pe nivelul de management
mediu se pot constitui memorii-tampon de date operaţionale, ODS (Operational
Data Stores).
Memoriile-tampon de date operaţionale servesc pentru asistarea deciziei pe
termen scurt, în special în aplicaţiile care prezintă puncte critice.
Memoriile-tampon de date operaţionale stochează cele mai recente date
referitoare la subiectul analizat, date ce provin din surse multiple. Datele din
memoriile-tampon de date operaţionale sunt preluate din surse diverse după ce au
fost supuse unui proces de extragere, transformare şi încărcare (ETL), similar cu
procesul de la depozitele de date. Când datele operaţionale sunt analizate
multidimensional, memoriile-tampon de date operaţionale devin magazii de date
operaţionale (Operational Marts).

8.1.3. Depozite de date de tip întreprindere

Un depozit de date de tip întreprindere, EDW (Enterprise Data


Warehouse) este un depozit de date integrat pe scară largă, cu un volum de date
foarte mare, care se foloseşte la nivelurile de management mediu şi strategic
pentru asistarea luării deciziei.
Depozitele de date de tip întreprindere, EDW, utilizeaza date în format
standard, ce provin de la surse diverse. Datele din acestea sunt folosite ca date de
intrare pentru majoritatea tipurilor de sisteme informatice pentru asistarea deciziei
economice, cum sunt sistemele informatice pentru managementul relaţiilor cu
clienţii, CRM (Customer Relationship Management), sistemele informatice pentru
managementul lanţului de aprovizionare, SCM (Supply Chain Management),
40
sistemele informatice pentru managementul performanţelor afacerilor, BPM
(Business Performance Management), sistemele informatice pentru
managementul ciclului de viaţă al produselor, PLM (Product Lifecycle
Mangement), sistemele informatice pentru monitorizarea activitaţilor afacerilor,
BAM (Business Activity Monitoring), sistemele (aplicaţiile) informatice pentru
managementul veniturilor, sistemele informatice pentru automatizarea lucrărilor
de birou, (Office Automation Systems), sistemul informatic de lucru cu
cunoştinte, KWS (Knowledge Work Management)3 etc.
Diferenţele dintre un depozit de date şi o bază de date sunt următoarele:
1. datele conţinute într-un un sistem de prelucrare tranzacţional, OLTP (On-
Line Transaction Processing) sunt de tip operaţional, iar datele conţinute
de un depozit de date sunt date centralizate sau derivate din date
operaţionale, nu se modifică în timp şi sunt destinate utilizatorilor finali
pentru asistarea deciziilor;
2. în cazul sistemelor tranzacţionale, performanţele acestuia se referă la
integritate, confidenţialitate, siguranţă şi timp de răspuns, deoarece un
număr mare de utilizatori introduc date în sistem, în timp ce în cazul SIAD
(deci a depozitelor de date) numărul de
utilizatori finali (manageri) este foarte mic. Rezultă că, în cazul SIAD,
securitatea şi siguranţa în exploatare nu sunt supuse unor riscuri majore,
procedurile de salvare şi restaurare fiind utilizate mai rar decât în cazul
sistemelor tranzacţionale.
3. datele procesate în sistemele tranzacţionale sunt seturi de date relativ mici,
introduse recent şi compact, astfel încât prelucrarea se face destul de rapid.
În procesele decizionale, datele necesare acestora au un volum mare şi sunt
stocate dispersat, ceea ce poate conduce la o prelucrare mai lentă;
4. bazele de date realizate pentru sistemele tranzacţionale sunt proiectate şi
realizate pe baza unor cerinţe cunoscute şi clare, şi odată implementate, ele
funcţionează perioade lungi de timp fără modificări importante. Într-un
SIAD cerinţele sunt cunoscute doar parţial în momentul proiectării şi
realizării lor, ceea ce obligă proiectanţii depozitului de date să se adapteze
continuu cerinţelor utilizatorului. Din această cauză, datele gestionate
pentru sisteme tranzacţionale sunt privite ca un întreg, în timp ce datele din
depozitele de date sunt organizate pe categorii, în funcţie de subiectul de
analizat.

41
5. sistemele tranzacţionale reflectă, de obicei, tranzacţiile de date din
activităţile curente, pe când depozitele de date sunt orientate pe subiecte,
cum ar fi: produse, clienţi, furnizori, resursele firmei etc.
6. în cadrul sistemelor informatice operaţionale, dedicate domeniilor de
gestiune ale organizaţiei, datele sunt adesea fragmentate, astfel încât
managerii iau decizii pe baza unor informaţii parţiale (incomplete).
Depozitele de date elimină acest dezavantaj prin accesarea, integrarea şi
organizarea datelor operaţionale cu rol-
cheie într-o formă care se caracterizează prin consistenţă, fiabilitate,
oportunitate, disponibilitate rapida şi cu referinţă în timp.
Etapele de viaţă ale unui depozit de date corespunde oricărei aplicaţii
software, şi anume : proiectare, implementare, populare cu date, exploatare şi
întreţinere. În exploatarea curentă a unui depozit de date apar frecvent noi
cerinţe informaţionale care vor duce la extinderea structurii, la extensii ale
depozitului de date cu date istorice, precum şi laintegrarea noilor date
încorporate în aplicaţii de analiză. Pe parcursul existenţei sale, un depozit de
date este dezvoltat pas cu pas, printr-un proces ciclic, în care diferite etape se
reiau periodic.

Test de autoevaluare nr. 2


Depozitele de date de tip întreprindere

8.1.4. Utilizarea depozitelor de date

Depozitele de date conţin structuri de date unice, integrate şi cumulative,


utilizate în procesul de decizie.
Accesul la datele din depozitul de date este controlat de administratorul
depozitului de date. Acesta are ca principală sarcină stabilirea accesului partajat al
diverselor categorii de manageri la date, prin asigurarea de parole şi drepturi de
acces.
Datele din depozit sunt accesate selectiv de către manageri, în funcţie de
necesităţile acestora. În acest fel se pot crea colecţii specializate pe diverse
domenii, colecţii care se numesc magazii de date. Magaziile de date se utilizează

42
şi ca structuri intermediare de date pentru colectarea datelor din surse primare de
date, conţinutul lor fiind descărcat periodic în depozitul de date.
Mediul software care permite construirea şi exploatarea un depozit de date
trebuie să ofere următoarele elemente: surse de date (de obicei baze de date
tranzacţionale), instrumente de proiectare-dezvoltare, instrumente pentru extracţia
şi transformarea datelor, un sistem de gestiune al bazei de date tranzacţionale,
instrumente de acces la date şi pentru analiza lor, precum şi instrumente de
administrare a depozitului de date.
Utilizarea unui depozit de date implică existenţa unui set specializat de
instrumente care trebuie să asigure: descrierea fizică şi logică a structurii datelor
provenite din sursele de date, precum şi a depozitelor sau a magaziei de date în
care acestea urmează să fie încorporate; validarea, curăţirea şi transformarea
datelor care urmează a fi stocate în depozitul de date; instrumente care permit
utilizatorilor finali accesul la datele stocate în depozitul respectiv. Astfel de
instrumente pot fi unelte specializate, dezvoltate pentru medii de dezvoltare a
aplicaţiilor de uz general, produse program specializate pe analiza datelor, precum
şi aplicaţii dedicate unui anumit depozit de date.

Teste de verificare
1. Utilizare depozite de date

Rezumat
Se diferenţiază trei tipuri principale de depozite de date: magazia de
date, (DM - Data Marts), memoriile-tampon de date operaţionale, (ODS -
Operational Data Stores) şi depozitele de date de tip întreprindere, (EDW -
Enterprise Data Warehouse).
La nivelul departamentelor şi entităţilor funcţionale din mediul economic,
datele sunt depuse în magazii de date, DM (Data Marts).
Magaziile de date, cu dimensiuni mai mici decât depozitele de date, sunt
destinate unui anumit departament al organizaţiei economice sau unui anumit
subiect, definit la cererea utilizatorului final. Depozitele de date combină baze de
date la nivelul întregii organizaţii economice (adică la nivelul sistemului
informatic integrat al organizaţiei economice), în schimb magaziile de date, cu
dimensiuni mai mici decât depozitele de date, sunt destinate unui anumit

43
departament al organizaţiei economice sau unui anumit subiect, definit la cererea
utilizatorului final.
Memoriile-tampon de date operaţionale servesc pentru asistarea deciziei
pe termen scurt, în special în aplicaţiile care prezintă puncte critice.
Memoriile-tampon de date operaţionale stochează cele mai recente date
referitoare la subiectul analizat, date ce provin din surse multiple.
Un depozit de date de tip întreprindere, EDW (Enterprise Data
Warehouse) este un depozit de date integrat pe scară largă, cu un volum de date
foarte mare, care se foloseşte la nivelurile de management mediu şi strategic
pentru asistarea luării deciziei.
Depozitele de date de tip întreprindere, EDW, utilizeaza date în format
standard, ce provin de la surse diverse.

Bibliografie

1. Turban E., Aronson, J.E., Liang, T.P., Sharda, R. - Decision Support and Business
Intelligence Systems, Pearson Prentice Hall, New Jersey, 2007.

Răspunsuri la teste de autoevaluare

1. Magaziile de date sunt dependente de depozitul de date al


organizaţiei (adică sunt generate direct din depozitul de date). Există, însă, şi
magazii de date independente de depozitul de date al organizaţiei, ele fiind
realizate special pentru o unitate strategică de afaceri, (SBU - Strategic Business
Unit), şi nu folosesc datele din depozitul de date al organizaţiei economice.
Magazia de date independentă poate constitui o alternativă „low cost” pentru
firmele care nu-şi pot permite construirea, menţinerea şi exploatarea unui depozit
de date. La nivelul departamentelor şi entităţilor funcţionale din mediul
economic, datele sunt depuse în magazii de date, DM (Data Marts).
Magaziile de date, cu dimensiuni mai mici decât depozitele de date, sunt
destinate unui anumit departament al organizaţiei economice sau unui anumit
subiect, definit la cererea utilizatorului final

44
2. Depozitele de date de tip întreprindere, EDW, utilizeaza date în
format standard, ce provin de la surse diverse. Datele din acestea sunt folosite ca
date de intrare pentru majoritatea tipurilor de sisteme informatice pentru asistarea
deciziei economice, cum sunt sistemele informatice pentru managementul
relaţiilor cu clienţii, CRM (Customer Relationship Management), sistemele
informatice pentru managementul lanţului de aprovizionare, SCM (Supply Chain
Management), sistemele informatice pentru managementul performanţelor
afacerilor, BPM (Business Performance Management), sistemele informatice
pentru managementul ciclului de viaţă al produselor, PLM (Product Lifecycle
Mangement), sistemele informatice pentru monitorizarea activitaţilor afacerilor,
BAM (Business Activity Monitoring), sistemele (aplicaţiile) informatice pentru
managementul veniturilor, sistemele informatice pentru automatizarea lucrărilor
de birou, (Office Automation Systems), sistemul informatic de lucru cu
cunoştinte, KWS

45
Unitatea 9- Tehnologii OLAP

Obiective
După parcurgerea acestei unităţi studentul:
- va înţelege conceptul OLAP
- aspectele particulare ale sistemelor de procesare analitică
on-line (OLAP) ;
- va cunoaşte modele de date associate sistemelor OLAP
- va cunoaşte pricipiile OLAP

Timp alocat studiului: 3 ore

9.1. Conceptul de sistem OLAP

În bazele de date operaţionale se stochează informaţii care privesc


activitatea reală a organizaţiilor economice. Majoritatea bazelor de date utilizate
astăzi în cadrul organizaţiilor economice sunt de tip relaţional. Dar în modelul
relaţional, datele sunt stocate în tabele cu două dimensiuni: linie şi coloană. În
realitate, problemele analizate, sunt, în cea mai mare parte a lor,
multidimensionale, deoarece folosesc date agregate complex, fără restricţii de
asociere sau de volum. Din această cauză, un SGBD obişnuit, relaţional, nu
poate face faţă cerinţelor pentru agregări de date, elaborare de sinteze,
consolidări şi proiecţii multidimensionale de date. O bază de date
multidimensională reprezintă un tip de baze de date ȋn cadrul căreia datele sunt
stocate în celule12.
A apărut astfel necesitatea extinderii functionalităţii unui SGBD relaţional
prin adăugarea unor componente speciale, care să permită modelarea şi analiza
multidimensională a datelor (instrumente folosite curent în sistemele de tip OLAP
şi Data Mining).
În general, termenul de procesare analitică online, OLAP (On-Line
Analytical Procesing), se referă la o varietate de activităţi ce sunt realizate de
către utilizatorii finali, în sistemele informatice, într-un regim de lucru interactiv.

12
Tănăsescu, A., The Role of Multidimensional Databases in Modern Organizations, Economic
Insights – Trends and Challenges, Vol. IV (LXVII), No. 2/2015, pg. 95
46
Un sistem OLAP cuprinde activităţi ca generarea şi obţinerea de răspunsuri la
interogări nestandard şi cereri ad-hoc de rapoarte şi grafice.

Obţinerea acestor răspunsuri la interogări, rapoarte şi grafice se


fundamentează pe metode ale statisticii şi cercetărilor operaţionale, precum şi pe
tehnologiile de construire a prezentărilor vizuale. Unele lucrări de specialitate
includ analizele şi prezentările multidimensionale, sistemele informatice pentru
suportul executivului, ESS (Executive Support Systems) sau EIS (Executive
Information Sytstems) şi Data Mining în tehnologia OLAP1. În esenţă, produsele
de firmă OLAP furnizează posibilităţi de modelare, analiza şi vizualizare pentru
volume mari de date, din baze de date (prin intermediul SGBDR) sau din depozite
de date.

Test de autoevaluare nr. 1


Definiţi conceptul OLAP

Modelele de date asociate sistemelor OLAP se pot încadra în două


categorii: extensii ale modelului de date relaţional şi modelele bazate pe cuburi n-
dimensionale.
Din categoria extensiilor modelului de date relaţional pentru OLAP fac
parte, între altele:
- modelul Kimball ; este un model fundamentat pe o schemă de
tip stea, pentru a asigura o reprezentare relaţională a cubului n-
dimensional; din acest model s-au dezvoltat schemele de tip fulg de
zăpadă şi schema de tip constelaţie;
- modelul Gary; care este fundamentat pe operatorii CUBE şi
ROLLUP ai clauzei Group By, din limbajul de interogare
structurată SQL;
- modelul Gyssens şi Lakshmanan; model fundamentat pe o
extensie a algebrei relaţionale.
Din categoria modelelor bazate pe cuburi n-dimensionale se
pot menţiona, între altele:
- modelul lui Agrawal, Gupta şi Sarawagi ; care este
fundamentat pe o mulţime de operatori asemănători cu cei din
algebra relaţională dar cu organizarea datelor bazată pe cuburi n-
dimensionale);

47
- modelul Cabbibo şi Torlone; fundamentat pe o schemă
multidimensională compusă din mulţimea de dimensiuni, tabelele
de fapte şi descrierile nivelurilor ierarhice13

Tehnologia OLAP permite utilizatorilor o navigare rapidă, de la o dimensiune


la alta, şi facilităţi sporite pentru obţinerea celor mai detaliate informaţii din
depozitul de date.

9.2. Principii

În anul 1993, Ted Codd, fondatorul modelului relaţional al datelor, a elaborat


12 principii, extinse la 18 în anul 1995, care stau la baza tehnologiilor OLAP.
Acestea sunt14:
- abordarea conceptuală multidimensională a datelor; ca
urmare, se folosesc modele multidimensionale;
- asigurarea unei transparenţe sporite a aplicaţiei;
- asigurarea accesibilităţii pentru utilizator, prin asistarea acestuia în
procesul de interacţiune cu modalităţile tehnice de furnizare a datelor (utilizatorul
final reprezintă şi el o sursă de date); pentru aceasta trebuie să se realizeze o
singură viziune logică a datelor din organizaţie;
- complexitatea dimensională a analizei oferă performanţe stabile;
instrumentele OLAP trebuie să aibă implementate patru tipuri de analiză: directă,
explicativă, contemplativă şi formativă;
- utilizarea arhitecturii client-server; server-ul având ca scop asigurarea
omogenizării datelor;
- posibilitatea de a efectua operaţii asemănătoare asupra tuturor
dimensiunilor; aceast aspect poartă numele de prelucrare generică a
dimensiunilor;
- dimensiunile trebuie să fie echivalente operaţional şi structural
(dimensionalitate generica); prin aceasta se asigură astfel ierarhii multiple;
- gestionarea dinamică a matricilor încrucişate, oferită prin facilitatea
SIAD-ului de a elimina valorile dimensionale nule, pentru a nu încărca memoria
calculatorului; aceasta înseamnă că, indiferent de sursa lor, valorile lipsă sunt
ignorate;

13
Lungu, I. s.a., Sisteme informatice executive, Editura ASE, Bucuresti, 2007
14
Muntean, M., Iniţiere în tehnologia OLAP. Teorie şi practică, Editura ASE, Bucureşti, 2004.
48
- posibilităţi de acces simultan al mai multor utilizatori la aceeaşi etapă a
analizei;
- posibilitatea de a efectua operaţii fără restricţii; prin această caracteristică
se oferă posibilitatea executării, fără restricţii, a operaţiilor necesare pentru toate
combinaţiile de dimensiuni şi niveluri ierarhice;
- posibilitatea manevării intuitive a datelor;
- existenţa unui număr de nivele de agregare, precum şi existenţa unui
număr de dimensiuni, nelimitate.
- valorile lipsă sunt diferite de valorile invalide şi de valorile zero; valoarea
zero este valida; modelele OLAP satisfac regula referitoare la valorile NULL din
modelul relaţional. Ca urmare, datele lipsă sau cele invalide trebuie tratate în mod
individual;
- denormalizarea datelor; aplicată la introducerea lor în depozitul de date
- memorarea rezultatelor generate de OLAP; sistemele OLAP stochează
datele în depozite de date separat de sistemele tranzacţionale;
- flexibilitatea rapoartelor, prin selectarea axelor de raportare conform
cerinţelor finale;
- caracteristici superioare ale raportării; în funcţie de locaţia procesării
datelor (client sau server) şi de modul de efectuare a calculelor (după modele de
preprocesare sau calcule executate în momentul interogării depozitului de date);
- ajustarea automată a nivelului fizic; în funcţie de volumul datelor şi de
tipul de model logic folosit.

Test de autoevaluare nr. 2


Principiile lui Codd pentru tehnologiile OLAP

OLAP este o tehnologie de agregare a datelor, stocate în depozite de date,


într-o manieră multidimensională, cu facilităţi referitoare la accesul la informaţii
al managerilor într-un mod interactiv şi flexibil. Legătura dintre OLAP şi
depozitele de date este dată de faptul că OLAP le completează pe acestea din
urmă, prin transformarea volumului imens de date, stocat şi gestionat în
depozitele de date, în informaţii utile procesului de decizie.
Tehnologia OLAP se bazează pe existenţa unor tehnici ce permit, de la
simpla selecţie a datelor, până la o analiză detaliată şi complexă a datelor.
Problemele care se rezolvă pe baza acestei tehnologii au la baza analiza rapidă a
49
informaţiei multidimensionale, dispersată în locaţii multiple dar accesibile unui
număr mare de utilizatori. Pentru asigurarea acestor facilităţi, tehnologia OLAP
se bazează pe eficacitatea bazelor de date multidimensionale şi pe posibilitatea de
a construi alternative diferite pentru problemele de decizie. Tehnologia OLAP
presupune că metoda de analiză a datelor este definită de cel care creează
aplicaţia sau chiar de către utilizatorul final.

1. Teste de verificare
1. Modele de date asociate sistemelor OLAP.

Rezumat

Un SGBD obişnuit, relaţional, nu poate face faţă cerinţelor pentru


agregări de date, elaborare de sinteze, consolidări şi proiecţii
multidimensionale de date.
A apărut astfel necesitatea extinderii functionalităţii unui SGBD
relaţional prin adăugarea unor componente speciale, care să permită modelarea
şi analiza multidimensională a datelor (instrumente folosite curent în sistemele
de tip OLAP şi Data Mining).
În general, termenul de procesare analitică online, OLAP (On-Line
Analytical Procesing), se referă la o varietate de activităţi ce sunt realizate de
către utilizatorii finali, în sistemele informatice, într-un regim de lucru
interactiv. Un sistem OLAP cuprinde activităţi ca generarea şi obţinerea de
răspunsuri la interogări nestandard şi cereri ad-hoc de rapoarte şi grafice.
Modelele de date asociate sistemelor OLAP se pot încadra în două
categorii: extensii ale modelului de date relaţional şi modelele bazate pe cuburi n-
dimensionale.
Principiile OLAP:
1. asigurarea unei transparenţe sporite a aplicaţiei;
2. utilizarea arhitecturii client-server; server-ul având ca scop
asigurarea omogenizării datelor;
3. posibilitatea de a efectua operaţii asemănătoare asupra
tuturor dimensiunilor; aceast aspect poartă numele de prelucrare
generică a dimensiunilor;

50
4. posibilităţi de acces simultan al mai multor utilizatori la
aceeaşi etapă a analizei;

Bibliografie

1. Lungu, I. s.a., Sisteme informatice executive, Editura ASE, Bucuresti,


2007
2. Muntean, M., Iniţiere în tehnologia OLAP. Teorie şi practică, Editura
ASE, Bucureşti, 2004.
3. Tănăsescu, A., The Role of Multidimensional Databases in Modern
Organizations, Economic Insights – Trends and Challenges, Vol. IV
(LXVII), No. 2/2015

Răspunsuri la teste de autoevaluare

1.Termenul de procesare analitică online, OLAP, (On-Line Analytical


Procesing), se referă la o varietate de activităţi ce sunt realizate de către
utilizatorii finali, în sistemele informatice, într-un regim de lucru interactiv. Un
sistem OLAP cuprinde activităţi ca generarea şi obţinerea de răspunsuri la
interogări nestandard şi cereri ad-hoc de rapoarte şi grafice.
Obţinerea acestor răspunsuri la interogări, rapoarte şi grafice se
fundamentează pe metode ale statisticii şi cercetărilor operaţionale, precum şi pe
tehnologiile de construire a prezentărilor vizuale. Unele lucrări de specialitate
includ analizele şi prezentările multidimensionale, sistemele informatice pentru
suportul executivului, ESS (Executive Support Systems) sau EIS (Executive
Information Sytstems) şi Data Mining în tehnologia OLAP1. În esenţă, produsele
de firmă OLAP furnizează posibilităţi de modelare, analiza şi vizualizare pentru
volume mari de date, din baze de date (prin intermediul SGBDR) sau din
depozite de date.

2.
 abordarea conceptuală multidimensională a datelor; ca urmare, se
folosesc modele multidimensionale;

51
 asigurarea unei transparenţe sporite a aplicaţiei;
 asigurarea accesibilităţii pentru utilizator, prin asistarea acestuia în
procesul de interacţiune cu modalităţile tehnice de furnizare a datelor
(utilizatorul final reprezintă şi el o sursă de date); pentru aceasta trebuie
să se realizeze o singură viziune logică a datelor din organizaţie;
 complexitatea dimensională a analizei oferă performanţe stabile;
instrumentele OLAP trebuie să aibă implementate patru tipuri de analiză:
directă, explicativă, contemplativă şi formativă;
 utilizarea arhitecturii client-server; server-ul având ca scop asigurarea
omogenizării datelor;
 posibilitatea de a efectua operaţii asemănătoare asupra tuturor
dimensiunilor; aceast aspect poartă numele de prelucrare generică a
dimensiunilor;
 dimensiunile trebuie să fie echivalente operaţional şi structural
(dimensionalitate generica); prin aceasta se asigură astfel ierarhii
multiple;
 gestionarea dinamică a matricilor încrucişate, oferită prin facilitatea
SIAD-ului de a elimina valorile dimensionale nule, pentru a nu încărca
memoria calculatorului; aceasta înseamnă că, indiferent de sursa lor,
valorile lipsă sunt ignorate;
 posibilităţi de acces simultan al mai multor utilizatori la aceeaşi etapă a
analizei;

 posibilitatea de a efectua operaţii fără restricţii; prin această


caracteristică se oferă posibilitatea executării, fără restricţii, a operaţiilor
necesare pentru toate combinaţiile de dimensiuni şi niveluri ierarhice;
 posibilitatea manevării intuitive a datelor;
 existenţa unui număr de nivele de agregare, precum şi existenţa unui
număr de dimensiuni, nelimitate.
 valorile lipsă sunt diferite de valorile invalide şi de valorile zero;
valoarea zero este valida; modelele OLAP satisfac regula referitoare la
valorile NULL din modelul relaţional. Ca urmare, datele lipsă sau cele
invalide trebuie tratate în mod individual;
 denormalizarea datelor; aplicată la introducerea lor în depozitul de date
 memorarea rezultatelor generate de OLAP; sistemele OLAP stochează
datele în depozite de date separat de sistemele tranzacţionale;

52
 flexibilitatea rapoartelor, prin selectarea axelor de raportare conform
cerinţelor final;
 caracteristici superioare ale raportării; în funcţie de locaţia procesării
datelor (client sau server) şi de modul de efectuare a calculelor (după
modele de preprocesare sau calcule executate în momentul interogării
depozitului de date);
 ajustarea automată a nivelului fizic; în funcţie de volumul datelor şi de
tipul de model logic folosit.

53
Unitatea 10- Data mining: definiţii, arhitectura sistemelor de
data mining

Obiective
După parcurgerea acestei unităţi studentul:
- va înţelege conceptul de Data Mining;
- va înţelege aspectele privind gruparea datelor;
- va înţelege procesul de exploatare a cunoştintelor din
cantităţi mari de date,
Timp alocat studiului: 3 ore

10.1. Aspecte introductive

Data Mining este o tehnologie determinată de creşterea volumului de


date produs în cadrul organizaţiilor economice în urma desfăşurării activităţilor
sale. Realizând existenţa acestui volum de date acumulat de-a lungul anilor,
specialiştii au căutat să îl folosească prin extragerea de informaţii noi,
utilizabile în activitatea organizaţiei economice.
Aceste informaţii se folosesc în aplicaţii pentru analiza şi controlului
producţiei, pentru realizarea de analize de piaţă, pentru detectarea fraudelor,
pentru explorarea ştiinţifică etc. În acest context, sistemele informatice au
evoluat în direcţia dezvoltării următoarelor funcţionalităţi15: sisteme cu baze de
date avansate, sisteme pentru analiza avansată a datelor (Data Warehousing şi
Data Mining) sau sisteme cu baze de date accesibile prin Web.
Bazele de date şi tehnologia informaţiei au evoluat sistematic de-a
lungul timpului, de la sisteme simple, de procesare a colecţiilor de date stocate
în fişiere, la sisteme cu baze de date puternice şi complexe, care oferă
utilizatorilor un acces direct la datele stocate.
Dar, deşi instrumentele OLAP suportă analiza multidimensională şi
sprijină formularea deciziilor, volumele foarte mari de date au determinat
necesitatea unor instrumente de analiză efectivă şi eficientă a datelor
respective, care să funţioneze mai în detaliu, cum ar fi: clasificarea, gruparea
(clusterizarea) şi caracterizarea datelor care variază în timp. Acest lucru a

15
Han, J., Kamber, M,. Data Mining- Concepts and Technique, Second Edition, Morgan
Kaufmann Publishers, USA, San Francisco CA 2006
54
impus apariţia şi utilizarea instrumentelor de tip data-mining pentru extragerea
informaţiilor şi cunoştintelor utile din cantităţile enorme de date colectate şi
stocate în depozite de date de dimensiuni mari şi foarte mari.

10.2. Conceptul de Data Mining


Conceptul de Data Mining (denumit şi „mineritul datelor”), se referă la
procesul de descoperire de modele de cunoştinţe şi/sau informaţii utile,
existente într-o cantitate mare de date, colectate şi stocate în diferite tipuri de
colecţii de date (baze de date operaţionale, depozite de date, baze de date pe
Web etc.), în vederea folosirii lor pentru fundamentarea deciziilor manageriale
în cadrul unei organizaţii economice.
Modelele de cunoştinţe şi/sau de informaţii, obţinute ca rezultat al
desfăşurării unui proces de tip data mining, sunt denumite, mai simplu, modele
de cunoştinţe, pornind de la definiţiile conceptelor: informaţie (care exprimă
elementele din realitatea înconjuratoare în momentul în care sunt percepute
pentru prima dată de utilizator, adică atunci când au caracter de noutate, de
ştire), cunoştinţă (care desemnează informaţia relevantă, informaţie cu înţeles
şi informaţie care acţioneaza16, pentru un domeniu de interes, după momentul
aflării acestei informaţii) şi dată (care desemnează informaţia sau cunoştinta
înregistrată în vederea stocării, prelucrării şi/sau analizei).
Denumirea de Data Mining este o expresie improprie, care asociază într-un
mod foarte sugestiv procesul de descoperire17 (căutare şi găsire) a cunoştinţelor
dintr-o cantitate mare de date, cu procesul de extragere a mineralelor din roci,
spre a-l face mai uşor de înţeles.
Ca urmare a acestei similitudini, denumirea cea mai adecvată pentru
procesul de descoperire a cunoştinţelor dintr-o cantitate mare de date ar fi :
exploatarea cunoştinţelor din date (Knowledge Mining from Data), o expresie
mai lungă şi mai putin sugestivă. Pentru desemnarea procesului respectiv se pot
folosi şi alte expresii, cu semnificaţie similară sau uşor diferită de Data Mining,
ca de exemplu: extragerea cunoştinţelor (knowledge extraction), analiza
datelor/modelelor (data/pattern analysis) sau arheologia datelor (data
archaeology). Dintre toate acestea, cea mai uzuală expresie este Data Mining,
fiind cea mai scurtă şi cea mai sugestivă.

16
Mihai Draganescu, Societatea Informaţională – Societatea cunoaşterii,
www.academiaromana.ro, Studii tematice.
17
www.dexonline.ro - DEX online: Dictionar explicativ al limbii române
55
Expresia Data Mining este sinonimă şi cu expresia: descoperirea
cunoştinţelor din date, (KDD - Knowledge Discovery from Data) care este
uzual folosită în literatura de specialitate prin abrevierea sa, KDD, ceea ce o
face să-şi piardă semnificaţia implicită, motiv pentru care se preferă utilizarea
primei expresii (Data Mining) pentru a desemna procesul de descoperire a
cunoştintelor din cantităţile mari de date, stocate în depozitele de date.

Test de autoevaluare nr. 1


Conceptul “data mining”

În realitate, procesul de exploatare a cunoştintelor din cantităţi mari de


date, este un proces complex, format, în principal, din următoarele procese mai
simple, care se succed în următoarea ordine18:
- curăţirea datelor (data cleaning); se referă la
înlaturarea datelor inutile şi a celor inconsistente.
Acest proces presupune:
– eliminarea datelor care nu sunt necesare;
– verificarea consistenţei datelor (unităţilor de măsură)–
detectarea datelor eronate şi eliminarea lor;
– eliminarea valorilor extreme (outliers);
- integrarea datelor (data integration): proces prin care se
realizează combinerea datelor provenite de la mai multe surse de date
diferite;
- selectarea datelor (data selection): extragerea datelor relevante
pentru analiză din sursele de date disponibile (baze de date, depozite de
date, baze de date Web etc.);
- transformarea datelor (data transformation): în cadrul acestui
proces se realizează aducerea datelor la formate unitare, corespunzătoare
pentru realizarea operaţiei de extragere a cunoştinţelor (mining), prin
realizarea unor operaţii rezumative şi/sau de agregare (de unificare);
- “mineritul datelor” (data mining): proces în care se realizează
extragerea unor modele de date, aplicând asupra datelor rezultate din
parcurgerea etapelor anterioare, metode inteligente, denumite generic
metode de tip Data Mining; acest proces este esenţial pentru

18
Gherasim, Z., Fusaru, D., Andronie, M., Sisteme informatice pentru asistarea
deciziei economice, Editura Fundatiei România de Mâine, Bucuresti, 2008
56
descoperirea de cunoştinţe utile, “ascunse” în sursele de date de mari
dimensiuni;
- evaluarea modelelor (pattern evaluation): proces prin care se
realizează evaluarea modelelor de date extrase, pentru identificarea celor
care reprezintă cunoştinţele care interesează în mod real;
- prezentarea cunoştinţelor (knowledge presentation): proces prin
care cunoştinţele nou obţinute sunt prezentate utilizatorilor lor, prin
folosirea unor tehnici adecvate de vizualizare şi de reprezentare.

Test de autoevaluare nr. 2


Procesul de exploatare a cunoştintelor

57
UTILIZATOR

CUNOŞTINŢE

Evaluare modele şi
prezentare

MODELE DE DATE

Data Mining (extragerea


cunoştinţelor)

Selecţie, transformare
şi reducere

Depozit de date

Curăţire şi integrare

Bază de date Bază de date … Bază de date

Figura 10.1. Structura procesului de Data Mining

De obicei, datele rezultate din procesele de curăţire şi integrare sunt


stocate în depozite de date, caz în care transformarea şi unificarea lor se
realizează înainte de procesul de selecţie. Pentru a se obţine o reprezentare mai
„redusă” a datelor originale, se poate aplica şi un proces de reducere a datelor
(data reduction), cu condiţia să nu se afecteze integritatea datelor.

58
Cunoştinţele şi informaţiile descoperite în procesul data mining se
folosesc în formularea deciziilor, în controlul unui proces economic sau
industrial, în managementul informaţiei etc.
Tehnicile de data mining se pot aplica atât ascendent cât şi descendent.
Prin abordarea ascendentă se urmăreşte extragerea de cunoştinţe sau
informaţii noi din datele disponibile, această căutare putând fi realizată dirijat
sau nedirijat. Prin căutarea dirijată se analizează un atribut sau un câmp,
încercând explicarea valorilor acestuia prin intermediul valorilor celelalte
atribute, respectiv câmpuri. Căutarea nedirijată urmăreşte identificarea relaţiilor
sau a structurilor existente în ansamblul datelor examinate, fără a acorda
prioritate unui anumit câmp sau altuia.
Sursa datelor pentru tehnologiile data mining o constituie colecţiile de
date stocate de-a lungul timpului pentru alte scopuri (de exemplu tranzacţiile
unei organizaţii economice, derulate pe o anumită perioadă de timp). Uneori la
acest tip de date se pot adăuga şi datele care provin din alte surse, cum sunt
statisticile oficiale, care privesc evoluţia în ansamblu a economiei, date privind
concurenţa sau diverse măsuri legislative. Datorită acestor surse de date
eterogene se foloseşte ideea de informaţie ascunsă în sensul că, prin interogări
clasice, este aproape imposibilă detectarea corelaţiilor sau a raporturilor pe care
datele le încorporează în mod intrinsec. Rezultatele obţinute prin data mining
sunt cu atât mai relevante, cu cât volumul de date pe care se bazează analiza este
mai mare.
Exploatarea datelor în scopul obţinerii de informaţii noi se poate realiza
prin diverse tehnici cum sunt: reţele neuronale, arbori de decizie, algoritmi
genetici, analiza cluster-ilor, raţionament bazat pe cazuri, analiza legăturilor etc.
Alături de aceste tehnici se pot folosi şi tehnici de analiză statistică, cum sunt
tehnicile de regresie sau analiza factorială.
Clasificarea are ca scop plasarea obiectelor prelucrate într-un grup
limitat de clase predefinite. De exemplu, vânzarea unui produs nou se poate
încadra într-una din urmatoarele categorii de risc: scazut, mediu, ridicat.
Grupurile obţinute prin clasificare vor fi reprezentate sub formă de înregistrări
care, la rândul lor, sunt compuse din atribute sau câmpuri.

59
Teste de verificare
1. Surse de date

Rezumat

Data Mining este o tehnologie determinată de creşterea volumului de


date produs în cadrul organizaţiilor economice în urma desfăşurării activităţilor
sale.
În acest context, sistemele informatice au evoluat în direcţia dezvoltării
următoarelor funcţionalită: sisteme cu baze de date avansate, sisteme pentru
analiza avansată a datelor (Data Warehousing şi Data Mining) sau sisteme cu
baze de date accesibile prin Web.
Instrumentele data-mining realizează analiza datelor şi pun în evidenţa
modele ale datelor, modele importante pentru stabilirea direcţiilor de evoluţie a
diferitelor domenii de activitate (economic, ştiinţific, medical, educaţional etc.)
pe care le desfăşoară organizaţiilor economice pentru atingerea obiectivelor
proprii.
Volumele foarte mari de date au determinat necesitatea unor instrumente
de analiză efectivă şi eficientă a datelor respective, care să funţioneze mai în
detaliu, cum ar fi: clasificarea, gruparea (clusterizarea) şi caracterizarea datelor
care variază în timp. Acest lucru a impus apariţia şi utilizarea instrumentelor de
tip data-mining pentru extragerea informaţiilor şi cunoştintelor utile din
cantităţile enorme de date colectate şi stocate în depozite de date de dimensiuni
mari şi foarte mari.
Procesul de exploatare a cunoştintelor din cantităţi mari de date, este un
proces complex, format, în principal, din următoarele procese mai simple, care
se succed în următoarea ordine:
1. curăţirea datelor (data cleaning); se referă la înlaturarea
datelor inutile şi a celor inconsistente.
2. integrarea datelor (data integration): proces prin care se realizează
combinerea datelor provenite de la mai multe surse de date diferite;
3. selectarea datelor (data selection): extragerea datelor relevante pentru
analiză din sursele de date disponibile (baze de date, depozite de date,
baze de date Web etc.);
4. transformarea datelor (data transformation): în cadrul acestui proces se
realizează aducerea datelor la formate unitare, corespunzătoare pentru

60
realizarea operaţiei de extragere a cunoştinţelor (mining), prin realizarea
unor operaţii rezumative şi/sau de agregare (de unificare);
5. “mineritul datelor” (data mining): proces în care se realizează extragerea
unor modele de date, aplicând asupra datelor rezultate din parcurgerea
etapelor anterioare, metode inteligente, denumite generic metode de tip
Data Mining; acest proces este esenţial pentru descoperirea de cunoştinţe
utile, “ascunse” în sursele de date de mari dimensiuni;
6. evaluarea modelelor (pattern evaluation): proces prin care se realizează
evaluarea modelelor de date extrase, pentru identificarea celor care
reprezintă cunoştinţele care interesează în mod real;
7. prezentarea cunoştinţelor (knowledge presentation): proces prin care
cunoştinţele nou obţinute sunt prezentate utilizatorilor lor, prin folosirea
unor tehnici adecvate de vizualizare şi de reprezentare.

Sursa datelor pentru tehnologiile data mining o constituie colecţiile de date


stocate de-a lungul timpului pentru alte scopuri. Exploatarea datelor în scopul
obţinerii de informaţii noi se poate realiza prin diverse tehnici cum sunt: reţele
neuronale, arbori de decizie, algoritmi genetici, analiza cluster-ilor, raţionament
bazat pe cazuri, analiza legăturilor

Bibliografie

1. Gherasim, Z., Fusaru, D., Andronie, M., Sisteme informatice pentru


asistarea deciziei economice, Editura Fundatiei România de Mâine,
Bucuresti, 2008
2. Han, J., Kamber, M,. Data Mining- Concepts and Technique, Second
Edition,
3. Mihai Draganescu, Societatea Informationala – Societatea cunoasterii,
www.academiaromana.ro, Studii tematice.
4. Morgan Kaufmann Publishers, USA, San Francisco CA 2006
5. www.dexonline.ro - DEX online: Dictionar explicativ al limbii române

61
Răspunsuri la teste de autoevaluare

1.Conceptul de Data Mining (denumit şi „mineritul datelor”), se referă la


procesul de descoperire de modele de cunoştinţe şi/sau informaţii utile, existente
într-o cantitate mare de date, colectate şi stocate în diferite tipuri de colecţii de
date (baze de date operaţionale, depozite de date, baze de date pe Web etc.), în
vederea folosirii lor pentru fundamentarea deciziilor manageriale în cadrul unei
organizaţii economice. Data Mining este o tehnologie determinată de creşterea
volumului de date produs în cadrul organizaţiilor economice în urma
desfăşurării activităţilor sale.
În acest context, sistemele informatice au evoluat în direcţia dezvoltării
următoarelor funcţionalită: sisteme cu baze de date avansate, sisteme pentru
analiza avansată a datelor (Data Warehousing şi Data Mining) sau sisteme cu
baze de date accesibile prin Web.

2. Este un proces complex, format, în principal, din următoarele procese mai


simple, care se succed în următoarea ordine:

o curăţirea datelor (data cleaning); se referă la înlaturarea datelor


inutile şi a celor inconsistente.
o integrarea datelor (data integration): proces prin care se
realizează combinerea datelor provenite de la mai multe surse de
date diferite;
o selectarea datelor (data selection): extragerea datelor relevante
pentru analiză din sursele de date disponibile (baze de date,
depozite de date, baze de date Web etc.);
o transformarea datelor (data transformation): în cadrul acestui
proces se realizează aducerea datelor la formate unitare,
corespunzătoare pentru realizarea operaţiei de extragere a
cunoştinţelor (mining), prin realizarea unor operaţii rezumative
şi/sau de agregare (de unificare);
o “mineritul datelor” (data mining): proces în care se realizează
extragerea unor modele de date, aplicând asupra datelor rezultate
din parcurgerea etapelor anterioare, metode inteligente, denumite
generic metode de tip Data Mining; acest proces este esenţial
62
pentru descoperirea de cunoştinţe utile, “ascunse” în sursele de
date de mari dimensiuni;
o evaluarea modelelor (pattern evaluation): proces prin care se
realizează evaluarea modelelor de date extrase, pentru
identificarea celor care reprezintă cunoştinţele care interesează în
mod real;
o prezentarea cunoştinţelor (knowledge presentation): proces prin
care cunoştinţele nou obţinute sunt prezentate utilizatorilor lor,
prin folosirea unor tehnici adecvate de vizualizare şi de
reprezentare.

63
Unitatea 11- Data mining: metode şi tehnici de data mining
Obiective
După parcurgerea acestei unităţi studentul:

- va înţelege metode de data mining


- va înţelege tehnici de data mining
Timp alocat studiului: 3 ore

Metodele utilizate pentru procesarea on-line a tranzacţiilor de date,


OLTP (On-Line Transaction Processing) au contribuit semnificativ la evoluţia şi
acceptarea tehnologiei bazelor de date relaţionale ca instrument de stocare
eficientă, de regăsire şi de management al cantităţilor mari de date.
Tehnologia pentru exploatarea depozitelor de date include integrarea
datelor şi procesarea analitică on-line a acestora (OLAP), precum şi posibilitatea
de vizualizare a datelor şi informaţiilor existente în depozit. Dar, deşi
instrumentele OLAP suportă analiza multidimensională şi sprijină formularea
deciziilor, volumele foarte mari de date au determinat necesitatea unor
instrumente de analiză efectivă şi eficientă a datelor respective, care să
funţioneze mai în detaliu, cum ar fi: clasificarea, gruparea (clusterizarea) şi
caracterizarea datelor care variază în timp. Acest lucru a impus apariţia şi
utilizarea instrumentelor de tip data-mining pentru extragerea informaţiilor şi
cunoştintelor utile din cantităţile enorme de date colectate şi stocate în depozite
de date de dimensiuni mari şi foarte mari.
În esenţă, instrumentele data-mining realizează analiza datelor şi pun în
evidenţa modele ale datelor, modele importante pentru stabilirea direcţiilor de
evoluţie a diferitelor domenii de activitate (economic, ştiinţific, medical,
educaţional etc.) pe care le desfăşoară organizaţiilor economice pentru atingerea
obiectivelor proprii.
Prin tehnologia data mining se prelucrează date ce se referă la perioade
anterioare (date istorice) din viaţa organizaţiei economice, date care sunt
examinate şi analizate, pe baza lor constituindu-se un model sau un şablon.
Acest model sau şablon va putea fi aplicat situaţiilor noi, de acelaşi tip cu cele
deja cunoscute.
Informaţiile obţinute prin aplicarea tehnicilor de tip data mining pot fi de
natură predictivă, care se referă la descoperirea comportamentelor viitoare, sau
de natură descriptivă, care se ocupă de caracterizarea generală a datelor

64
(comportamente individuale). De exemplu, planificarea acţiunilor de marketing
poate constitui o problemă de natură predictivă19, în timp ce detectarea fraudelor
bancare produse cu carduri reprezintă o problemă de natură descriptivă.
Alaturi de volumele mari de date, memorate pe suporturi de stocare
moderne, mai există doi factori care au condus la apariţia tehnologiei data
mining: creşterea capacităţii de stocare a datelor şi a capacităţii fizice de
prelucrare a calculatoarelor electronice, precum şi existenţa şi perfecţionarea
algoritmilor şi a produselor-program dedicate, factori care au permis realizarea
unor analize complexe pe volume mari de date.
Depozitele de date pot fi surse pentru aplicaţiile de tip data mining, iar
rezultatele obţinute pot completa informaţiile din aceste depozite de date,
informaţii care pot fi valorificate ulterior prin tehnicile de analiză
multidimensională, specifice proceselor OLAP.
Cu ajutorul tehnicilor data mining, orice proces sau fenomen reflectat în
baze de date, respectiv în depozite de date, constituie o temă de analiză şi
raportare în cadrul unei platforme dedicate pentru cercetarea afacerilor, BI
(Business Intelligence), sugestiv tradusă în unele lucrări româneşti sub
denumirea de „inteligenţa afacerilor”.
Spre deosebire de tehnicile OLAP, care utilizează interogări şi raportări
standard (care sunt clienţii cei mai valoroşi, care sunt produsele care s-au vândut
cel mai mult sau care sunt zonele cu costurile cele mai ridicate), tehnicile data
mining explorează volumele foarte mari de date eterogene cu scopul de a
înţelege şi de a dezvolta noi abordări asupra problemelor care trebuie rezolvate.
Instrumentele tradiţionale de cercetare a afacerilor (rapoarte, interogări şi
raportări interactive) permit sintetizarea a ceea ce s-a întâmplat în trecut, aspecte
reflectate de datele istorice ale companiei şi de unele date curente. Prin
tehnologia OLAP se pot obţine analize complexe asupra unor tendinţe ale
fenomenelor economice, bazate în special pe rezumate, comparări, analize şi
previziuni ce au la bază valori medii, sume şi grupări de date prin agregare. Cu
ajutorul tehnologiei data mining se adânceşte explorarea surselor de date, prin
descoperirea informaţiei ascunse, cu ajutorul şabloanelor (patterns), a factorilor
de influenţă, a clusterilor, a profilelor şi a predicţiilor aplicate unui volumului
mare de date.

19
Zaharie D, Albescu F, colectiv – Opera citata
65
Un exemplu pentru cele afirmate mai sus este următorul caz : analizând
profilurilor celor mai buni clienţi actuali ai unei firme prin tehnolgii data mining
se pot construi modele şi aplicaţii integratoare, destinate identificării clienţilor
care au cel mai mari potenţial de a deveni performanţi în viitor, chiar dacă, în
prezent, nu se încadrează în categoria celor mai buni clienţi ai firmei.
Utilizarea tehnologiilor data mining se realizează într-un ciclu care
cuprinde patru etape3:
1. identificarea oportunităţii comerciale şi definirea
datelor pe care se va face exploatarea;
2. obţinerea de informaţii şi cunoştinte din colecţiile de
date existente, cu ajutorul tehnicilor data mining;
3. adoptarea deciziilor şi efectuarea acţiunilor necesare,
în urma informaţiilor rezultate prin analizele de tip data
mining;
4.cuantificarea rezultatelor concrete obţinute, pentru a
putea identifica şi alte direcţii de exploatare a datelor.
Test de autoevaluare nr. 1
Diferenta tehnici OLAP si tehnici data mining

Test de autoevaluare nr. 2


Etapele utilizării tehnologii data mining

Tehnicile de data mining se pot aplica atât ascendent cât şi descendent.


Prin abordarea ascendentă se urmăreşte extragerea de cunoştinţe sau
informaţii noi din datele disponibile, această căutare putând fi realizată dirijat
sau nedirijat. Prin căutarea dirijată se analizează un atribut sau un câmp,
încercând explicarea valorilor acestuia prin intermediul valorilor celelalte
atribute, respectiv câmpuri. Căutarea nedirijată urmăreşte identificarea relaţiilor
sau a structurilor existente în ansamblul datelor examinate, fără a acorda
prioritate unui anumit câmp sau altuia.
Sursa datelor pentru tehnologiile data mining o constituie colecţiile de
date stocate de-a lungul timpului pentru alte scopuri (de exemplu tranzacţiile
unei organizaţii economice, derulate pe o anumită perioadă de timp). Uneori la
acest tip de date se pot adăuga şi datele care provin din alte surse, cum sunt
statisticile oficiale, care privesc evoluţia în ansamblu economiei, date privind
concurenţa sau diverse măsuri legislative. Datorită acestor surse de date

66
eterogene se foloseşte ideea de informaţie ascunsă în sensul că, prin interogări
clasice, este aproape imposibilă detectarea corelaţiilor sau a raporturilor pe care
datele le încorporează în mod intrinsec. Rezultatele obţinute prin data mining
sunt cu atât mai relevante, cu cât volumul de date pe care se bazează analiza este
mai mare.
Exploatarea datelor în scopul obţinerii de informaţii noi se poate
realiza prin diverse tehnici cum sunt: reţele neuronale, arbori de decizie,
algoritmi genetici, analiza cluster-ilor, raţionament bazat pe cazuri, analiza
legăturilor etc. Alături de aceste tehnici se pot folosi şi tehnici de analiză
statistică, cum sunt tehnicile de regresie sau analiza factorială.
Clasificarea are ca scop plasarea obiectelor prelucrate într-un grup
limitat de clase predefinite. De exemplu, vânzarea unui produs nou se poate
încadra într-una din urmatoarele categorii de risc: scazut, mediu, ridicat.
Grupurile obţinute prin clasificare vor fi reprezentate sub formă de înregistrări
care, la rândul lor, sunt compuse din atribute sau câmpuri. Ca tehnici de data
mining pentru clasificare se pot menţiona arborii de decizie, reţelele neuronale
şi raţionamentul bazat pe cazuri.
Estimarea este procesul de prelucrare prin care se va atribui o valoare
unei variabile pe baza celorlalte date de intrare. Rezultatele obţinute în urma unei
estimării sunt valori continue. Pentru acest tip de prelucrări se pot utiliza metode
specifice reţelelor neuronale.
Predicţia este procesul prin care se pot clasa înregistrările analizate, în
funcţie de un anumit comportament sau de o valoare viitoare estimată. Pentru
aceasta se va recurge la o colecţie de exemple care prezintă date din trecut şi în
care valorile variabilei de previzionat sunt deja cunoscute. Cu ajutorul acestor
date se va construi un model prin care se va putea explica comportamentul
observat. Aplicând acest model înregistrarilor care fac obiectul prelucrării, se va
putea obţine o predicţie a comportamentului sau a valorilor acestora în viitor.
Gruparea (cluster-izarea) este procesul care conduce la determinarea
acelor obiecte care apar cel mai fecvent împreună (spunem că formează
clustere). Un exemplu pentru aceasta este “analiza coşului gospodăriei” în
evaluările statistice. Analiza grupului urmăreşte o divizare a populaţiei eterogene
în grupuri mai omogene, care poartă numele de clustere. În aceasta tehnică nu se
pleacă de la un set predeterminat de clase şi nici nu se ţine seama de exemple din

67
trecut aşa cum se procedează la clasificare. Segmentarea pe grupuri se face
excluziv în funcţie de similitudinile obiectelor care compun mulţimea analizată.
Test de autoevaluare nr. 3
Ce este predictia?

11.1. Date şi modele folosite în data mining

În principiu, un proces de tip data mining poate fi aplicat asupra oricărei


colecţii de date, precum şi asupra tranzacţiilor de date care au un caracter
„temporar”. Dintre acestea cele mai uzuale sunt:
 baze de date tranzacţionale;
 depozite de date
 baze de date orientate obiect;
 bazele de date non-SQL, realizate prin tehnologii avansate.

Tehnologiile de tip data mining sunt determinate de caracteristicile


categoriei de date asupra cărora se aplică.

Un model reprezintă, în general, o simplificare a realităţii pentru a uşura


înţelegerea şi utilizarea modelului în activităţi predicitive sau de evaluare.
Practic, modelul este definit de descrierea elementelor şi fenomenelor din
realitatea înconjurătoare, acestea fiind reduse la caracteristicile lor esenţiale
pentru un anumit domeniu de activitate.
Extragerea modelelor de date, aplicând asupra datelor stocate în baze de
date, depozite de date sau alte colecţii de date tehnici inteligente de analiză,
denumite generic tehnici data mining, este un proces laborios denumit, în mod
uzual, proces data mining sau, proces de “minerit.
Modelele de date care pot fi extrase prin operaţii de data mining sunt
grupate pe categorii determinate de funcţiile sistemului informatic folosit,
denumite, pe scurt, funcţii data mining. Pentru îndeplinirea (realizarea)
funcţiilor sale, sistemul informatic pentru data mining execută o serie de sarcini
specifice, care au ca rezultat modele de date care pot fi folosite apoi de către
utilizator.

68
Test de autoevaluare nr. 4
Importanţa tehnicilor OLAP (exemple)

O sarcina data mining reprezintă o activitate sau un set de activităţi care


se execută pentru îndeplinirea sau realizarea unei funcţii a sistemului informatic
pentru data mining.
Sarcinile sistemelor data mining pot fi clasificate în două mari categorii:
1. sarcini descriptive, sunt cele care descriu caracteristicile generale ale
datelor stocate în colecţiile de date analizate;
2. sarcini predictive, sunt cele prin care se realizează extrageri de date din
colecţiile de date curente, cu scopul de a face previziuni, determinând
tendinţele de evoluţie ale acestora.
Principalele funcţii data mining, precum şi sarcinile care trebuie executate
pentru realizarea lor şi categoriile de modele care se pot obţine ca rezultat, sunt
următoarele:
1. descrierea unei clase/concept; este funcţia sistemului informatic
de tip data mining care se realizează prin executarea sarcinilor de
caracterizare date şi discriminare date, care au ca rezultat un model
de tip descriere, denumit în mod uzual descriere;
2. “mineritul” datelor cu ajutorul modelelor frecvente; este functia
sistemului realizata prin executarea sarcinilor de asociere a datelor şi
de corelaţie date, care au ca rezultat modelele data mining;
3. clasificarea şi predicţia; este funcţia sistemului realizată prin
executarea sarcinilor de clasificare date şi de predicţie, care au ca
rezultat modele de clasificare (de tip clasificator) şi de predicţie (de
tip predictor);
4. analiza grupurilor, este funcţia sistemului realizată prin
executarea sarcinii de grupare a datelor cu caracteristici
reprezentative comune, şi care are ca rezultat un model de grupare
(clustere);
5. analiza excepţiilor; este funcţia sistemului de tip data mining
realizată prin executarea sarcinii de analiză a excepţiilor şi are ca
rezultat un model al excepţiilor (date atipice pentru aplicaţie);
6. analiza evoluţiei; este funcţia sistemului de tip data mining
realizată prin executarea sarcinii de analiză a evoluţiei datelor şi

69
care are ca rezultat un model al tendinţelor de evoluţie a datelor si
a proceselor anaizate.

De cele mai multe ori, utilizatorii nu ştiu ce modele de date prezintă interes
pentru ei şi doresc sa extragă mai multe categorii diferite de modele din datele
stocate în depozitele de date aflate la dispoziţia lor. De aceea, este important ca
un sistem tip data mining să poată căuta prin categorii variate de modele de
date, pentru a răspunde cerinţelor diverselor aplicaţii ş/sau aşteptărilor unor
utilizatori diferiti. Este important ca un sistem tip data mining să permită
extragerea de modele de date aflate pe diferite nivele de abstractizare, nivele
corespunzătoare nivelelor de detaliu solicitate de utilizatori. De asemenea, este
important ca un sistem de tip data mining să accepte sugestiile utilizatorilor
pentru a direcţiona căutările către modelele de date care îi interesează pe
aceştia.
Teste de verificare
1. Funcţii data-mining

Rezumat
Tehnologia pentru exploatarea depozitelor de date include integrarea
datelor şi procesarea analitică on-line a acestora (OLAP), precum şi posibilitatea
de vizualizare a datelor şi informaţiilor existente în deposit.
Prin tehnologia data mining se prelucrează date ce se referă la perioade
anterioare (date istorice) din viaţa organizaţiei economice, date care sunt
examinate şi analizate, pe baza lor constituindu-se un model sau un şablon.
Acest model sau şablon va putea fi aplicat situaţiilor noi, de acelaşi tip cu cele
deja cunoscute.
Informaţiile obţinute prin aplicarea tehnicilor de tip data mining pot fi de
natură predictivă, care se referă la descoperirea comportamentelor viitoare, sau
de natură descriptivă, care se ocupă de caracterizarea generală a datelor
(comportamente individuale).
Cu ajutorul tehnicilor data mining, orice proces sau fenomen reflectat în
baze de date, respectiv în depozite de date, constituie o temă de analiză şi
raportare în cadrul unei platforme dedicate pentru cercetarea afacerilor, BI

70
(Business Intelligence), sugestiv tradusă în unele lucrări româneşti sub
denumirea de „inteligenţa afacerilor”.
Tehnicile de data mining se pot aplica atât ascendent cât şi descendent.
Prin abordarea ascendentă se urmăreşte extragerea de cunoştinţe sau
informaţii noi din datele disponibile, această căutare putând fi realizată dirijat
sau nedirijat. Prin căutarea dirijată se analizează un atribut sau un câmp,
încercând explicarea valorilor acestuia prin intermediul valorilor celelalte
atribute, respectiv câmpuri. Căutarea nedirijată urmăreşte identificarea relaţiilor
sau a structurilor existente în ansamblul datelor examinate, fără a acorda
prioritate unui anumit câmp sau altuia.
Spre deosebire de tehnicile OLAP, care utilizează interogări şi raportări
standard (care sunt clienţii cei mai valoroşi, care sunt produsele care s-au vândut
cel mai mult sau care sunt zonele cu costurile cele mai ridicate), tehnicile data
mining explorează volumele foarte mari de date eterogene cu scopul de a
înţelege şi de a dezvolta noi abordări asupra problemelor care trebuie rezolvate.

Bibliografie
1. Zaharie D, Albescu F, colectiv, Sisteme informatice pentru asistarea
deciziei, Editura Dual Tech, Bucureşti, 2001.

Răspunsuri la teste de autoevaluare

1.Tehnicile OLAP, care utilizează interogări şi raportări standard (care


sunt clienţii cei mai valoroşi, care sunt produsele care s-au vândut cel mai
mult sau care sunt zonele cu costurile cele mai ridicate), tehnicile data
mining explorează volumele foarte mari de date eterogene cu scopul de a
înţelege şi de a dezvolta noi abordări asupra problemelor care trebuie
rezolvate.

71
2. Utilizarea tehnologiilor data mining se realizează într-un ciclu care cuprinde
patru etape:
1. identificarea oportunităţii comerciale şi definirea datelor pe care
se va face exploatarea;
2. obţinerea de informaţii şi cunoştinte din colecţiile de date
existente, cu ajutorul tehnicilor data mining;
3. adoptarea deciziilor şi efectuarea acţiunilor necesare, în urma
informaţiilor rezultate prin analizele de tip data mining;
4. cuantificarea rezultatelor concrete obţinute, pentru a putea
identifica şi alte direcţii de exploatare a datelor.

3.Predicţia este procesul prin care se pot clasa înregistrările analizate, în funcţie
de un anumit comportament sau de o valoare viitoare estimată. Pentru aceasta se
va recurge la o colecţie de exemple care prezintă date din trecut şi în care
valorile variabilei de previzionat sunt deja cunoscute. Cu ajutorul acestor date se
va construi un model prin care se va putea explica comportamentul observat.
Aplicând acest model înregistrarilor care fac obiectul prelucrării, se va putea
obţine o predicţie a comportamentului sau a valorilor acestora în viitor.

4.Prin tehnologia OLAP se pot obţine analize complexe asupra unor


tendinţe ale fenomenelor economice, bazate în special pe rezumate,
comparări, analize şi previziuni ce au la bază valori medii, sume şi grupări de
date prin agregare. Cu ajutorul tehnologiei data mining se adânceşte
explorarea surselor de date, prin descoperirea informaţiei ascunse, cu ajutorul
şabloanelor (patterns), a factorilor de influenţă, a clusterilor, a profilelor şi a
predicţiilor aplicate unui volumului mare de date.
1.
Un exemplu pentru cele afirmate mai sus este următorul caz :
analizând profilurilor celor mai buni clienţi actuali ai unei firme prin tehnolgii
data mining se pot construi modele şi aplicaţii integratoare, destinate
identificării clienţilor care au cel mai mari potenţial de a deveni performanţi
în viitor, chiar dacă, în prezent, nu se încadrează în categoria celor mai buni
clienţi ai firmei.

72
Bibliografie

2. Drăgănescu Mihai, Societatea Informaţională – Societatea cunoaşterii,


www.academiaromana.ro, Studii tematice.
3. Filip Florin Gheorghe, Decizie asistată de calculator, decizii, decidenţi,
metode şi instrumente de bază, Editura Tehnică şi Editura Expert,
Bucureşti, 2002
4. Gherasim, Z., Fusaru, D., Andronie, M., Sisteme informatice pentru
asistarea deciziei economice, Editura Fundatiei România de Mâine,
Bucuresti, 2008
5. Han, J., Kamber, M,. Data Mining- Concepts and Technique, Second
Edition, Morgan Kaufmann Publishers, USA, San Francisco CA 2006
6. Holsapple, C.W, Whiston, A.B., Decision support systems. A knowledge-
based approach, St Paul , MN:West Publishing

7. Inmon H.W., Building the Data Warehouse, QED Technical Publishing


Group, 1992
8. Lungu, I. s.a., Sisteme informatice executive, Editura ASE, Bucuresti,
2007
9. Muntean, M., Iniţiere în tehnologia OLAP. Teorie şi practică, Editura
ASE, Bucureşti, 2004.
10. Pătraşcu, A., Tănăsescu A., A Document Warehouse Architecture Model,
The Tenth International Conference On Informatics In Economy,
Education, Research & Business Technology, Bucharest, May 5-6, 2011,
ISSN 2247-1480
11. Simon H.A., The Behavioral alternative, Reason in Human Affairs, Basil
Blackwell, Publisher, Oxford, 1983
12. Tănăsescu, A., Sisteme inteligente în economie, Editura Universitară,
Bucureşti, 2016.

73
13. Tănăsescu, A., The Role of Multidimensional Databases in Modern
Organizations, Economic Insights – Trends and Challenges, Vol. IV
(LXVII), No. 2/2015, pg. 95-102, ISSN 2284-8576.
14. Teodorescu Ana-Maria, Information, the Resource of the New Economy,
Annals Economic Science Series. Timisoara, XXI, 2015/I.S.S.N. 1582 –
6333, p.409-413
15. Turban, E., Aronson, J., Liang, T.-P., Sharda, R., Decision Support and
Business Intelligence Systems, Prentice Hall Publishing, 2010.
16. Zaharie D, Albescu F, colectiv, Sisteme informatice pentru asistarea
deciziei, Editura Dual Tech, Bucureşti, 2001.
17. Zenovic Gherasim, Sisteme informatice pentru asistarea deciziei,
https://se-b.spiruharet.ro/images/secretariat/2017-
2018/programe_licenta/cig/sinteze/an_3_sem_2/sinteza_siad.pdf

74

S-ar putea să vă placă și