Documente Academic
Documente Profesional
Documente Cultură
Cuprins ...................................................................................................................................1
Introducere .............................................................................................................................2
Unitatea 1-Rolul sistemelor informatice de asistare a deciziilor în procesul decizional
financiar-contabil: decizia, procesul decizional, decidentul, definiţii ale sistemelor
informatice de asistare a deciziilor .........................................................................................3
Răspunsuri la teste de autoevaluare .................................................................................14
Unitatea 2- Arhitectura unui sistem informatic de asistare a deciziilor: componenta de
gestiune a datelor..................................................................................................................16
Răspunsuri la teste de autoevaluare ................................................................................18
Unitatea 3- Arhitectura unui sistem informatic de asistare a deciziilor: componenta de
gestiune a modelelor ............................................................................................................19
Răspunsuri la teste de autoevaluare ................................................................................21
Unitatea 4-Arhitectura unui sistem informatic de asistare a deciziilor : componenta de
gestiune a dialogului şi componenta de gestiune a cunoştinţelor .........................................22
Răspunsuri la teste de autoevaluare ................................................................................24
Unitatea 5- Clasificarea SIAD..............................................................................................25
Răspunsuri la teste de autoevaluare .................................................................................27
Unitatea 6- Caracteristici SIAD ...........................................................................................28
2. http://en.wikipedia.org/wiki/Decision_support_systems .........................................29
Teste de autoevaluare .......................................................................................................29
Unitatea 7- Depozite de date: definiţii, arhitectura ..............................................................30
Răspunsuri la teste de autoevaluare .................................................................................37
Unitatea 8- Depozite de date: tipuri de depozite de date ......................................................39
Răspunsuri la teste de autoevaluare .................................................................................44
Unitatea 9- Tehnologii OLAP ..............................................................................................46
Răspunsuri la teste de autoevaluare .................................................................................51
Unitatea 10- Data mining: definiţii, arhitectura sistemelor de data mining .......................54
Răspunsuri la teste de autoevaluare .................................................................................62
Unitatea 11- Data mining: metode şi tehnici de data mining ..............................................64
Răspunsuri la teste de autoevaluare .................................................................................71
Bibliografie ..........................................................................................................................73
Introducere
Cursul Sisteme informatice de asistare a deciziilor este destinat
studenţilor din anul 3, specializarea Contabilitate şi Informatică de Gestiune.
Materialul este structurat pe 11 unităţi de învăţare, menite să ajute
studenţii să dobândească cunoştinţele în mod gradual.
La finalul semestrului 2, studentul va avea urmatoarele cunoştinţe:
conceptul de decizie,
conceptul sistem informatic de asistare a deziciei
structura unui sistem informatic de asistare a deziciei
clasificarea SIAD
caracteristici SIAD
organizărea datelor în depozite de date
conceptul OLAP
aspectele particulare ale sistemelor de procesare analitică
on-line (OLAP) ;
conceptul de Data Mining
metode de data mining
tehnici de data mining
Fiecare unitate de învăţare conţine obiective, timp alocat studiului,
rezumat, teste de autoevaluare, teste de verificare şi bibliografie care vin în
sprijinul studentului.
2
Unitatea 1-Rolul sistemelor informatice de asistare a deciziilor în
procesul decizional financiar-contabil: decizia, procesul decizional,
decidentul, definiţii ale sistemelor informatice de asistare a deciziilor
Obiective
După parcurgerea acestei unităţi studentul:
- va înţelege conceptul de decizie;
- va înţelege modalităţile de clasificare a deciziilor
- va înţelege particularităţile procesului de luare a
deciziilor si etapele procesului
- va înţelege conceptul de SIAD
1
Teodorescu Ana-Maria, Information, the Resource of the New Economy, Annals Economic
Science Series. Timisoara, XXI, 2015/I.S.S.N. 1582 – 6333, p.409
3
date2. Decizia este o activitate umană specifică celui care urmăreşte, în mod
conştient, atingerea unor obiective bine definite.
Test de autoevaluare nr. 1
Ce este decizia?
Clasificare
2
Acad. Florin Gheorghe FILIP, Decizie asistată de calculator, decizii, decidenţi, metode şi
instrumente de bază, Editura Tehnică şi Editura Expert, Bucureşti, 2002
4
de zile). Elaborarea şi adoptarea acestor decizii presupune participarea unui
număr redus de decidenţi ce lucrează, de regulă, într-o manieră creativa şi
nerepetitivă. Pentru luarea acestor decizii se folosesc date şi informaţii
puternic agregate, provenite, în principal, din surse externe organizaţiei
economice respective;
b) decizii tactice; decizii care determină cât de eficiente au fost folosite
resursele. Aceste decizii sunt specifice nivelului mediu de management şi au ca
orizont de timp lunile anului. Pentru luarea acestor decizii se folosesc date şi
informaţii mediu agregate, provenite atât din surse interne cât şi din surse
externe organizaţiei;
c) decizii de conducere operaţională; prin care se determină modul în care
sunt duse la îndeplinire sarcinile primite de către executanţi de la nivelele de
management superioare. Orizontul de timp avut în vedere pentru aceste decizii
este de săptămâni şi zile, iar pentru luarea acestor decizii se folosesc date şi
informaţii provenite, în principal, din surse interne organizaţiei.
5
ansamblul elementelor problemei. Gradul de structurare al unei deciziei
depinde de experienţa anterioară, acumulată de decident, precum şi de nivelul
şi importanţa ei. Conform terminologiei introduse de H. Simon3, în cazul
proceselor semistructurate apare nevoia unui “asistent” al managerului, acesta
fiind de fapt un proces de “asistare a deciziei”. Termenul de “asistare a
deciziei” se referea iniţial, la o serie de operaţii cum sunt sortarea, clasificarea,
selectarea, evaluarea informaţiilor, operaţii care aveau ca scop organizarea
acestoara, reducerea incertitudinii şi obţinerea mai multor variante de
rezolvare. Conceptul s-a dezvoltat prin folosirea metodelor cercetării
operaţionale, care s-au dovedit greu de aplicat în practică. De aceea a aparut o
altă modalitate de abordare a asistării deciziei şi anume “asistarea interactivă”.
Pe baza acesteia au apărut sistemele informatice de asistare a deciziei sau
Decision Support Systems (DSS), situate generic pe nivelul de management
mediu.
O altă clasificare a deciziilor poate fi făcută în funcţie de nivelul
cunoştinţelor de care dispune decidentul, cunoştinţe referitoare la evoluţia
problemei pe care o are de rezolvat. În funcţie de acest criteriu, deciziile pot fii:
1. decizii luate în condiţii de certitudine; acestea presupun o cunoaştere a
evoluţiei fenomenelor viitoare, aspect care se întâlneşte mai rar în realitatea
economica. O astfel de decizie se bazează pe folosirea unui criteriu de
optimizare a procesului economic (profit maxim, costuri de productie minime
etc.);
2. decizii luate în condiţii de incertitudine; acestea presupun
cunoaşterea evoluţiei anterioare a fenomenului economic. Cunoaşterea
evoluţiei anterioare permite o previziune şi o alegere aproximativ corectă a
variantei de decizie.
3. decizii luate în condiţii de risc; aceste decizii presupun că decidentul
cunoaşte doar aproximativ evoluţia viitoare a procesului economic, posibilul
trend al variabilelor necontrolabile şi chiar rezultatele pe care le are fiecare
strategie analizată pe baza criteriului probabilităţii maxime de realizare.
După modul de abordare a problemelor care trebuie rezolvate:
3
Simon H.A., The Behavioral alternative, Reason in Human Affairs, Basil Blackwell
Publisher, Oxford, 1983
6
1. decizii apărute ca rezultat al unor activităţi de management
întâmplătoare;
2. decizii apărute ca rezultate ale activităţilor de management bazate pe
rutină; în acest caz se folosesc şabloane ale activităţilor din trecut;
3. decizii apărute ca rezultate ale activităţilor de management bazate pe
instruire; în acest caz, modelele de decizii din trecut sunt modificate în funcţie
de achiziţionarea de cunoştinte, experienţe şi tehnici noi;
4. decizii apărute ca rezultate ale activităţilor de management
paradigmatice; în acest caz, modele din trecut ale deciziilor de succes luate în
cadrul firmei sunt preluate ca exemple de bune practici pentru analiza situaţiei
actuale;
5. decizii bazate pe analiza deciziilor (analiza şi modelarea sistemică şi
previzională); analiza deciziilor ajută decidentul în înţelegerea problemelor
decizionale şi în pregătirea acestuia pentru a face faţă situaţiilor neaşteptate şi
nefavorabile.
Dupa gradul de urgenţă al necesităţii luării deciziilor, acestea pot fi:
-decizii luate strict în timp real; acest tip de decizie este folosită pentru
managementul situaţiilor de criză (de exemplu, pentru gestionarea efectelor
unor calamităţi naturale – inundaţii, cutremure, incendii etc.);
- decizii luate aproape în timp real; sunt decizii adoptate în cazul gestionării
unor situaţii decizionale importante pentru organizaţie, cum ar fi, de exemplu,
apariţia de noi oportunităţi de afaceri, lansarea unui produs nou, apariţia stării
de faliment al firmei etc;
-decizii care nu sunt urgente; în acest caz, timpul aflat la dispoziţia decidentului
este suficient pentru realizarea unei analize detaliate a problemei de rezolvat şi
pentru alegerea variantei optime a problemei decizionale.
Dupa criteriul de secvenţialitate a deciziilor4, se
deosebesc:
a) decizii independente, apar în situaţia în care
decidentul ia decizii care nu depind unele de altele
şi sunt complet implementabile;
b) decizii dependent-secvenţiale, sau în cascada
(deciziile se iau una după alta);
4
Acad. Florin Gheorghe FILIP, Sisteme suport pentru decizii, Editura Expert, Bucureşti, 2004
7
c) decizii interdependente, se referă la o serie de
decizii independente care contribuie împreună la
atingerea unor obiective.
Test de autoevaluare nr. 3
Prezentaţi câteva criterii de clasificare a deciziilor.
8
formală a problemei decizionale, a categoriei din care aceasta face parte şi a
tuturor responsabilităţilor care decurg din aceasta.
2. Proiectarea (design-ul) sau elaborarea procesului de asistare a
deciziei – presupune alegerea sau construcţia unui model pentru asistarea
deciziei precum şi etapele de testare şi validare a acestuia. Prima etapă a
proiectării este modelarea. În această etapă problema este abstractizată
cantitativ şi/sau calitativ. Experienţa anterioară a decidentului influenţează
modul de alegere a modelului dintr-o multitudine de modele, permiţând
încadrarea problemei de rezolvat într-o anume clasă de modele existente.
3. Alegerea (choice) este etapa principală pentru adoptarea deciziei
deoarece în cadrul ei rezultatele obţinute în celelalte etape se concretizează.
Decidentul trebuie să aleagă o singură acţiune din multitudinea de acţiuni
posibile, în funcţie de criteriul de selecţie propus şi de modelul decizional pe
care l-a selectat (dintre modelele avute la dispoziţie). El va alege dintre
posibilităţile existente, în funcţie de soluţia obţinuta la rezolvarea modelului şi
tot el selectează planul pentru implementare. Pentru alegere sunt evidenţiate
mai multe metode de căutare ca de exemplu: tehnici analitice, metode de
căutare exhaustive prin care sunt analizate toate rezultatele obţinute de fiecare
alternativă sau metode euristice, care sunt aplicabile în metodele descriptive.
Metodele analitice sunt utilizate deseori datorită utilizării modelelor
matematice pentru a găsi soluţia optimă. Utilizarea lor este însă restricţionată
de natură problemelor analizate, deoarece acestea trebuie să se încadreze în
categoria problemelor structurate. Se pot aplica astfel de metode pentru
probleme de gestiune a stocurilor sau de alocare a resurselor. Algoritmii care
stau la baza acestor metode conduc la obţinerea unor soluţii viabile pentru
modelul ales.
Metodele de căutare exhaustivă sunt utilizate, în general, la luarea în
considerare a tuturor căilor de acţiune necesare pentru a ajunge la scopul
propus. Aceste metode au la bază un proces neghidat, proces în urma căruia se
alege o soluţie optimă sau apropiată de aceasta. Căutarea de obicei este
incompletă deoarece posibilităţile de căutare sunt limitate de timp sau spaţiu de
memorie, şi procesul de căutare se va opri când se va găsi o soluţie apropiată de
cea optimă (numită suboptimă sau optim parţial).
9
Metodele de căutare euristice se bazează pe o riguroasa analiză a
problemei sau prin tehnici de căutare prin încercări (trial-and-error) succesive a
spaţiului soluţiilor. Raţionamentul făcut realizează o parcurgere a spaţiului
soluţiilor care trece de la stare la alta pe baza unor criterii particularizate pentru
tipul de problemă analizat. Starea finală obţinută poate fi un rezultat
satisfăcător sau o nereuşită (eşec). În general metoda de căutare implementată
de un sistem de asistare a deciziilor este o metoda euristică.
4. Implementarea deciziei şi evaluarea (review) este etapa care se
desfăşoară după declanşarea acţiunii alese (propuse) de decident. Rolul acestei
etape este de a realiza acţiuni corective dacă implementarea alegerii iniţiale nu
conduce la rezultatele scontate. De obicei, aceasta etapă este o mare
consumatoare de timp, resurse şi în cursul ei poate apare o diversitate de alte
probleme de rezolvat, cum ar fi scaderea gradului de suport al nivelului
superior de management.
Analiza deciziilor este o tehnică ce asigură un cadru sistematic de abordare,
structurare, descompunere şi rezolvare a problemelor decizionale, ajutându-l şi
stimulându-l pe decident să gândească şi să preia critic alternativele propuse de
echipa managerială sau de către un
sistem informatic de asistare a deciziei. Analiza deciziilor se bazează pe
metode, tehnici şi instrumente informatice specifice sau preluate din alte
discipline (cercetări operaţionale, statistică, probabilităţi, simulare etc.).
Adoptarea deciziilor constituie un proces care, pe lângă suportul tehnic, are
nevoie în principal de un decident uman, ca o componentă integrantă a
sistemului decizional. Suportul cognitiv înglobează cunoştinţele şi experienţa
decidentului precum şi capacitatea acestuia de raţionament. Suportul cognitiv
este sprijinit şi marcat în ultimele decenii de apariţia sistemelor informatice de
lucru cu cunoştinţe, KWS (Knowledge Work System) care se ocupă de probleme
de stocare, clasificare, menţinere şi calitate a cunoştinţelor.
Dacă în sistemele informatice de asistare a deciziei se includ şi bazele de
cunoştinţe, se obţin astfel sisteme informatice de asistare a deciziei orientate pe
cunoştinţe sau aşa numitele sisteme informatice de asistare inteligentă a deciziei.
10
Test de autoevaluare nr 4
Descrieţi procesul de adoptare a deciziilor
5
E. Turban, Decision Support Systems and Intelligent Systems, 5th ed., Englewood Cliffs, New
Jersey, Prentice Hall, 1998
6
E. Turban, Decision Support Systems and Intelligent Systems, 5th ed., Englewood Cliffs, New
Jersey, Prentice Hall, 1998
11
Din punct de vedere semantic, un sistem informatic de asistare a deciziei
este o arhitectură complexă, abordată unitar, care presupune un dialog
permanent cu utilizatorul, şi în care decizia finală este adoptată de
utilizator şi nu de sistem.
Diferenţa dintre un Sistem Informatic pentru Management (MIS) şi un
Sistem Informatic pentru Asistarea Deciziei (SIAD) constă în faptul că MIS
este orientat pe date şi pe relaţiile dintre acestea, în timp ce SIAD-ul porneşte de
la decident şi de la decizie. Sistemele suport pentru întreprindere (ESS –
Enterprise Support System sau EIS – Enterprise Information System) sunt
sisteme destinate asistării deciziilor pe cel mai înalt nivel al managementului
organizaţional. Ele ajută la identificarea şi rezolvarea problemelor facilitând
sesizarea de noi oportunităţi. De asemenea, acest tip de sisteme au posibilitatea
de a oferi managerului tendinţe, previziuni, analize pentru activitatea
concurenţei.
Test de verificare
Rezumat
12
- nivelul decizional: decizii strategice , decizii tactice,
decizii de conducere operaţională;
- gradul de structurare: decizii structurate sau programabile,
decizii nestructurate , decizii semistructurate
- nivelul cunoştinţelor de care dispune decidentul: decizii luate în
condiţii de certitudine; decizii luate în condiţii de incertitudine, decizii
luate în condiţii de risc
- modul de abordare a problemelor care trebuie rezolvate:
decizii apărute ca rezultat al unor activităţi de management
întâmplătoare; decizii apărute ca rezultate ale activităţilor de
management bazate pe rutină; decizii apărute ca rezultate ale
activităţilor de management bazate pe instruire; decizii apărute ca
rezultate ale activităţilor de management paradigmatice, decizii
bazate pe analiza deciziilor
- gradul de urgenţa: -decizii luate strict în timp real; decizii luate
aproape în timp real, decizii care nu sunt urgente;
- criteriul de secvenţialitate a deciziilor: independente, dependent
secventiale, decizii interdependente,
Decidentul uman, care este elementul fundamental al procesului
decizional, prezintă mai multe limite care determină necesitatea şi oportunitatea
asistării informatizate a deciziilor.
Etape proces decizional: Informarea generală, Proiectarea, Alegerea,
Implementarea deciziei şi evaluarea.
Un sistem informatic de asistare a deciziei este o arhitectură
complexă, abordată unitar, care presupune un dialog permanent cu
utilizatorul, şi în care decizia finală este adoptată de utilizator şi nu de sistem.
13
Bibliografie
15
Unitatea 2- Arhitectura unui sistem informatic de asistare a
deciziilor: componenta de gestiune a datelor
Obiective
După parcurgerea acestei unităţi studentul:
-va înţelege structura unui SIAD
7
Zaharie D, Albescu F, colectiv –Sisteme informatice pentru asistarea deciziei
, Editura Dual Tech, Bucureşti, 2001.
16
pot proveni din surse interne organizaţiei sau din afara ei, acestea putând fi
introduse în baza de date proprie, sau pot fi accesate doar în momentul în care se
utilizează sistemul.
b) sistemul de gestiune a bazelor de date, SGBD, modul care este de
obicei încorporat în SIAD.
c) dicţionarul de date; acesta conţine un catalog al datelor bazei de date,
împreună cu definiţia lor, şi care este utilizat în prima fază a procesului
decizional - faza de identificare a problemelor.
d) facilităţile de integrare a datelor, care se referă la existenţa limbajelor
declarative de interogare.
Teste de verificare
Rezumat
baza de date
sistemul de gestiune a bazelor de date,
dicţionarul de date;
facilităţile de integrare a datelor
17
Bibliografie
18
Unitatea 3- Arhitectura unui sistem informatic de asistare a
deciziilor: componenta de gestiune a modelelor
Obiective
După parcurgerea acestei unităţi studentul:
-va înţelege structura unui SIAD
8
Zaharie D, Albescu F, Op. cit.
19
Test de autoevaluare nr.1
Teste de verificare
1. Arhitectura unui SIAD
Rezumat
modelele;
sistemul de gestiune al modelelor
dicţionarul
procesul de execuţie şi integrare a modelelor,
Bibliografie
20
Răspunsuri la teste de autoevaluare
modelele;
sistemul de gestiune al modelelor
dicţionarul
procesul de execuţie şi integrare a modelelor
21
Unitatea 4-Arhitectura unui sistem informatic de asistare a
deciziilor : componenta de gestiune a dialogului şi componenta de
gestiune a cunoştinţelor
Obiective
După parcurgerea acestei unităţi studentul:
-va înţelege structura unui SIAD
22
4.1.2. Interfaţa cu utilizatorul
Teste de verificare
1. Subsistemul de gestiune al cunoştinţelor
Rezumat
23
Bibliografie
24
Unitatea 5- Clasificarea SIAD
Obiective
-după parcurgerea unităţii 5, studentul va inţelege clasificarea SIAD
Clasificarea se poate face după mai multe criterii, cel mai des utilizat criteriu
fiind componenta tehnologică dominantă:
1. SIAD-uri orientate pe modele. Aceste SIAD-uri realizează analize de tipul
„what...if” . Activităţile implicate sunt de tipul modelare-simulare
previziune, optimizare. Modelul cantitativ este sprijinit de o interfaţă care
facilitează utilizarea.
2. SIAD-uri orientate pe date se referă la prelucrarea unui volum ridicat de
date (date istorice) stocate în sistemul informatic al organizaţiei şi care oferă
posibilitatea de a extrage informaţii utile din mulţimea de date stocate. Aceste
tipuri de SIAD-uri folosesc depozite de date, iar prelucrarea este asigurată de
tehnologiile informaţionale de tip OLAP (procesare analitică online) şi Data
Mining (explorarea şi căutarea şabloanelor în date).
Test de autoevaluare nr.1
Ce sunt SIAD-urile orientate pe date?
Teste de verificare
1. Explicaţi SIAD bazate pe calcul tabelar
Rezumat
26
SIAD bazate pe programe de calcul tabelar;
SIAD bazate pe funcţii;
SIAD bazate pe reguli;
Bibliografie
1. Zenovic Gherasim , Sisteme informatice pentru asistarea deciziei,
https://se-b.spiruharet.ro/images/secretariat/2017-
2018/programe_licenta/cig/sinteze/an_3_sem_2/sinteza_siad.pdf
27
Unitatea 6- Caracteristici SIAD
Obiective
-studentul va intelege prin ce se caracterizeaza un SIAD
9
http://en.wikipedia.org/wiki/Decision_support_systems
10
Holsapple, C.W, Whiston, A.B., Decision support systems. A knowledge+based approach, St
Paul , MN:West Publishing, p. 45
28
-permit achizitionarea si gestionarea unor cunostinte descriptive
-asigura selectarea unui set de cunostinte in scopul vizionarii acestora
pentru extragerea unor informatii necesare procesului decisional
- oferă facilitate de prezentare a unor cunoştinţe ad-hoc sau elaborare
rapoarte
Teste de verificare
1. Particularităţi SIAD în concepţia autorilor
holsapple şi Whiston
Rezumat
asistă decidenţii
sunt adaptabile şi flexibile;
permit accesul la date
susţine modelarea şi analiza
Bibliografie
Teste de autoevaluare
Caracteristici SIAD
29
Unitatea 7- Depozite de date: definiţii, arhitectura
Obiective
După parcurgerea acestei unităţi studentul:
- va înţelege aspectele particulare ale organizării datelor în
depozite de date
- va înţelege importanta depozitelor de date
- va cunoaste componentele depozitelor de date
- va cunoaşte modalităţile de organizare a datelor în
depozite de date şi etapele de existenţă ale acestora.
30
7.2. Depozitul de date. Concept.
11
Inmon H.W., Building the Data Warehouse, QED Technical Publishing Group,
1992
31
- metadatele (descrieri despre date şi regulile pentru organizarea
prelucrărilor aplicate datelor. Acestea permit indexarea şi regăsirea uşoară
a datelor, inclusiv prin instrumente Web);
- Instrumente software care asigură accesul la depozitul de date
(OLAP, Data Mining, instrumente pentru întocmirea rapoartelor şi pentru
vizualizarea datelor).
Interfeţe de aplicaţie
(middleware)
Colecţii de date Magazie de date
Data Marts
APLICAŢII
Magazie de date
Data Marts OLAP
Data Mining
Web
Instrumente de
SURSE EXTERNE DE interogare
DATE Instrumente de
raportare
Vizualizare
rezultate
Test de autoevaluare nr 2
Componente deposit de date
32
privind evoluţia firmei respective pe o perioadă mai lungă de timp, modul în care
a evoluat firma şi modul în care a reacţionat la diverse provocări apărute din
mediul extern. Toate aceste informaţii se pot constitui într-o experienţă ascunsă în
aceste date, experienţă care poate fi folosită ca ghid în luarea deciziilor
manageriale.
Depozitele de date integrează diferitele baze de date din organizaţie,
asigurând informaţii oportune şi relevante sistemelor informatice pentru asistarea
deciziei manageriale, SIAD.
Depozitele de date pot înmagazina volume mari de date provenite din arhive
şi/sau din bazele de date ale aplicaţiilor informatice specifice activităţii curente a
întreprinderii, precum şi din surse externe organizaţiei economice. Exploatarea
acestor volume uriaşe de date, provenind de la surse de date diverse, necesită
existenţa unor aplicaţii software speciale, care oferă posibilitatea ca masivele de
date să poată fi interogate, precum şi realizarea unor analize on-line a datelor
(OLAP). Aplicaţiile software suport susţin performanţele acestor analize on-line
prin transformarea datelor, prin corelarea şi completarea lor, precum şi prin
crearea şi întreţinerea dicţionarului de date, toate acestea asigurând accesul la
structurile primare.
Datele sunt introduse în depozitul de date sub controlul unor aplicaţii speciale
şi al SGBD-ului. Acestea asigură, prin serviciile de integritate, stocarea şi lucrul
în condiţii de siguranţă maximă. Datele care reprezintă suport pentru tranzacţiile
primare sunt prelucrate pentru a se obţine informaţiile de sinteză necesare
planificării şi luării deciziilor.
Exploatarea unui volum foarte mare de date, pentru a obţine diverse rapoarte,
poate duce la exploatarea unui număr mare de tabele, la crearea unor legături
virtuale multiple şi a unor tabele temporare. Aceasta poate conduce la un volum
mare de muncă şi reprezintă principalul inconvenient al depozitelor de date, şi
anume, timpul mare necesar pentru exploatarea lor.
d) aparut astfel necesitatea stocării datelor care sunt dedicate depozitelor de
date într-un sistem diferit de sistemul de baze de date operaţionale, în aşa fel încât
funcţionarea celor două sisteme să se realizeze fără inconveniente.
În depozitul de date se pot stoca atât volume de date privind activitatea
anterioară cât şi date referitoare la tranzacţii ulterioare fără ca tilizatorul să poată
interveni. Depozitele de date reprezintă o concentrare de date prin care se
organizează, consolidează şi centralizează datele provenite din surse eterogene,
33
date care vor constitui baza procesărilor analitice atât de necesare proceselor de
decizie.
Un depozit de date se construieşte progresiv deoarece el permite completări
şi dezvoltări ulterioare. Pentru a se asigura o calitate sporita a datelor, acestea
sunt supuse unui proces de curăţire şi transformare, acest proces ducând la
reducerea timpului necesar pentru obţinerea rapoartelor finale. În depozitele de
date se face transformarea codurilor în date explicite precum şi integrarea datelor
din nomenclatoare în datele referitoare la tranzacţii. Acest proces este denumit
proces de denormalizare, şi este caracterizat de faptul că nu modifică integritatea
datelor dar accelerează procesul de regăsire a informaţiilor. Într-un depozit de
date, redundanţa datelor este permisă şi chiar încurajată, aceasta facilitând
regăsirea rapidă a informaţiilor.
7.3.Arhitectura
Literatura de specialitate prezintă mai multe arhitecturi de depozite de date,
grupate în doua categorii: depozitele de date de tip întreprindere, (EDW -
Enterprise Data Warehouse) şi magazii de date (Data Marts).
Decizie de alegere a unei arhitecturi de depozit de date este influenţată de mai
mulţi factori, dintre care se menţionează:
cerinţele de informaţie ale managementului de vârf (top-management);
interdependenţele informaţionale existente între departamentele şi
entităţile funcţionale ale organizaţiei economice;
gradul de limitare a resurselor organizaţiei economice;
existenţa compatibilităţii cu sistemele informatice aflate deja în exploatare
în organizaţie;
motivaţia profundă a angajaţilor în dezvoltarea unui depozit de date.
34
1. integrarea aplicaţiilor de tip întreprindere, (EAI - Enterprise
Application Integration);
2. arhitectura orientată pe servicii, (SOA - Service-Oriented
Architecture);
3. extragerea, transformarea şi încărcarea datelor în depozitul
de date, (ETL - Extraction, Transformation and Load);
4. integrarea informaţiilor de tip întreprindere, (EII -
Enterprise Information Integration).
Integrarea aplicaţiilor de tip tip întreprindere, (EAI - Enterprise Application
Integration) este o tehnologie care asigură modalitatea unitară de preluare a
datelor din surse diverse şi stocarea lor în depozitul de date de tip întreprindere.
Această modalitate de integrare a aplicaţiilor de tip întreprindere se realizează la
nivelul interfeţei de programare a aplicaţiei, (API - Application Programming
Interface). Ea este combinată cu arhitectura orientată pe servicii, (SOA -
Service-Oriented Atchitecture) care este focalizată pe un ansamblu coerent de
procese de afaceri orientate pe servicii Web.
Extragerea, transformarea şi încărcarea datelor în depozitul de date, (ETL -
Extraction, Transformation and Load), reprezintă componenta de integrare a
oricărui proiect centrat pe organizarea, stocarea şi prelucrarea datelor, aşa cum
este depozitarea datelor. Această componenta, ETL, consuma circa 70% din
perioada de lucru la un proiect centrat pe date.
Extragerea datelor înseamnă citirea datelor destinate depozitului de date din
una sau mai multe baze de date.
Transformarea datelor reprezintă conversia datelor extrase, din forma iniţială
în forma standard necesară pentru stocarea în depozitul de date sau în alte baze de
date, cu care depozitul de date lucrează direct.
Încărcarea datelor înseamna stocarea datelor, anterior transformate în forma
standard, curăţate şi rafinate, în depozitul de date.
Pot constitui surse de date relevante pentru depozitul de date următoarele:
1. baze de date tranzacţionale (provenite din sistemul
informatic de procesare a tranzacţiilor, TPS) ;
2. baze de date provenite din aplicaţii ERP ;
3. baze de date provenite din aplicaţii CRM ;
4. date provenite din tabele Excel (într-un cadru mai larg,
din baze de date specifice OAS)
35
5. date provenite din baze de cunostinte specifice KWS
6. date provenite din şiruri de mesaje, din fişiere externe
etc. Datele stocate în depozitul de date sunt conforme (prin forma standard
dobândita prin intermediul procesului ETL) cu regulile de afaceri ce definesc
modul de folosire a datelor stocate, cu regulile de întocmire a sintezelor şi
rapoartelor, cu regulile de standardizare a atributelor codificate, cu regulile de
efectuare a calculelor. Toate aceste reguli sunt memorate într-o bază de metadate
şi sunt aplicate unitar asupra întregului depozitul de date.
Teste de verificare
1. Surse de date relevante pentru depozitul de date
Rezumat
Noţiunea de depozit de date se referă la rezultatul final – date memorate
pe suport de memorie, date ce prezintă caracteristici distincte faţă de bazele de
date tranzacţionale, în timp ce noţiunea de depozitare a datelor (Data
Warehousing) se referă la întregul proces de creare, menţinere şi exploatare a unui
depozit de date.
Depozitele de date reprezintă o tehnică a informaticii aplicate în domeniul
sistemelor informatice pentru asistarea deciziei, SIAD sau DSS, prin intermediul
căreia se asigură:
1) administrarea complexă a afacerilor;
2) accesarea din exterior, oportună şi eficace, a informaţiilor
şi cunoştintelor necesare afacerilor (business information
and business knowledge).
Necesitatea depozitelor de date a apărut datorită acumulării unui volum
foarte mare de date la nivelul organizaţiei economice, volum acumulat de-a
lungul timpului, şi care nu era folosit decât o scurtă perioadă de timp
Un depozit de date conţine următoarele componente majore:
- sursele de date; modulul pentru extragerea, transformarea şi
încărcarea datelor din bazele de date operaţionale, (ETL - Extraction,
Transformation and Load); depozitul de date de tip întreprindere, (EDW
Enterprise Data Warehouse); metadatele (descrieri despre date şi regulile
pentru organizarea prelucrărilor aplicate datelor); Instrumente software
36
care asigură accesul la depozitul de date (OLAP, Data Mining,
instrumente pentru întocmirea rapoartelor şi pentru vizualizarea datelor).
Literatura de specialitate prezintă mai multe arhitecturi de depozite de date,
grupate în doua categorii: depozitele de date de tip întreprindere, (EDW -
Enterprise Data Warehouse) şi magazii de date (Data Marts).
Integrarea datelor într-un depozit de date presupune trei procese
majore:procesul care asigură accesul la date; procesul pentru realizarea federaţiei
de date; procesul care asigură reflectarea în depozitul de date a modificărilor
semnificative ale datelor provenite din sursele de date de tip întreprindere.
Pot constitui surse de date relevante pentru depozitul de date următoarele:
1. baze de date tranzacţionale (provenite din sistemul
informatic de procesare a tranzacţiilor, TPS) ;
2. baze de date provenite din aplicaţii ERP ;
3. baze de date provenite din aplicaţii CRM ;
4. date provenite din tabele Excel (într-un cadru mai larg,
din baze de date specifice OAS)
5. date provenite din baze de cunostinte specifice KWS
date provenite din şiruri de mesaje, din fişiere externe etc.
Bibliografie
1. Inmon H.W., Building the Data Warehouse, QED Technical Publishing
Group, 1992
38
Unitatea 8- Depozite de date: tipuri de depozite de date
Obiective
39
o unitate strategică de afaceri, (SBU - Strategic Business Unit), şi nu folosesc
datele din depozitul de date al organizaţiei economice. Magazia de date
independentă poate constitui o alternativă „low cost” pentru firmele care nu-şi pot
permite construirea, menţinerea şi exploatarea unui depozit de date.
Test de autoevaluare nr. 1
Caraceristici magazii de date
41
5. sistemele tranzacţionale reflectă, de obicei, tranzacţiile de date din
activităţile curente, pe când depozitele de date sunt orientate pe subiecte,
cum ar fi: produse, clienţi, furnizori, resursele firmei etc.
6. în cadrul sistemelor informatice operaţionale, dedicate domeniilor de
gestiune ale organizaţiei, datele sunt adesea fragmentate, astfel încât
managerii iau decizii pe baza unor informaţii parţiale (incomplete).
Depozitele de date elimină acest dezavantaj prin accesarea, integrarea şi
organizarea datelor operaţionale cu rol-
cheie într-o formă care se caracterizează prin consistenţă, fiabilitate,
oportunitate, disponibilitate rapida şi cu referinţă în timp.
Etapele de viaţă ale unui depozit de date corespunde oricărei aplicaţii
software, şi anume : proiectare, implementare, populare cu date, exploatare şi
întreţinere. În exploatarea curentă a unui depozit de date apar frecvent noi
cerinţe informaţionale care vor duce la extinderea structurii, la extensii ale
depozitului de date cu date istorice, precum şi laintegrarea noilor date
încorporate în aplicaţii de analiză. Pe parcursul existenţei sale, un depozit de
date este dezvoltat pas cu pas, printr-un proces ciclic, în care diferite etape se
reiau periodic.
42
şi ca structuri intermediare de date pentru colectarea datelor din surse primare de
date, conţinutul lor fiind descărcat periodic în depozitul de date.
Mediul software care permite construirea şi exploatarea un depozit de date
trebuie să ofere următoarele elemente: surse de date (de obicei baze de date
tranzacţionale), instrumente de proiectare-dezvoltare, instrumente pentru extracţia
şi transformarea datelor, un sistem de gestiune al bazei de date tranzacţionale,
instrumente de acces la date şi pentru analiza lor, precum şi instrumente de
administrare a depozitului de date.
Utilizarea unui depozit de date implică existenţa unui set specializat de
instrumente care trebuie să asigure: descrierea fizică şi logică a structurii datelor
provenite din sursele de date, precum şi a depozitelor sau a magaziei de date în
care acestea urmează să fie încorporate; validarea, curăţirea şi transformarea
datelor care urmează a fi stocate în depozitul de date; instrumente care permit
utilizatorilor finali accesul la datele stocate în depozitul respectiv. Astfel de
instrumente pot fi unelte specializate, dezvoltate pentru medii de dezvoltare a
aplicaţiilor de uz general, produse program specializate pe analiza datelor, precum
şi aplicaţii dedicate unui anumit depozit de date.
Teste de verificare
1. Utilizare depozite de date
Rezumat
Se diferenţiază trei tipuri principale de depozite de date: magazia de
date, (DM - Data Marts), memoriile-tampon de date operaţionale, (ODS -
Operational Data Stores) şi depozitele de date de tip întreprindere, (EDW -
Enterprise Data Warehouse).
La nivelul departamentelor şi entităţilor funcţionale din mediul economic,
datele sunt depuse în magazii de date, DM (Data Marts).
Magaziile de date, cu dimensiuni mai mici decât depozitele de date, sunt
destinate unui anumit departament al organizaţiei economice sau unui anumit
subiect, definit la cererea utilizatorului final. Depozitele de date combină baze de
date la nivelul întregii organizaţii economice (adică la nivelul sistemului
informatic integrat al organizaţiei economice), în schimb magaziile de date, cu
dimensiuni mai mici decât depozitele de date, sunt destinate unui anumit
43
departament al organizaţiei economice sau unui anumit subiect, definit la cererea
utilizatorului final.
Memoriile-tampon de date operaţionale servesc pentru asistarea deciziei
pe termen scurt, în special în aplicaţiile care prezintă puncte critice.
Memoriile-tampon de date operaţionale stochează cele mai recente date
referitoare la subiectul analizat, date ce provin din surse multiple.
Un depozit de date de tip întreprindere, EDW (Enterprise Data
Warehouse) este un depozit de date integrat pe scară largă, cu un volum de date
foarte mare, care se foloseşte la nivelurile de management mediu şi strategic
pentru asistarea luării deciziei.
Depozitele de date de tip întreprindere, EDW, utilizeaza date în format
standard, ce provin de la surse diverse.
Bibliografie
1. Turban E., Aronson, J.E., Liang, T.P., Sharda, R. - Decision Support and Business
Intelligence Systems, Pearson Prentice Hall, New Jersey, 2007.
44
2. Depozitele de date de tip întreprindere, EDW, utilizeaza date în
format standard, ce provin de la surse diverse. Datele din acestea sunt folosite ca
date de intrare pentru majoritatea tipurilor de sisteme informatice pentru asistarea
deciziei economice, cum sunt sistemele informatice pentru managementul
relaţiilor cu clienţii, CRM (Customer Relationship Management), sistemele
informatice pentru managementul lanţului de aprovizionare, SCM (Supply Chain
Management), sistemele informatice pentru managementul performanţelor
afacerilor, BPM (Business Performance Management), sistemele informatice
pentru managementul ciclului de viaţă al produselor, PLM (Product Lifecycle
Mangement), sistemele informatice pentru monitorizarea activitaţilor afacerilor,
BAM (Business Activity Monitoring), sistemele (aplicaţiile) informatice pentru
managementul veniturilor, sistemele informatice pentru automatizarea lucrărilor
de birou, (Office Automation Systems), sistemul informatic de lucru cu
cunoştinte, KWS
45
Unitatea 9- Tehnologii OLAP
Obiective
După parcurgerea acestei unităţi studentul:
- va înţelege conceptul OLAP
- aspectele particulare ale sistemelor de procesare analitică
on-line (OLAP) ;
- va cunoaşte modele de date associate sistemelor OLAP
- va cunoaşte pricipiile OLAP
12
Tănăsescu, A., The Role of Multidimensional Databases in Modern Organizations, Economic
Insights – Trends and Challenges, Vol. IV (LXVII), No. 2/2015, pg. 95
46
Un sistem OLAP cuprinde activităţi ca generarea şi obţinerea de răspunsuri la
interogări nestandard şi cereri ad-hoc de rapoarte şi grafice.
47
- modelul Cabbibo şi Torlone; fundamentat pe o schemă
multidimensională compusă din mulţimea de dimensiuni, tabelele
de fapte şi descrierile nivelurilor ierarhice13
9.2. Principii
13
Lungu, I. s.a., Sisteme informatice executive, Editura ASE, Bucuresti, 2007
14
Muntean, M., Iniţiere în tehnologia OLAP. Teorie şi practică, Editura ASE, Bucureşti, 2004.
48
- posibilităţi de acces simultan al mai multor utilizatori la aceeaşi etapă a
analizei;
- posibilitatea de a efectua operaţii fără restricţii; prin această caracteristică
se oferă posibilitatea executării, fără restricţii, a operaţiilor necesare pentru toate
combinaţiile de dimensiuni şi niveluri ierarhice;
- posibilitatea manevării intuitive a datelor;
- existenţa unui număr de nivele de agregare, precum şi existenţa unui
număr de dimensiuni, nelimitate.
- valorile lipsă sunt diferite de valorile invalide şi de valorile zero; valoarea
zero este valida; modelele OLAP satisfac regula referitoare la valorile NULL din
modelul relaţional. Ca urmare, datele lipsă sau cele invalide trebuie tratate în mod
individual;
- denormalizarea datelor; aplicată la introducerea lor în depozitul de date
- memorarea rezultatelor generate de OLAP; sistemele OLAP stochează
datele în depozite de date separat de sistemele tranzacţionale;
- flexibilitatea rapoartelor, prin selectarea axelor de raportare conform
cerinţelor finale;
- caracteristici superioare ale raportării; în funcţie de locaţia procesării
datelor (client sau server) şi de modul de efectuare a calculelor (după modele de
preprocesare sau calcule executate în momentul interogării depozitului de date);
- ajustarea automată a nivelului fizic; în funcţie de volumul datelor şi de
tipul de model logic folosit.
1. Teste de verificare
1. Modele de date asociate sistemelor OLAP.
Rezumat
50
4. posibilităţi de acces simultan al mai multor utilizatori la
aceeaşi etapă a analizei;
Bibliografie
2.
abordarea conceptuală multidimensională a datelor; ca urmare, se
folosesc modele multidimensionale;
51
asigurarea unei transparenţe sporite a aplicaţiei;
asigurarea accesibilităţii pentru utilizator, prin asistarea acestuia în
procesul de interacţiune cu modalităţile tehnice de furnizare a datelor
(utilizatorul final reprezintă şi el o sursă de date); pentru aceasta trebuie
să se realizeze o singură viziune logică a datelor din organizaţie;
complexitatea dimensională a analizei oferă performanţe stabile;
instrumentele OLAP trebuie să aibă implementate patru tipuri de analiză:
directă, explicativă, contemplativă şi formativă;
utilizarea arhitecturii client-server; server-ul având ca scop asigurarea
omogenizării datelor;
posibilitatea de a efectua operaţii asemănătoare asupra tuturor
dimensiunilor; aceast aspect poartă numele de prelucrare generică a
dimensiunilor;
dimensiunile trebuie să fie echivalente operaţional şi structural
(dimensionalitate generica); prin aceasta se asigură astfel ierarhii
multiple;
gestionarea dinamică a matricilor încrucişate, oferită prin facilitatea
SIAD-ului de a elimina valorile dimensionale nule, pentru a nu încărca
memoria calculatorului; aceasta înseamnă că, indiferent de sursa lor,
valorile lipsă sunt ignorate;
posibilităţi de acces simultan al mai multor utilizatori la aceeaşi etapă a
analizei;
52
flexibilitatea rapoartelor, prin selectarea axelor de raportare conform
cerinţelor final;
caracteristici superioare ale raportării; în funcţie de locaţia procesării
datelor (client sau server) şi de modul de efectuare a calculelor (după
modele de preprocesare sau calcule executate în momentul interogării
depozitului de date);
ajustarea automată a nivelului fizic; în funcţie de volumul datelor şi de
tipul de model logic folosit.
53
Unitatea 10- Data mining: definiţii, arhitectura sistemelor de
data mining
Obiective
După parcurgerea acestei unităţi studentul:
- va înţelege conceptul de Data Mining;
- va înţelege aspectele privind gruparea datelor;
- va înţelege procesul de exploatare a cunoştintelor din
cantităţi mari de date,
Timp alocat studiului: 3 ore
15
Han, J., Kamber, M,. Data Mining- Concepts and Technique, Second Edition, Morgan
Kaufmann Publishers, USA, San Francisco CA 2006
54
impus apariţia şi utilizarea instrumentelor de tip data-mining pentru extragerea
informaţiilor şi cunoştintelor utile din cantităţile enorme de date colectate şi
stocate în depozite de date de dimensiuni mari şi foarte mari.
16
Mihai Draganescu, Societatea Informaţională – Societatea cunoaşterii,
www.academiaromana.ro, Studii tematice.
17
www.dexonline.ro - DEX online: Dictionar explicativ al limbii române
55
Expresia Data Mining este sinonimă şi cu expresia: descoperirea
cunoştinţelor din date, (KDD - Knowledge Discovery from Data) care este
uzual folosită în literatura de specialitate prin abrevierea sa, KDD, ceea ce o
face să-şi piardă semnificaţia implicită, motiv pentru care se preferă utilizarea
primei expresii (Data Mining) pentru a desemna procesul de descoperire a
cunoştintelor din cantităţile mari de date, stocate în depozitele de date.
18
Gherasim, Z., Fusaru, D., Andronie, M., Sisteme informatice pentru asistarea
deciziei economice, Editura Fundatiei România de Mâine, Bucuresti, 2008
56
descoperirea de cunoştinţe utile, “ascunse” în sursele de date de mari
dimensiuni;
- evaluarea modelelor (pattern evaluation): proces prin care se
realizează evaluarea modelelor de date extrase, pentru identificarea celor
care reprezintă cunoştinţele care interesează în mod real;
- prezentarea cunoştinţelor (knowledge presentation): proces prin
care cunoştinţele nou obţinute sunt prezentate utilizatorilor lor, prin
folosirea unor tehnici adecvate de vizualizare şi de reprezentare.
57
UTILIZATOR
CUNOŞTINŢE
Evaluare modele şi
prezentare
MODELE DE DATE
Selecţie, transformare
şi reducere
Depozit de date
Curăţire şi integrare
58
Cunoştinţele şi informaţiile descoperite în procesul data mining se
folosesc în formularea deciziilor, în controlul unui proces economic sau
industrial, în managementul informaţiei etc.
Tehnicile de data mining se pot aplica atât ascendent cât şi descendent.
Prin abordarea ascendentă se urmăreşte extragerea de cunoştinţe sau
informaţii noi din datele disponibile, această căutare putând fi realizată dirijat
sau nedirijat. Prin căutarea dirijată se analizează un atribut sau un câmp,
încercând explicarea valorilor acestuia prin intermediul valorilor celelalte
atribute, respectiv câmpuri. Căutarea nedirijată urmăreşte identificarea relaţiilor
sau a structurilor existente în ansamblul datelor examinate, fără a acorda
prioritate unui anumit câmp sau altuia.
Sursa datelor pentru tehnologiile data mining o constituie colecţiile de
date stocate de-a lungul timpului pentru alte scopuri (de exemplu tranzacţiile
unei organizaţii economice, derulate pe o anumită perioadă de timp). Uneori la
acest tip de date se pot adăuga şi datele care provin din alte surse, cum sunt
statisticile oficiale, care privesc evoluţia în ansamblu a economiei, date privind
concurenţa sau diverse măsuri legislative. Datorită acestor surse de date
eterogene se foloseşte ideea de informaţie ascunsă în sensul că, prin interogări
clasice, este aproape imposibilă detectarea corelaţiilor sau a raporturilor pe care
datele le încorporează în mod intrinsec. Rezultatele obţinute prin data mining
sunt cu atât mai relevante, cu cât volumul de date pe care se bazează analiza este
mai mare.
Exploatarea datelor în scopul obţinerii de informaţii noi se poate realiza
prin diverse tehnici cum sunt: reţele neuronale, arbori de decizie, algoritmi
genetici, analiza cluster-ilor, raţionament bazat pe cazuri, analiza legăturilor etc.
Alături de aceste tehnici se pot folosi şi tehnici de analiză statistică, cum sunt
tehnicile de regresie sau analiza factorială.
Clasificarea are ca scop plasarea obiectelor prelucrate într-un grup
limitat de clase predefinite. De exemplu, vânzarea unui produs nou se poate
încadra într-una din urmatoarele categorii de risc: scazut, mediu, ridicat.
Grupurile obţinute prin clasificare vor fi reprezentate sub formă de înregistrări
care, la rândul lor, sunt compuse din atribute sau câmpuri.
59
Teste de verificare
1. Surse de date
Rezumat
60
realizarea operaţiei de extragere a cunoştinţelor (mining), prin realizarea
unor operaţii rezumative şi/sau de agregare (de unificare);
5. “mineritul datelor” (data mining): proces în care se realizează extragerea
unor modele de date, aplicând asupra datelor rezultate din parcurgerea
etapelor anterioare, metode inteligente, denumite generic metode de tip
Data Mining; acest proces este esenţial pentru descoperirea de cunoştinţe
utile, “ascunse” în sursele de date de mari dimensiuni;
6. evaluarea modelelor (pattern evaluation): proces prin care se realizează
evaluarea modelelor de date extrase, pentru identificarea celor care
reprezintă cunoştinţele care interesează în mod real;
7. prezentarea cunoştinţelor (knowledge presentation): proces prin care
cunoştinţele nou obţinute sunt prezentate utilizatorilor lor, prin folosirea
unor tehnici adecvate de vizualizare şi de reprezentare.
Bibliografie
61
Răspunsuri la teste de autoevaluare
63
Unitatea 11- Data mining: metode şi tehnici de data mining
Obiective
După parcurgerea acestei unităţi studentul:
64
(comportamente individuale). De exemplu, planificarea acţiunilor de marketing
poate constitui o problemă de natură predictivă19, în timp ce detectarea fraudelor
bancare produse cu carduri reprezintă o problemă de natură descriptivă.
Alaturi de volumele mari de date, memorate pe suporturi de stocare
moderne, mai există doi factori care au condus la apariţia tehnologiei data
mining: creşterea capacităţii de stocare a datelor şi a capacităţii fizice de
prelucrare a calculatoarelor electronice, precum şi existenţa şi perfecţionarea
algoritmilor şi a produselor-program dedicate, factori care au permis realizarea
unor analize complexe pe volume mari de date.
Depozitele de date pot fi surse pentru aplicaţiile de tip data mining, iar
rezultatele obţinute pot completa informaţiile din aceste depozite de date,
informaţii care pot fi valorificate ulterior prin tehnicile de analiză
multidimensională, specifice proceselor OLAP.
Cu ajutorul tehnicilor data mining, orice proces sau fenomen reflectat în
baze de date, respectiv în depozite de date, constituie o temă de analiză şi
raportare în cadrul unei platforme dedicate pentru cercetarea afacerilor, BI
(Business Intelligence), sugestiv tradusă în unele lucrări româneşti sub
denumirea de „inteligenţa afacerilor”.
Spre deosebire de tehnicile OLAP, care utilizează interogări şi raportări
standard (care sunt clienţii cei mai valoroşi, care sunt produsele care s-au vândut
cel mai mult sau care sunt zonele cu costurile cele mai ridicate), tehnicile data
mining explorează volumele foarte mari de date eterogene cu scopul de a
înţelege şi de a dezvolta noi abordări asupra problemelor care trebuie rezolvate.
Instrumentele tradiţionale de cercetare a afacerilor (rapoarte, interogări şi
raportări interactive) permit sintetizarea a ceea ce s-a întâmplat în trecut, aspecte
reflectate de datele istorice ale companiei şi de unele date curente. Prin
tehnologia OLAP se pot obţine analize complexe asupra unor tendinţe ale
fenomenelor economice, bazate în special pe rezumate, comparări, analize şi
previziuni ce au la bază valori medii, sume şi grupări de date prin agregare. Cu
ajutorul tehnologiei data mining se adânceşte explorarea surselor de date, prin
descoperirea informaţiei ascunse, cu ajutorul şabloanelor (patterns), a factorilor
de influenţă, a clusterilor, a profilelor şi a predicţiilor aplicate unui volumului
mare de date.
19
Zaharie D, Albescu F, colectiv – Opera citata
65
Un exemplu pentru cele afirmate mai sus este următorul caz : analizând
profilurilor celor mai buni clienţi actuali ai unei firme prin tehnolgii data mining
se pot construi modele şi aplicaţii integratoare, destinate identificării clienţilor
care au cel mai mari potenţial de a deveni performanţi în viitor, chiar dacă, în
prezent, nu se încadrează în categoria celor mai buni clienţi ai firmei.
Utilizarea tehnologiilor data mining se realizează într-un ciclu care
cuprinde patru etape3:
1. identificarea oportunităţii comerciale şi definirea
datelor pe care se va face exploatarea;
2. obţinerea de informaţii şi cunoştinte din colecţiile de
date existente, cu ajutorul tehnicilor data mining;
3. adoptarea deciziilor şi efectuarea acţiunilor necesare,
în urma informaţiilor rezultate prin analizele de tip data
mining;
4.cuantificarea rezultatelor concrete obţinute, pentru a
putea identifica şi alte direcţii de exploatare a datelor.
Test de autoevaluare nr. 1
Diferenta tehnici OLAP si tehnici data mining
66
eterogene se foloseşte ideea de informaţie ascunsă în sensul că, prin interogări
clasice, este aproape imposibilă detectarea corelaţiilor sau a raporturilor pe care
datele le încorporează în mod intrinsec. Rezultatele obţinute prin data mining
sunt cu atât mai relevante, cu cât volumul de date pe care se bazează analiza este
mai mare.
Exploatarea datelor în scopul obţinerii de informaţii noi se poate
realiza prin diverse tehnici cum sunt: reţele neuronale, arbori de decizie,
algoritmi genetici, analiza cluster-ilor, raţionament bazat pe cazuri, analiza
legăturilor etc. Alături de aceste tehnici se pot folosi şi tehnici de analiză
statistică, cum sunt tehnicile de regresie sau analiza factorială.
Clasificarea are ca scop plasarea obiectelor prelucrate într-un grup
limitat de clase predefinite. De exemplu, vânzarea unui produs nou se poate
încadra într-una din urmatoarele categorii de risc: scazut, mediu, ridicat.
Grupurile obţinute prin clasificare vor fi reprezentate sub formă de înregistrări
care, la rândul lor, sunt compuse din atribute sau câmpuri. Ca tehnici de data
mining pentru clasificare se pot menţiona arborii de decizie, reţelele neuronale
şi raţionamentul bazat pe cazuri.
Estimarea este procesul de prelucrare prin care se va atribui o valoare
unei variabile pe baza celorlalte date de intrare. Rezultatele obţinute în urma unei
estimării sunt valori continue. Pentru acest tip de prelucrări se pot utiliza metode
specifice reţelelor neuronale.
Predicţia este procesul prin care se pot clasa înregistrările analizate, în
funcţie de un anumit comportament sau de o valoare viitoare estimată. Pentru
aceasta se va recurge la o colecţie de exemple care prezintă date din trecut şi în
care valorile variabilei de previzionat sunt deja cunoscute. Cu ajutorul acestor
date se va construi un model prin care se va putea explica comportamentul
observat. Aplicând acest model înregistrarilor care fac obiectul prelucrării, se va
putea obţine o predicţie a comportamentului sau a valorilor acestora în viitor.
Gruparea (cluster-izarea) este procesul care conduce la determinarea
acelor obiecte care apar cel mai fecvent împreună (spunem că formează
clustere). Un exemplu pentru aceasta este “analiza coşului gospodăriei” în
evaluările statistice. Analiza grupului urmăreşte o divizare a populaţiei eterogene
în grupuri mai omogene, care poartă numele de clustere. În aceasta tehnică nu se
pleacă de la un set predeterminat de clase şi nici nu se ţine seama de exemple din
67
trecut aşa cum se procedează la clasificare. Segmentarea pe grupuri se face
excluziv în funcţie de similitudinile obiectelor care compun mulţimea analizată.
Test de autoevaluare nr. 3
Ce este predictia?
68
Test de autoevaluare nr. 4
Importanţa tehnicilor OLAP (exemple)
69
care are ca rezultat un model al tendinţelor de evoluţie a datelor si
a proceselor anaizate.
De cele mai multe ori, utilizatorii nu ştiu ce modele de date prezintă interes
pentru ei şi doresc sa extragă mai multe categorii diferite de modele din datele
stocate în depozitele de date aflate la dispoziţia lor. De aceea, este important ca
un sistem tip data mining să poată căuta prin categorii variate de modele de
date, pentru a răspunde cerinţelor diverselor aplicaţii ş/sau aşteptărilor unor
utilizatori diferiti. Este important ca un sistem tip data mining să permită
extragerea de modele de date aflate pe diferite nivele de abstractizare, nivele
corespunzătoare nivelelor de detaliu solicitate de utilizatori. De asemenea, este
important ca un sistem de tip data mining să accepte sugestiile utilizatorilor
pentru a direcţiona căutările către modelele de date care îi interesează pe
aceştia.
Teste de verificare
1. Funcţii data-mining
Rezumat
Tehnologia pentru exploatarea depozitelor de date include integrarea
datelor şi procesarea analitică on-line a acestora (OLAP), precum şi posibilitatea
de vizualizare a datelor şi informaţiilor existente în deposit.
Prin tehnologia data mining se prelucrează date ce se referă la perioade
anterioare (date istorice) din viaţa organizaţiei economice, date care sunt
examinate şi analizate, pe baza lor constituindu-se un model sau un şablon.
Acest model sau şablon va putea fi aplicat situaţiilor noi, de acelaşi tip cu cele
deja cunoscute.
Informaţiile obţinute prin aplicarea tehnicilor de tip data mining pot fi de
natură predictivă, care se referă la descoperirea comportamentelor viitoare, sau
de natură descriptivă, care se ocupă de caracterizarea generală a datelor
(comportamente individuale).
Cu ajutorul tehnicilor data mining, orice proces sau fenomen reflectat în
baze de date, respectiv în depozite de date, constituie o temă de analiză şi
raportare în cadrul unei platforme dedicate pentru cercetarea afacerilor, BI
70
(Business Intelligence), sugestiv tradusă în unele lucrări româneşti sub
denumirea de „inteligenţa afacerilor”.
Tehnicile de data mining se pot aplica atât ascendent cât şi descendent.
Prin abordarea ascendentă se urmăreşte extragerea de cunoştinţe sau
informaţii noi din datele disponibile, această căutare putând fi realizată dirijat
sau nedirijat. Prin căutarea dirijată se analizează un atribut sau un câmp,
încercând explicarea valorilor acestuia prin intermediul valorilor celelalte
atribute, respectiv câmpuri. Căutarea nedirijată urmăreşte identificarea relaţiilor
sau a structurilor existente în ansamblul datelor examinate, fără a acorda
prioritate unui anumit câmp sau altuia.
Spre deosebire de tehnicile OLAP, care utilizează interogări şi raportări
standard (care sunt clienţii cei mai valoroşi, care sunt produsele care s-au vândut
cel mai mult sau care sunt zonele cu costurile cele mai ridicate), tehnicile data
mining explorează volumele foarte mari de date eterogene cu scopul de a
înţelege şi de a dezvolta noi abordări asupra problemelor care trebuie rezolvate.
Bibliografie
1. Zaharie D, Albescu F, colectiv, Sisteme informatice pentru asistarea
deciziei, Editura Dual Tech, Bucureşti, 2001.
71
2. Utilizarea tehnologiilor data mining se realizează într-un ciclu care cuprinde
patru etape:
1. identificarea oportunităţii comerciale şi definirea datelor pe care
se va face exploatarea;
2. obţinerea de informaţii şi cunoştinte din colecţiile de date
existente, cu ajutorul tehnicilor data mining;
3. adoptarea deciziilor şi efectuarea acţiunilor necesare, în urma
informaţiilor rezultate prin analizele de tip data mining;
4. cuantificarea rezultatelor concrete obţinute, pentru a putea
identifica şi alte direcţii de exploatare a datelor.
3.Predicţia este procesul prin care se pot clasa înregistrările analizate, în funcţie
de un anumit comportament sau de o valoare viitoare estimată. Pentru aceasta se
va recurge la o colecţie de exemple care prezintă date din trecut şi în care
valorile variabilei de previzionat sunt deja cunoscute. Cu ajutorul acestor date se
va construi un model prin care se va putea explica comportamentul observat.
Aplicând acest model înregistrarilor care fac obiectul prelucrării, se va putea
obţine o predicţie a comportamentului sau a valorilor acestora în viitor.
72
Bibliografie
73
13. Tănăsescu, A., The Role of Multidimensional Databases in Modern
Organizations, Economic Insights – Trends and Challenges, Vol. IV
(LXVII), No. 2/2015, pg. 95-102, ISSN 2284-8576.
14. Teodorescu Ana-Maria, Information, the Resource of the New Economy,
Annals Economic Science Series. Timisoara, XXI, 2015/I.S.S.N. 1582 –
6333, p.409-413
15. Turban, E., Aronson, J., Liang, T.-P., Sharda, R., Decision Support and
Business Intelligence Systems, Prentice Hall Publishing, 2010.
16. Zaharie D, Albescu F, colectiv, Sisteme informatice pentru asistarea
deciziei, Editura Dual Tech, Bucureşti, 2001.
17. Zenovic Gherasim, Sisteme informatice pentru asistarea deciziei,
https://se-b.spiruharet.ro/images/secretariat/2017-
2018/programe_licenta/cig/sinteze/an_3_sem_2/sinteza_siad.pdf
74