Sunteți pe pagina 1din 45

Suport de curs ID

Conf. Dr. Radu Bucea-Manea-Tonis

1
Cuprins:

Unitatea de învățare 1................................................................................................................................................................... 4


Date, informații, cunoștințe .......................................................................................................................................................... 4
Direcții de abordare ................................................................................................................................................................. 4
Clasificarea datelor: ................................................................................................................................................................. 5
Piramidă informațională .......................................................................................................................................................... 5
Fluxurile informaționale .......................................................................................................................................................... 5
Un sistem................................................................................................................................................................................. 6
Întrebări pentru autoevaluare ................................................................................................................................................... 7
Unitatea de învățare 2................................................................................................................................................................... 8
Sistemul Informațional, Sistem informatic................................................................................................................................... 8
Un sistem informațional .......................................................................................................................................................... 8
Sistemul informatic.................................................................................................................................................................. 8
Întrebări pentru autoevaluare ................................................................................................................................................. 10
Unitatea de învățare 3................................................................................................................................................................. 11
Sistemul informatic pentru asistarea deciziei ............................................................................................................................. 11
Procesul decizional ................................................................................................................................................................ 11
Componentele SIAD ............................................................................................................................................................. 11
Pregătirea datelor................................................................................................................................................................... 11
Magaziile de date operaționale .............................................................................................................................................. 12
Depozitele de date ................................................................................................................................................................. 12
Piețele de date ........................................................................................................................................................................ 12
Caracteristicile depozitelor .................................................................................................................................................... 12
Proiectarea logica a depozitelor de date ................................................................................................................................ 12
Proiectarea fizica a depozitelor de date ................................................................................................................................. 12
Arhitectura depozitelor de date.............................................................................................................................................. 13
Schemele dimensionale ......................................................................................................................................................... 14
Întrebări pentru autoevaluare ................................................................................................................................................. 15
Unitatea de învățare 4................................................................................................................................................................. 16
Data Mining................................................................................................................................................................................ 16
Data mining ........................................................................................................................................................................... 16
Tehnicile data mining ............................................................................................................................................................ 16
Domeniile de activitate .......................................................................................................................................................... 16
Operațiile de data mining ...................................................................................................................................................... 16
Clasificarea ............................................................................................................................................................................ 16
Estimarea ............................................................................................................................................................................... 17
Prognoza ................................................................................................................................................................................ 17

2
Clustering .............................................................................................................................................................................. 17
Descrierea .............................................................................................................................................................................. 17
Arborii de decizie .................................................................................................................................................................. 18
Metoda K-Nearest Neighbor ................................................................................................................................................. 19
Lanțuri Markov...................................................................................................................................................................... 20
Clasificarea Bayesiana........................................................................................................................................................... 21
Întrebări pentru autoevaluare ................................................................................................................................................. 24
Unitatea de învățare 5................................................................................................................................................................. 25
Prelucrarea analitica online ........................................................................................................................................................ 25
Prelucrarea analitica online ................................................................................................................................................... 25
Caracteristicile unui sistem multidimensional ....................................................................................................................... 25
Clasificarea și compararea instrumentelor OLAP ................................................................................................................. 25
Operații realizate asupra modelului multidimensional .......................................................................................................... 26
Studiu de caz ......................................................................................................................................................................... 26
Întrebări pentru autoevaluare ................................................................................................................................................. 29
Unitatea de învățare 6................................................................................................................................................................. 30
Analiza și proiectarea Sistemelor informatice pentru asistarea deciziei .................................................................................... 30
Modelarea datelor .................................................................................................................................................................. 30
Procesul de normalizare .................................................................................................................................................... 30
Modelarea semantica ........................................................................................................................................................ 30
Modelarea orientata-obiect ............................................................................................................................................... 32
Concepte de bază ale modelarii prelucrărilor ........................................................................................................................ 33
Procesul ............................................................................................................................................................................ 33
Operația ............................................................................................................................................................................ 33
Tipul de operație ............................................................................................................................................................... 33
Regula de emisie............................................................................................................................................................... 34
Evenimentul...................................................................................................................................................................... 34
Sincronizarea .................................................................................................................................................................... 34
Dinamica modelului conceptual al prelucrărilor............................................................................................................... 34
Întrebări pentru autoevaluare ................................................................................................................................................. 35
Unitatea de învățare 7................................................................................................................................................................. 36
Dezvoltarea și testarea Sistemelor Informatice pentru Asistarea Deciziei ................................................................................. 36
Universal Modeling Language .............................................................................................................................................. 36
Diagrama cazurilor de utilizare ........................................................................................................................................ 36
Metode de Testare ................................................................................................................................................................. 39
Întrebări de autoevaluare ....................................................................................................................................................... 40
Teste de evaluare ........................................................................................................................................................................ 40
Bibliografie................................................................................................................................................................................. 40

3
Unitatea de învățare 1
Date, informații, cunoștințe

Concepte specifice unității de învățare

- Abordarea sistemica a firmei;


- Piramida informațională;
- Relația întreprinderii cu mediul exterior;
- Etapele procesului prelucrării automate a datelor;
- Fluxurile de resurse și fluxurile de documente generate de sistemul economic.

Datele sunt fapte brute, neprelucrate despre evenimente care nu au semnificație în sistem și nu sunt
organizate. Datele pot fi totuși organizate într-o manieră în care pot fi utile sau pot primi semnificație
pentru sistem. Când datele se organizează astfel încât să aibă semnificație pentru sistem ele devin
informație. Rafinarea datelor și informațiilor de-a lungul timpului formează un ansamblu numit
cunoștințe.

Direcții de abordare
• în general: semne care circulă pe diferite canale între elementele lumii reale, cu forme specifice de
receptare la nivelul materiei vii;
• în particular: când receptorul este omul, în cadrul procesului de cunoaștere

Caracteristici definitorii
• semn cu semnificație, prin existenta unui limbaj cunoscut de către receptor;
• noutate, prin completarea tezaurului de cunoștințe al receptorului;
• utilitate, prin receptarea în timp util, în contextul dorit.

Cunoștința: informația caracterizată de utilitate și importantă pentru receptorul uman

Tezaur de cunoștințe Proces de informare Redundanță

Cantitate de informație → formula lui Shannon

- C este capacitatea canalului în biți pe secundă, o limită superioară teoretică a ratei de transfer
net (rata de informare, uneori indicată I), excluzând codurile de corectare a erorilor;
- B este lățimea de bandă a canalului în hertzi (lățimea benzii în cazul unui semnal de bandă);
- S este puterea semnalului mediu recepționat pe lățimea de bandă măsurată în wați (sau volți
pătrat);
- N este puterea medie a zgomotului și a interferenței pe lățimea de bandă, măsurată în wați
(sau volți pătrat);

4
- S / N este raportul semnal-zgomot (SNR) sau raportul purtător-zgomot (CNR) al semnalului
de comunicație la zgomotul și interferența la receptor exprimat ca un raport de putere liniar.

Data: mod concret de reprezentare a informației pentru un anumit procesor (om, calculator, algoritm,
program etc.)

Parametrii de definire a unei date:


• identificator
• valoare
• atribute

Clasificarea datelor:
• După natură:
- numerice: naturale, întregi, reale, complexe;
- alfabetice
- alfanumerice
- logice

• După numărul de valori în timpul execuției programului:


- variabile
- constante propriu-zise (literali)
- constante simbolice

• După numărul de valori memorate concomitent:


- elementare (scalare)
- structurate (structuri de date)

Piramidă informațională reflectă modul în care datele, informațiile și cunoștințele colaborează într-
un proces permanent, în care datele pot fi folosite pentru a obține informații și cunoștințe, iar
cunoștințele, la rândul lor, pot fi folosite pentru a obține informații și date.

Fig.1.1. Piramidă informațională

Fluxurile informaționale reprezintă totalitatea informațiilor care se vehiculează între emițătorul de


informație și receptor.

5
Conceptul de tehnologie a informației (TI) se referă la totalitatea componentelor software și hardware
folosite în sistemele informaționale computerizate.

Un sistem este o entitate compusă din pârți organizate și care interacționează pentru o funcționare cât
mai eficientă. Subsistemele sunt pârți componente ale sistemului. De exemplu, Facultatea de Științe
Economice este un subsistem al sistemului Universitatea Hyperion.

Lucrările în domeniul sistemicii au condus la definirea unui model care promovează viziunea
sistemică asupra întreprinderii pe care o consideră formată din următoarele trei subsisteme:

Fig.1.2. Rolul SIAD în viziunea sistemica a întreprinderii

• Subsistemul decizional valorifică informațiile oferite de subsistemul informațional în fundamentarea


deciziilor.
• Subsistemul informațional joacă un dublu rol: pe de o parte asigură toate informațiile necesare
luării deciziilor pe toate nivelurile de responsabilitate, conducere și control iar pe de altă parte asigură
căile de comunicare între celelalte subsisteme, deoarece deciziile formulate de subsistemul de
conducere sunt transmise factorilor de execuție prin subsistemul informațional (flux descendent).
• Subsistemul operativ (în cadrul căruia se desfășoară procesele economice specifice domeniului de
activitate a agentului economic) are loc culegerea datelor care apoi sunt transmise subsistemului
informațional (flux ascendent) în vederea stocării și prelucrării datelor necesare obținerii informațiilor
utilizate în fundamentarea deciziilor la nivelul subsistemului decizional (de conducere).

6
Fig. 1.3. Informația și nivelele de management

În figura 1.4 intrările se constituie din date sau informații (care se preiau din documentele
justificative), care sunt procesate obținând-se informații pentru planificare, luarea deciziilor și control.
Documentele contabile se clasifică în funcție de rolul lor și de modul de întocmire în: documente
justificative (de evidentă primară), registrele contabile (evidentă contabilă) și situațiile financiare
(documente de sinteză și raportare).

Fig. 1.4. Fazele distincte ale funcționării unui sistem

Informațiile contabile trebuie să îndeplinească următoarele caracteristici:


• inteligibilitatea (informațiile pot fi ușor de înțeles și de interpretat);
• relevanța (sublinierea aspectelor care pot influenta luarea deciziilor);
• credibilitatea (informațiile nu conțin erori semnificative, nu sunt tendențioase, nici părtinitoare);
• comparabilitatea (informațiile să poată fi comparate prin elemente comune și de aceeași
semnificație).

Întrebări pentru autoevaluare


1. Definiți conceptele de informație, cunoștință și dată.
2. Cum se efectuează schimbul de resurse între un organism economic și exteriorul său sau între
componentele aceluiași organism economic?
3. Dați exemple de fluxuri informaționale.

7
Unitatea de învățare 2
Sistemul Informațional, Sistem informatic

Concepte specifice unității de învățare:

- Etapele funcționarii unui sistem


- Arhitectura sistemului informatic
- Sistemul informațional al întreprinderii: definiții, structură și domenii de activitate
- Sistemul informatic al întreprinderii: definiții, structură și domeniile de activitate

Un sistem informațional se compune dintr-o mulțime de subsisteme intercorelate care lucrează


împreună pentru colectarea, prelucrarea, stocarea, transformarea și distribuirea informației pentru
planificare, luarea deciziilor și control.

Sistemul informațional comunică cu mediul său extern prin fluxuri informaționale (de exemplu
rapoartele pentru acționari), iar în interiorul său, subsistemele comunică între ele prin alte fluxuri
informaționale.

Sistemele informaționale prelucrează datele și/sau informațiile (sortare, organizare, calcule specifice)
obținând informații care sunt structurate în funcție de cerințele utilizatorilor informației.

Sistemul informatic reprezintă o parte a sistemului informațional care permite realizarea operațiilor
de culegere, transmitere, stocare, prelucrare a datelor și difuzare a informațiilor astfel obținute prin
utilizarea mijloacelor tehnologiei informației (TI) și a personalului specializat în prelucrarea automată
a datelor.

Sistemul informatic cuprinde:


• ansamblul informațiilor interne și externe, formale sau informale utilizate în cadrul firmei precum și
datele care au stat la baza obținerii lor;
• software-ul necesar procesării datelor și difuzării informațiilor în cadrul organizației;
• procedurile și tehnicile de obținere (pe baza datelor primare) și de difuzare a informațiilor;
• platforma hardware necesară prelucrării datelor și disipării informațiilor;

8
Fig. 2.1 Subsisteme informaționale organizate în funcție de activitățile din cadrul unei unități
economice

După aria de cuprindere, subsistemele informatice acoperă arii distincte, definite pe criterii
funcționale în cadrul organizației:
o Subsistemul contabilității
o Subsistemul producției
o Subsistemul cercetării
o Subsistemul comercial
o Subsistemul resurselor umane

Fig.2.2. Tipuri de sisteme informatice și utilizatorii acestora, după [Stanciu,2005]

După nivelele de decizie , [Ivancenco,] împarte tehnologiile suport astfel:

9
Întrebări pentru autoevaluare
1. Definiți sistemul informațional și arătați care este relația lui cu celelalte componente ale sistemului
economic.
2. Definiți sistemul informatic și precizați locul lui în cadrul sistemului economic.
3. Ce este structura sistemului informatic?
4. Descrieți componentele structurale ale sistemului informatic și arătați care este relația dintre ele.

10
Unitatea de învățare 3
Sistemul informatic pentru asistarea deciziei

Concepte specifice unității de învățare:

- Procesul decizional;
- Componentele SIAD;
- Depozitele de date;
- Caracteristicile depozitelor de date.

Procesul decizional, după H.Simon, presupune parcurgerea mai multor etape distincte:

- formularea sau identificarea problemei care trebuie rezolvata de procesul decizional;

- realizarea unui model de adoptare a deciziei, testare si validarea sa;

- decizia permite decidentului sa aleagă o acțiune din mai multe posibile in funcție de modelul
decizional ales si de criteriul de selecție stabilit;

- implementarea presupune declanșarea propriu-zisa a acțiunii alese.

Conform [Stanciu, 2002], sistemele informatice pot fi grupate în funcție de natura activităților
susținute astfel:

• Sisteme destinate conducerii (MSS - Management Support Systems) care cuprind:


• Sisteme destinate conducerii curente (MIS – Management Information Systems)
• Sisteme suport de decizie (DSS – Decision Support Systems)
• Sisteme informatice ale executivului (EIS – Executive Information Systems)

[Ivancenco,] definește SIAD ca fiind „destinat asistării decidenților în rezolvarea unor probleme, prin
îmbinarea judecații umane cu procesarea automata a informațiilor, în scopul ameliorării calității
procesului decizional.” În opinia aceluiași autor, aceste sa diferențiază de alte sisteme informatice
după modul de utilizare, soluțiile oferite, performante, utilizatori și modelele folosite.
Componentele SIAD sunt următoarele:

1. Depozitul de date;
2. Baza de modele statistice și matematice;
3. Instrumente de raportare și data-mining;

Pregătirea datelor cuprinde următoarele etape:

1. Extragerea este procesul de captare a datelor din bazele de date operaționale și din alte surse;
poate interfera cu operațiile critice ale sistemului prin folosirea intensiva a metodelor de intrare/ieșire;
2. Curățarea vizează completarea valorilor lipsa, corectarea erorilor la introducerea datelor,
schimbarea formatului în care sunt salvate datele;
3. Transformarea și unificarea presupun divizarea și/sau combinarea înregistrărilor sursa,
„sincronizarea timpului”, samd.;

11
4. Încărcarea presupune realizarea mai multor etape:
a. Mutarea datelor;
b. Verificarea integrității;
c. Construirea indexurilor;

5. Reîmprospătarea presupune de regula o încărcare parțiala realizata periodic în scopul


menținerii „la zi” a datelor; se realizează în doua moduri:

o Sincrona → declanșatoare(triggers)
o Asincrona → administrarea copiilor

Magaziile de date operaționale reprezintă colecții de date orientate către subiect, integrate,
actualizabile, curente sau aproape curente.

Depozitele de date reprezintă un sistem de baze de date specializat, orientat spre subiect, integrat,
nevolatil, dependent de timp pentru susținerea deciziilor manageriale.

Piețele de date reprezintă depozite de date specializate, orientate pe subiect, integrate, volatile și
dependente de timp.

Caracteristicile depozitelor de date vizează următoarele aspecte:

▪ Coloanele tind sa fie utilizate în combinații;


▪ Datele nu sunt actualizate ulterior;
▪ Cheile cuprind o componenta temporala;
▪ Baza de date tinde sa fie foarte mare – redundanta controlata – și puternic indexata;
▪ Prelucrarea prin extragere – copierea datelor din mediul operațional în alt mediu în vederea
prelucrării;
▪ Proiectarea pentru performanta.

Proiectarea logica a depozitelor de date pune accent pe corectitudinea relaționala astfel încât:

- Coloane compuse → mai puține dependente


- Integritatea datelor este verificata numai la încărcare → constrângeri de integritate mai puține
- Se aplica mărci de timp tuturor datelor → chei temporale

Proiectarea fizica a depozitelor de date vizează mai ales eficienta stocării și performanta:

▪ Partiționarea – pe orizontala/verticala - pe domenii


▪ Indexarea – tipuri de indecși:
▪ De tip arbore B → sortare binara
▪ Bitmap → acces direct la valorile unei col.
▪ De dispersare → anumite rânduri
▪ De uniune → Cluster
▪ Boolene/Funcționale

12
▪ Redundanta controlata: vederi materializate și/sau coloane calculate

Arhitectura depozitelor de date


Structura modelului conține în principal obiectele referitoare la tabele de fapte cu atributele de tip
masuri sau metrici, tabelele de tip dimensiune în care regăsim nivele ierarhice, atribute de descriere,
etc. Aceste obiecte vor fi prezentate în continuare.

• Dimensiunile – reprezintă structuri compuse atribute structurate pe diverse niveluri ierarhice


în funcție de care sunt grupate datele. Aceste atribute sunt de obicei descriptive și sunt
folosite ca sursa pentru restricții și pentru rândurile din rapoarte. Sunt considerate tabele
secundare datorita dimensiunilor reduse. În cadrul dimensiunilor se regăsesc și conceptele de
ierarhie, nivel, atribut, concepte care vor fi prezentate în continuare:
o Ierarhiile – sunt structuri logice utilizate pentru ordonarea nivelelor de reprezentare a
datelor. Sunt utilizate și pentru definirea cailor de navigare în interiorul datelor.
Nivelele ierarhice sunt utilizate de instrumentele de analiza OLAP permițând
detalierea graduala a datelor.
o Nivelele – reprezintă poziții în cadrul ierarhiilor. Nivelele se structurează în funcție de
ierarhie de la general la specific, rădăcina fiind reprezentata de nivelul superior, cel
mai înalt al ierarhiei. Relațiile intre diferite nivele sunt relații de tipul părinte-copil.
o Atribute – dimensiunile conțin atribute care reprezintă calificative specifice. Orice
atribut se asociază unei singure dimensiuni, iar o dimensiune se poate exprima prin
mai multe atribute.
• Tabelele de fapte – sunt tabelele centrale. Acestea conțin atribute de tip masuri (metrici) și
chei externe către tabelele dimensiuni. Faptele sunt de obicei date numerice care pot fi
însumate și analizate pe diferite nivele.
o Metricile (masurile) corespund atributelor (faptelor) din tabelele de fapte și sunt de
regula de natura numerica (de exemplu: volumul vânzărilor, costurile, stocurile
disponibile). Aceste variabile au sens numai în contextul unor anumite dimensiuni.
Masurile reprezintă valorile centrale care sunt analizate prin cubul de date. Valoarea
măsurii este calculata pentru un punct dat prin agregarea datelor corespondente
perechii respective valoare-dimensiune, diferite pentru punctul dat. Masurile pot fi
organizate în trei categorii bazate pe tipurile de funcții agregate utilizate: distributive,
algebrice, holistice.
▪ Masurile distributive – sunt calculate cu ajutorul unor funcții de agregare
distributive. Presupunem ca datele sunt împărțite în n seturi. Calcularea
funcției pe fiecare partiție determina o valoare agregata.
▪ Masuri algebrice - sunt calculate cu ajutorul unor funcții algebrice cu M
argumente (unde M este un întreg pozitiv), fiecare din ele obținuta prin
aplicarea unei funcții agregate distributive.
▪ Masuri holistice - sunt calculate cu ajutorul unor funcții holistice. O funcție
agregata este holistica, daca aceasta nu este limitata constant pe spațiul de
stocare cerut de deschiderea subagregării. În acest caz nu exista o funcție

13
algebrica având M argumente (unde M este o constanta) care caracterizează
calculul.

Schemele dimensionale se împart în doua mari categorii:

• Stea, de exemplu:

Fig.3.1 Schema dimensionala de tip stea, după http://datawarehouse4u.info/Data-warehouse-schema-


architecture-star-schema.html

• Fulg-de-nea, de exemplu:

14
Fig.3.2 Schema dimensionala fulg-de-nea, după http://datawarehouse4u.info/Data-warehouse-schema-
architecture-snowflake-schema.html

Întrebări pentru autoevaluare


1. Definiți arhitectura depozitelor de date
2. Cate tipuri de scheme dimensionale cunoașteți?
3. Care sunt componentele unui SIAD?
4. Ce înseamnă ETL?.

15
Unitatea de învățare 4
Data Mining

Concepte specifice unității de învățare:

- Operațiile de data mining


- Arbori de decizie
- Cluster-izare

Data mining este analiza automata a datelor, în general a bazelor de date de dimensiuni mari, cu
scopul de a descoperi tendințe, șabloane, tipare netriviale, necunoscute anterior, uneori neașteptate, în
date și care ar putea oferi informații utile.

Tehnicile data mining fac preziceri despre viitoarele comportamente și trend-uri, permițând
afacerilor sa ia decizii bazate pe cunoștințe. Ele pot răspunde unor întrebări ca de exemplu: "Care sunt
clienții firmei care vor răspunde, aproape cu siguranța, noii promoții și de ce?" sau "Unde ar trebui
localizata noua sucursala a băncii?“

Domeniile de activitate în care se pot aplica tehnicile data mining sunt următoarele:
- în știința: astronomie, medicina, biologie;
- în domeniul afacerilor (comercial): managementul relației cu clienții (CRM –customer relationship
management), comerțul on-line, telefonie, sport și entertainment,
marketing, investiții;
- internet: motoare de căutare, text și agenți web.

Operațiile de data mining sunt:

1. Clasificare
2. Estimare
3. Prognoza
4. Clustering
5. Descrierea

Clasificarea consta în construirea unui model care sa poată fi aplicat unor date neclasificate.
Obiectele caracterizate sunt reprezentate de înregistrările unei baze de date sau fișier, iar clasificarea
înseamnă a adaugă o noua coloana (un nou atribut) și a determina pentru fiecare înregistrare care este
clasa căreia ii aparține.

16
Fig.4.1. Procesul clasificarii

Tehnicile data mining folosite pentru clasificare sunt arborii de decizie și tehnicile de tipul cel mai
apropriat vecin.
Estimarea lucrează cu rezultate cu valori continue, tehnicile data mining folosite pentru estimare sunt
regresia și rețele neurale.
Prognoza analizează înregistrările în raport cu o comportare viitoare ori sunt estimate în raport cu o
valoare viitoare, de exemplu prezicerea venitului unei persoane bazând-se pe istoricul activității
personale.
Clustering este operația de segmentare a unei mulțimi eterogene intr-un număr de subgrupuri mai
omogene numite clustere, înregistrările fiind grupate după similarități.
Descrierea tendințelor din baza de date pentru o mai buna înțelegere a proceselor care au dus la
producerea datelor din baza de date utilizează arborii de decizie.

17
Fig.4.2 Arbore de decizie, după https://businessjargons.com/decision-tree-analysis.html

Arborii de decizie implementați folosind algoritmul ID3 de la http://www.cs.waikato.ac.nz./ml/weka


sunt generați în urma parcurgerii următorilor pași:

1. instanțială clasele de atribute (de exemplu cifra de afaceri, salariu, profit net, etc), apelând
constructorul Attribute pentru fiecare din ele;
2. se populează intern setul de date cu înregistrările aferente;
3. este creată o instanță la arborele de decizie ID3; în cadrul constructorului se inițializează cu
zero variabila mEntropySet;
4. sunt apelate alternativ metodele allSamplesPositives/allSamplesNegatives care returnează true
dacă toate rezultatele sunt pozitive/negative;
5. dacă nu sunt toate cazurile pozitive/negative se apelează metoda getMostCommonValue care
returnează valoarea cea mai des întâlnită;
6. sunt numărate cazurile pozitive cu metoda countTotalPositives;
7. se calculează entropia după formula -p+log2p+ - p-log2p-;
8. se apelează metoda getBestAttribute pentru a se determina nodul rădăcină după criteriul
maxGain de câștig de informație;
9. se încarcă arborele de decizie cu valorile obținute;

În cadrul metodei principale (Main) sunt definite clasele de atribute și categoriile definite în interiorul
acestora. Implementarea criteriilor de selecție care permit clasificarea IMM-urilor în
microîntreprinderi, întreprinderi mici sau mijlocii, în cod C#, este prezentată mai jos:

Attribute ca = new Attribute("ca", new string[] {"<200RON","200-1000RON","1000-


5000RON"});
Attribute pn = new Attribute("pn", new string[] { "are_profit", "fără_profit" });
Attribute sal = new Attribute("sal", new string[] { "1-9", "10-49"/*, "50-249"*/ });

18
După stabilirea tipului de IMM pe baza acestor informații, urmează corelarea cu alte date economice
ale companiilor (precum rentabilitatea economică și financiară), testându-se în ce măsură o firmă este
viabilă din punct de vedere economic. Astfel prin acest arbore de decizie se poate stabili care sunt
firmele viabile din punct de vedere economic și care nu sunt viabile.

Metoda K-Nearest Neighbor presupune calcularea distanțelor unei instanțe noi fată de instanțele din
setul de antrenare. Se vor preciza distantele fată de fiecare instanță din set, ponderile influențelor
acestor instanțe (invers proporționale cu pătratul distanțelor) și importanta instanțelor în cazul în care
atributele au ponderi diferite.

Fig.4.3 Aplicarea teoremei lui Pitagora în determinarea distanței dintre puncte

Având în vedere că fiecare instanță aparține unei clase, se prezintă suma valorilor ponderate ca
măsură a apartenenței instanței noi la una din cele două clase [Leon, 2009].
Implementarea metodei k_NearestNeighbor() presupune următoarele etape, după generarea listelor de
coordonate:

1. calcularea distanțelor dintre puncte, folosind teorema lui Pitagora și algoritmul – primul cu
toate celelalte, următorul cu restul punctelor, ş.a.m.d.:

def euclideanDistance(instance1, instance2, length):


distance = 0
for x in range(length):
distance += pow((instance1[x] - instance2[x]), 2)
return math.sqrt(distance)

2. sortarea ascendentă a listei cu distanțele din care s-au eliminat cele calculate redundant după
modelul – de la A la B și de la B la A:

def getNeighbors(trainingSet, testInstance, k):


distances = []

19
length = len(testInstance)-1
for x in range(len(trainingSet)):
dist = euclideanDistance(testInstance, trainingSet[x], length)
distances.append((trainingSet[x], dist))
distances.sort(key=operator.itemgetter(1))
neighbors = []
for x in range(k):
neighbors.append(distances[x][0])
return neighbors

3. afișarea instanțelor în ordine descrescătoare:

def getResponse(neighbors):
classVotes = {}
for x in range(len(neighbors)):
response = neighbors[x][-1]
if response in classVotes:
classVotes[response] += 1
else:
classVotes[response] = 1
sortedVotes = sorted(classVotes.items(), key=operator.itemgetter(1), reverse=True)
return sortedVotes[0][0]

Lanțuri Markov
Se spune că variabilele aleatoare (𝑋𝑛)𝑛∈𝑁formează un lanț Markov dacă pentru orice 𝑛 ∈ 𝑁,
probabilitatea de a ajunge din starea 𝑥𝑛−1 într-una din stările dintr-o mulțime 𝐴𝑛 ∈ 𝑆 nu depinde de
traiectoria evoluției până la 𝑥𝑛−1 , adică:

𝑃(𝑋𝑛 = 𝑥𝑛|𝑋𝑛−1 = 𝑥𝑛−1, … , 𝑋1 = 𝑥1) = 𝑃(𝑋𝑛 = 𝑥𝑛|𝑋𝑛−1 = 𝑥𝑛−1) = 𝑝(𝑥𝑛|𝑥𝑛−1)

unde 𝑝(𝑥𝑛|𝑥𝑛−1) se numește probabilitate de tranziție la pasul n, iar 𝑝0(𝑥) = 𝑃(𝑋0 = 𝑥) se


numește repartiție inițială.

Fie 𝑃 = (𝑝𝑖𝑗)𝑖,𝑗∈𝐼 matricea probabilităților de tranziție, iar 𝑝 = (𝑝𝑖)𝑖∈𝐼 vectorul probabilităților


inițiale ale stărilor, numim 𝜋 vectorul probabilităților limită ale stărilor, iar relația adevărată:

lim 𝑝(𝑛) = 𝜋
𝑛→∞

Studiu de caz

Se afirma ca in tara vrăjitorului din Oz vremea in fiecare zi poate fi descrisa de 3 stări: ploaie,
0.5 0.25 0.25
soare si ninsoare, matricea P a probabilităților de tranziție fiind 𝑃 = ( 0.5 0 0.5 ) si repartitia
0.25 0.25 0.5
initiala p a stărilor fiind 𝑝 = (1/3 1/3 1/3), dupa o zi frumoasa urmează sigur una urata.

La pasul 12, se observa ca p si liniile matricelor probabilităților de trecere si a mediilor


proporțiilor intrărilor tind către vectorul (0.4 0.2 0.4), dar aceasta tranziție se întrezărește de la
pasul 2, vezi figura 1. Rezulta ca lanțul este regulat după vectorul π.

20
Fig.4.4. Lanț Markov implementat in Excel

Clasificarea Bayesiana
Conform [Joita, 2014], fie o baza de date D={e1, e2, …, en} si o mulțime de clase C={c1, c2, …, cm}, a
clasifica înseamnă a găsi o funcție f:D->C astfel încât fiecărui exemplu din baza de date sa ii
corespunda o clasa: f(ei)=cj.

▪ Se presupune ca toate atributele sunt independente unele de altele si la fel de importante


pentru realizarea clasificării.

▪ Se bazează pe regula lui Bayes:

▪ Date o mulțime de evenimente observabile :

X = x1 , x2 ,..., xn

si o mulțime de ipoteze

H = h1 , h2 ,..., hm

presupunând ca o singura ipoteza poate sa apară in același timp atunci probabilitatea ca o ipoteza h
sa fie adevărata dat fiind un eveniment observabil x este:

P(x / h)P(h)
P(h / x) =
P(x)

unde:

P(x) → probabilitatea de apariție a evenimentului x,

P(x/h) → probabilitatea ca data ipoteza h, evenimentul x sa apară.

21
P(h/x) → probabilitate aposteriori,

P(h) → probabilitate apriori.

Studiu de caz

Pentru acordarea unui credit pentru cumpărarea unui produs se cere clienților sa furnizeze informațiile
legate de venitul lunar si indicele de creditare urmând ca instituția care acorda creditul sa decidă daca
un client dat poate beneficia de acest credit.

Tabel 4.1. Baza de date pentru clasificare

Clasa - cu valori posibile

h1= se acorda creditul,

h2 = se acorda creditul dar cu anumite restricții,

h3=nu se acorda creditul.

Interval_venit discretizat

- 1 corespunde intervalului [0, 400)


- 2 corespunde intervalului [400, 2000)
- 3 corespunde intervalului [2000, 4000]
- 4 corespunde intervalului [4000, infinit).

Data de intrare noua:

{Venit = 5200,Credit = Excelent}

Se calculează:

P(hi /{Interval_ venit = 4,Credit = Excelent})

si se alege valoarea cu probabilitatea cea mai mare.

Se calculează:

maxP({Interval_ venit = 4}/ hi )  P({Credit = Excelent}/ hi )  P(hi ) /1  i  3

22
Calculam probabilitățile:

Pentru fiecare atribut:

H h1 h2 h3
Interval_venit

1 0/6=0 0/2=0 1/2

2 2/6 0/2=0 1/2

3 2/6 2/2=1 0/2=0

4 2/6 0/2=0 0/2=0

H h1 h2 h3

Credit

Excelent 3/6=1/2 0/2=0 0/2=0

Bun 3/6=1/2 0/2=0 0/2=0

Nesatisfăcător 0/6=0 2/2=1 2/2=1

P({int_venit=4, Credit=Exc}/h1}=(2/6)*(3/6)*(6/10)

P({int_venit=4, Credit=Exc}/h2}=0

P({int_venit=4, Credit=Exc}/h3}=0

Rezulta ca clasa care se atribuie datei noi este h1.

23
Întrebări pentru autoevaluare
1. Precizați operațiile de data mining.
2. Cum se măsoară entropia în cazul algoritmului ID3
3. Ce înseamnă și cum se măsoară distanta euclidiana?

24
Unitatea de învățare 5
Prelucrarea analitica online

Competențele specifice unității de învățare – în cadrul acestei unități se vor studia:


- trăsăturile specifice suportului deciziei;
-modele de date multidimensionale;
- scheme dimensionale.

Prelucrarea analitica online


Reprezintă procesul interactiv de creare, administrare, analiza datelor și creare de rapoarte. Agregarea
datelor se face după forma unui tablou multidimensional:

Fig.5.1 Secțiuni(dices) intr-un model multidimensional

Caracteristicile unui sistem multidimensional - sunt clasificate în doua categorii: logice, fizice:
Caracteristicile logice sunt independente de platforma hardware utilizata, de sistemul de operare, de
numărul de utilizatori și de metodele de stocare fizica. Dimensiunile, ierarhiile, formulele, legăturile
sunt exemple de atribute logice.
Caracteristicile logice se clasifica în doua subcategorii:
- de baza (fundamentale): structura datelor, operațiile, reprezentările.
- specifice (de aplicație): orientate pe cunoștințe, orientate pe proces.
Caracteristicile fizice sunt independente de modelul multidimensional definit sau analizat și includ
modul cum se stochează și încarcă datele și ce platforme software și hardware se folosesc. Ele se
clasifica în doua categorii:
- interne: modul de stocare/acces, modul de calcul.
- externe: tipul de arhitectura, platforma utilizata.

Clasificarea și compararea instrumentelor OLAP


În funcție de modul de stocare a datelor multidimensionale și de modul de procesare
multidimensionala utilizat.

25
Tabel 5.1. Analiza comparativa a instrumentelor OLAP

Instrumentele din grupele 1, 2 și 3 sunt instrumente ROLAP (relațional OLAP), cele din grupele 4 și 5
instrumente MOLAP (multidimensional OLAP), cele din grupa 6 instrumente desktop OLAP
(DOLAP) iar cele din grupele 2 și 4 instrumente OLAP hibride (HOLAP)

Operații realizate asupra modelului multidimensional


• Navigarea pe nivelele ierarhice (Drill Down și Roll Up) – reprezintă operații de navigare în
cadrul ierarhiilor dimensiunilor, prin agregare pe nivelele superioare sau detaliere pe nivelele
inferioare.
• Rotații – fiecare rotație pune în evidenta o noua perspectiva, aducând în prim plan o structura
bidimensionala, o fațeta (slice). Din acest motiv rotația se mai numește și “data slicing”.
• Secțiuni - reprezintă viziuni sau imagini (views) specifice diverselor categorii de utilizatori,
prin operații de secționare prin care se obțin 'felii' bidimensionale (slices).

Studiu de caz
Se dau entitățile:

Fig.5.2 Schema relaționala BD Furnizori de Componente

Cerințe:

1. Sa se realizeze proiecția după atributele numec, numef și cant.

Rezolvare:
SELECT componente.numec, furnizori.numef, fapte.cant
FROM public.furnizori, public.fapte, public.componente
WHERE furnizori.fid = fapte.fid AND fapte.cid = componente.cid;

26
Fig.5.3. Rezultat proiecție pe coloanele numec, numef și cant

2. Sa se obțină cantitatea totala livrata pe furnizori și componente

Rezolvare:
SELECT `F#`,`C#`,SUM(cant) FROM Fapte GROUP BY `F#`,`C#`

Fig.5.4 Grupare pe doua dimensiuni: F#, C#

3. Sa se obțină cantitatea totala livrata prin ‚rostogolirea’ dimensiunilor Furnizori și


Componente
Rezolvare 1:
SELECT `F#`,`C#`,SUM(cant) FROM Fapte GROUP BY `F#`,`C#` WITH ROLLUP

27
Fig.5.5. Rostogolire pe dimensiunile Furnizori și Componente
Rezolvare 2:
SELECT SUM(fapte.cant), fapte.cid, fapte.fid FROM public.fapte GROUP BY
GROUPING SETS ((fid),(cid),())

Fig.5.6. Rostogolire pe dimensiunile Furnizori și Componente(2)

4. Sa se obțină hypercubul asociat dimensiunilor Furnizori și Componente:

Rezolvare 1:
SELECT SUM(fapte.cant), fapte.cid, fapte.fid FROM public.fapte GROUP BY CUBE
(fid,cid)
Rezolvare 2:
SELECT SUM(fapte.cant), fapte.cid, fapte.fid FROM public.fapte GROUP BY
GROUPING SETS ((fid,cid),(fid),(cid),())

28
Fig. 5.7. Hypercub asociat dimensiunilor Furnizori și Componente

Întrebări pentru autoevaluare


1. Cate tipuri de masuri cunoașteți?
2. Enumerați operațiile care se pot realiza asupra modelului multidimensional;
3. Care sunt caracteristicile logice ale unui sistem multidimensional?

29
Unitatea de învățare 6
Analiza și proiectarea Sistemelor informatice pentru asistarea deciziei

Concepte specifice unității de învățare:

- Modelarea datelor;
- Modelarea prelucrărilor.

Modelarea datelor
Metodele de proiectare au ca scop obținerea unor colecții de date ce respecta atât cerințele
informaționale ale utilizatorului cat și restricțiile impuse de modelul relațional.

Procesul de normalizare se bazează pe primele trei forme normale și presupune parcurgerea


următoarelor etape:
1. Inventarierea atributelor;
2. Specificarea regulilor de gestiune;
3. Întocmirea dicționarului de date:
- Un atribut poate fi înscris o singura data în dicționar;
- Sunt eliminate atributele sinonime;
- Dicționarul nu permite atribute derivate/calculate;
4. Stabilirea dependentelor dintre atribute;
5. Pentru atributele izolate se vor caută grupuri de câmpuri care se pot constitui în determinanți ai
acestora;
6. Toate atributele determinante devin chei candidat;
7. Se stabilesc cheile primare dintre atributele candidate;
8. Cu fiecare cheie primara și atributele determinate direct de aceasta se formează un tabel.
9. Se stabilesc cheile externe

Modelarea semantica
De ce? A crescut nivelul de înțelegere a importantei regulilor de business în activitatea comerciala. Ea
reprezintă activitatea generala care consta în încercarea de a reprezenta semnificația.

Tabel 6.1. Concepte în modelarea semantica

30
Modelul Entitate-Asociere permite modelarea realității prin intermediul unor concepte abstracte:
entități, asocieri, atribute și reprezintă o tehnica de realizare a diagramelor:

Fig.6.1. Formalism în ERD

- Entitățile - “ceva care poate fi identificat ca distinct”


Sunt obișnuite și slabe atunci când existenta unei entități depinde de alta.
- Atributele descriu entitățile
- Simple sau Compuse
- Cheie
- Unice sau Multivalorice
- Lipsa
- De baza sau Derivate
- Corelațiile sunt relații care se stabilesc intre entități
O corelație poate fi totala sau parțiala, iar după gradul de participare la o corelație se împart
în:
• Unu-la-unu;
• Unu-la-mai-mulți;
• Mulți-la-mulți.

Fig.6.2. Formalism în simbolizarea tipurilor de corelații

- Subtipurile se constituie sub forma ierarhiilor de entități, implementate sub forma compunerii sau
specializării(moștenire)

31
Fig.6.3. Exemplu de ierarhie de tipuri

Etapele implementării modelului EA sunt:


- Identificarea conceptelor semantice utile
- Conceperea obiectelor formale
- Conceperea regulilor de integritate
- Conceperea operatorilor formali

Limitele modelului relațional


- Descrierea structurilor de date complexe
- Definirea tipurilor de data utilizator
- Partajarea/reutilizarea structurilor de date
- Datele sunt descrise separat de prelucrări

Modelarea orientata-obiect
Concepte:
Obiect – entitate cu identitate proprie caracterizata prin stare și comportament. Obiectele
comunica intre ele prin intermediul mesajelor
Abstractizare – obiecte cu aceeași stare și comportament sunt grupate în clase
Încapsulare – capacitatea obiectelor de a conține atât date cat și operații, numai în parte
vizibile
Moștenire – toate atributele și metodele vizibile unei clase sunt preluate automate de o clasa
derivate
Polimorfism – posibilitatea unui obiect de a răspunde diferit la primirea aceluiași mesaj.

Caracteristici ale modelul obiect-relațional

- Partajarea datelor
- Utilizarea structurilor de date complexe

Tabel 6.2. Paralele model obiectual-relațional


Model Obiectual Model Relațional

Clasa Tabel(Relație)

Obiect Tuplu(Înregistrare)

32
Atribut Câmp

Operație(Metoda) Nu este cazul

Etapele proiectării
1. Identificarea obiectelor și claselor;
2. Identificarea asocierilor;
3. Identificarea atributelor, restricțiilor din interiorul unei clase și a metodelor specifice fiecărei clase;
4. Validarea modelului obiect.

Reguli de conversie
- O clasa este reprezentata printr-o tabela;
- O asociere se reprezintă prin includerea cheii primare din clasa corespondenta în clasa de referința;
- O clasa asociere conține atributele cheie din clasele asociate;
- Specializări ale unei clase de referința vor conține cheia primara a clasei de baza.

Concepte de bază ale modelarii prelucrărilor


Procesul constituie un subansamblu al unei activități în care punctele de intrare și de ieșire sunt
stabile și independente de particularitățile organizatorice.
Operația este o secvență continuă de acțiuni elementare producătoare de evenimente care se execută
neîntrerupt din momentul declanșării ei de către unul sau mai multe evenimente. Operația determină
întotdeauna producerea unui eveniment / unor evenimente.
Tipul de operație reprezintă o categorie de operații prezentând aceleași caracteristici. Se
caracterizează prin:
• conținutul acțiunilor elementare ce formează operația;
• durată;
• evenimentele produse și condițiile de emisie a acestora.

Grafic, un tip de operație se reprezintă astfel:

Fig.6.4. Tip de operație

33
Regula de emisie
• reprezintă o propoziție logică care dacă se dovedește adevărată va determina producerea unui anumit
eveniment;
• este expresia condițiilor referitoare la contextul în care se va derula operația.

Evenimentul reprezintă o circumstanță (un semnal) adusă la cunoștința sistemului la care acesta
trebuie să răspundă. Grafic tipul de eveniment se reprezintă printr-o elipsă.

Condiții pentru ca un semnal să poată fi considerat eveniment:


• trebuie să se producă CEVA în interiorul sau exteriorul sistemului studiat;
• acest “CEVA” produs trebuie să fie perceput de către sistem;
• acest fapt produs interesează sistemul în măsura în care el poate fi declanșatorul posibil al unei
operații.

Sincronizarea reprezintă un ansamblu de condiții, exprimate prin evenimente contributive și care


determină declanșarea unei operații. Ea este expresia condițiilor ce trebuie să se realizeze pentru ca o
operație să se poată declanșa. Sincronizarea se exprimă printr-o propoziție logică ce trebuie să
respecte două cerințe:
• condițiile exprimate trebuie să privească evenimentele declanșatoare ale operației;
• trebuie să existe situații care să permită declanșarea acestor evenimente.

Dinamica modelului conceptual al prelucrărilor:


• descrie înlănțuirea activităților sistemului analizat;
• reprezintă înlănțuirea activităților printr-un graf;
• nodurile grafului sunt evenimente sau operații reprezentând sincronizări;
• arcele grafului reprezintă legături cronologice între evenimente sau operații;

34
Fig.6.6. Modelul conceptual al prelucrărilor

Întrebări pentru autoevaluare


1. Ce este un proces?
2. Care sunt metodele de proiectare a datelor consacrate?

35
Unitatea de învățare 7
Dezvoltarea și testarea Sistemelor Informatice pentru Asistarea Deciziei

Concepte specifice unității de învățare:

- Diagrame UML;
- Metode de testare.

Universal Modeling Language urmărește o definire uniforma, unanim acceptata a conceptelor


specifice modelarii orientate obiect.

Diagrama cazurilor de utilizare


- Descrie interacțiunile utilizatorilor cu sistemul
- Exista mai multe relații intre cazurile de utilizare:
- Relații de extensie – când un caz de utilizare poate fi extins ca un comportament adițional definit
printr-un alt caz de utilizare
- Relații de incluziune – arata ca o instanța a unui caz de utilizare include și componente specifice
altui caz de utilizare
- Relații de generalizare – când un caz de utilizare B este o specializare a unui caz de utilizare A

Fig. 7.1. Diagrama cazurilor de utilizare

Alte diagrame:
• diagramele de stare completează descrierea obiectelor prin:
• descrierea tuturor stărilor posibile pe care le pot avea obiectele unei clase;
• evidențierea evenimentelor care determină schimbarea stărilor.
Nota: Diagramele de stare se întocmesc pentru clasele care au un număr definit de stări.

36
Fig.7.2. Diagrama de stare

• diagramele de activitate modelează aspectele dinamice ale sistemului informatic și descriu


activitățile care se realizează prin operații pentru care se pot prevedea condiții și decizii reflectând
astfel și rezultatele aplicării acestora (vezi figura 7.3).

Fig.7.3. Diagrama de activitate

37
• diagramele de secvență;

Fig.7.4. Diagrama de secvența

• diagramele de colaborare

Fig. 7.5.Diagrama de colaborare, după https://www.lucidchart.com/pages/uml-communication-


diagram

38
Evaluarea sistemului informatic pentru asistarea deciziei presupune următoarele:
1. performanțele și limitările sistemului:
a. îndeplinirea obiectivelor, funcțiilor, sarcinilor de bază și de exercitare a conducerii;
b. oportunitatea, completitudinea și suficientă informațiilor destinate conducerii;
c. timpul de răspuns al sistemului – intervalul de timp din momentul transmiterii unei cereri
din partea conducerii până la momentul primirii răspunsului trebuie să fie scurt;
d. calitatea și precizia informațiilor obținute;
e. calitatea și siguranța fluxurilor informaționale;
f. posibilitățile de control;
g. timpii optimi privind reacția la apariția unor erori și corecția acestora;
h. gradul de integrare a sistemului informațional în corelație directă cu gradul de automatizare
a prelucrărilor;
2. gradul de pregătire a unității economice pentru implementarea sistemului informatic nou:
a. existenta cunoștințelor și disciplinei tehnologice;
b. posibilitățile de instruire și autoinstruire în ceea ce privește utilizarea computerelor și a
produselor informatice etc.

Desfășurarea unei activități riguroase și performante de proiectare și realizare de sisteme


informatice impune respectarea următoarelor principii:
1. Abordarea globală a problemei de rezolvat;
2. Utilizarea unei metodologii unitare în proiectarea și realizarea sistemului informatic;
3. Aplicarea celor mai moderne soluții și metode de proiectare și realizare a sistemului informatic;
4. Structurarea sistemului informatic ținând seama de structura organizatorică din cadrul firmei.
5. Participarea nemijlocită a viitorului beneficiar la activitățile de analiză, proiectare și implementare a
sistemului informatic. O astfel de participare asigură formularea clară a specificațiilor necesare
proiectării și validarea eșalonată a soluțiilor propuse de proiectant toate acestea asigurând în final un
produs care să corespundă deplin cerințelor utilizatorului;
6. Respectarea cadrului legislativ. Fiind vorba de sisteme informatice de gestiune devine obligatorie
realizarea evidențelor, calcularea indicatorilor și întocmirea lucrărilor de sinteză în conformitate cu
reglementările aflate în vigoare.
7. Realizarea unor sisteme informatice corespunzătoare resurselor disponibile la utilizator;
8. Întrucât prin natura sa software-ul este supus schimbării, această schimbare trebuie anticipată și
controlată;
9. Compromisurile sunt inerente în dezvoltarea de software și ele trebuie explicitate și documentate.

Metode de Testare
Functional testing - Testare de tip black box canalizata pe verificarea cerințelor funcționale ale
aplicației; acest tip de testare trebuie făcut de testeri.
Black box testing - Nu se bazează pe cunoașterea interna a design-ului sau a codului . Testele sunt
bazate pe cerințe și funcționalitate
White box testing - Se bazează pe cunoașterea logicii interne a codului aplicației. Testele sunt bazate
pe acoperirea sintaxei de cod, ramuri, cai, condiții.

39
Întrebări de autoevaluare
1. Enumerați principalele diagrame UML;
2. Care sunt principalele metode de testare?

40
Unitatea de învățare 8
Sisteme Fuzzy pentru Asistarea Deciziei

Concepte specifice unității de învățare:

− Cunoașterea si înțelegerea conceptelor de bază referitoare la logica fuzzy;


− Dezvoltarea deprinderilor și abilităților pentru reprezentarea și modelarea datelor prin mulțimi
fuzzy;
− Dezvoltarea deprinderilor și abilităților pentru analiza, proiectarea, implementarea și testarea
sistemelor cu logică fuzzy/aplicațiilor bazate pe sisteme fuzzy

Mulțimile fuzzy sunt clase de obiecte cu granițe imprecis determinate, in care apartenenta la o clasa este
graduală între 0 (neapartenență totala) si 1 (apartenenta totala).

Raționamentul aproximativ consta din metode care facilitează efectuarea unui raționament utilizând
intrări imprecise (valori aproximative) pentru a obține ieșiri semnificative.

Fig.8.1. Mulțimile fuzzy sunt formate din valori aproximative definite pentru variabila lingvistică
temperatura.

Deoarece logica fuzzy prelucrează informații aproximative (cantitative) într-o maniera sistematica, este
foarte potrivita pentru controlul sistemelor neliniare si modelarea sistemelor complexe.

Relațiile intrare – ieșire sunt descrise prin reguli condiționale de tip if/else, de ex. Dacă temperatura este
scăzută atunci pornește sistemul de încălzire.

Utilizăm logică fuzzy datorita următoarelor motive:


➢ Este ușor de înțeles si utilizat (intuitiva, concepte matematice simple)
➢ Se bazează pe limbajul natural
➢ Poate utiliza cunoștințelor experților (experiența acumulată)
➢ Este flexibilă
➢ Este tolerantă la date imprecise
➢ Poate modela funcții complexe cu nivel ridicat de precizie
➢ Poate fi combinată cu tehnici convenționale de control.

Raționamentul uman poate fi exprimat prin reguli lingvistice de tipul:


❖Daca servirea este slaba si mâncarea este rea atunci bacșișul este mic
41
❖Daca servirea este buna si mâncarea este buna atunci bacșișul este mediu
❖Daca servirea este excelenta si mâncarea este delicioasa atunci bacșișul este mare

Fig.8.2. Structura sistemului cu logica fuzzy

Baza de reguli a sistemului cu logica fuzzy:


1. Daca (servirea este slaba) si (mâncarea este rea) atunci (bacșișul este mic)
2. Daca (servirea este buna) si (mâncarea este buna) atunci (bacșișul este mediu)
3. Daca (servirea este excelenta) si (mâncarea este delicioasa) atunci (bacșișul este mare)
4. Daca (servirea este excelenta) si (mâncarea este rea) atunci (bacșișul este mediu)
5. Daca (servirea este slaba) si (mâncarea este delicioasa) atunci (bacșișul este mediu)

Fig.8.3. Suprafața de răspuns a SLF

In cadrul sistemului fuzzy se operează următoarele calcule:


• Gradul de adevăr (de activare) pentru fiecare regula
• Ieșirea produsa de fiecare regula
• Agregarea ieșirilor parțiale

Studiu de caz

Se dau următoarele seturi de funcții de apartenenta pentru doua variabile x: servirea si y: mâncarea:

42
Sa se determine valoarea bacșișului pentru valorile crisp asociate servirii si mâncării de 1.75, respectiv
3.25:

Fig.8.4. Relația analitica bacșiș(mâncarea, servirea)

Se calculează valoarea funcțiilor de apartenența pentru cele doua variabile, folosind modelul trapezoidal,
respectiv triunghiular:

(1)

(2)
Se obțin valorile:
Tabel 8.1.Valoarea funcțiilor de apartenenta pentru x=1.75
43
μs(x): 0.625

μb(x): 0.25

μe(x): -0.125

Tabel 8.2. Valoarea funcțiilor de apartenenta pentru y=3.25


μ r(y):
-0.125

μb(y): 0.25

μd(y): 0.625

Tabel 8.3. Valoarea ponderilor conjugate aferente funcțiilor de apartenenta

Se calculează valoarea bacșișului după metoda de defuzificare CoS (Center of Sums):

(3)
Se obține X* = 2.5

Dezvoltarea/îmbunătățirea sistemului fuzzy presupune următoarele:


➢ completarea bazei de reguli (adăugarea mai multor reguli) pentru a avea o baza de reguli completa (cate
reguli sunt necesare?)
➢ acoperirea întregului domeniu 0% - 25% pentru variabila de ieșire (de ex. bacșiș)
➢ creșterea rezoluției pentru variabilele de intrare si de ieșire
➢ introducerea de noi variabile de intrare (de ex. ambianta, curățenia, etc.)

Întrebări de autoevaluare
1. De ce folosim logica Fuzzy?
2. Ce presupune dezvoltarea unui sistem Fuzzy?

Teste de evaluare
44
1. Ce desemnează acronimul UML?
2. Enumerați principalele metodologii de dezvoltare;
3. Ce caracteristici trebuie sa îndeplinească depozitele de date?
4. Care sunt operațiile de tip OLAP?
5. Care sunt diagramele UML utilizate în modelarea prelucrărilor?
6. Descrieți un algoritm de data mining la alegere;
7. Enumerați fazele funcționarii unui sistem;
8. Care sunt componentele unui sistem informatic pentru asistarea deciziilor?
9. Care sunt factorii alegerii unui nou sistem informatic pentru asistarea deciziilor?
10. Sunt considerate bune practici în dezvoltarea sistemelor informatice următoarele.

Bibliografie
1. I.Lungu, Gh.Sabau, M.Velicanu, M.Muntean – Sisteme informatice – Analiza, proiectare și
implementare, Ed. Economica, București, 2003
2. V. Stanciu – Proiectarea sistemelor informatice, Ed. Dual Tech, Bucureștii, 2002
3. R. Vasilescu – Sisteme informatice de contabilitate, Ed. Eurostampa, Timișoara, 2008
4. D. Joita – Tehnici de Data mining, Curs pentru învățământul la distanta, Ed. Univ.Titu
Maiorescu, București, 2014
5. C.V. Ivancenco – Note de curs,
http://www.cig.ase.ro/prof/ivancenco/resurse/cig_siad%20cursul%203.php
6. G. Oltean – Sisteme Fuzzy, http://www.bel.utcluj.ro/dce/didactic/sf/

45

S-ar putea să vă placă și