Sunteți pe pagina 1din 110

Business Intelligence

Sisteme informaționale
în organizații
Ionut ANICA-POPA Ph.D.
ionut.anica@ase.ro
Obiective

• Înțelegerea conceptelor: dată, informație, cunoștință, înțelepciune

• Înțelegerea rolului sistemelor informaționale (SI) în cadrul organizațiilor

• Înțelegerea diversității tipurilor de sisteme informaționale (SI) existente în cadrul


organizațiilor

2021 - 2022 Business Intelligence 2


Dată, informație, cunoștință

• „este foarte ușor să se realizeze confuzie între date și cunoștințe sau informație și
tehnologia informației” – Peter Drucker (1995)

• Date - ceea ce componentele sistemelor informaționale creează, stochează și furnizează.


• Informații – date prelucrate prin adăugarea sau crearea de noi semnificații utile.
• Cunoștințele - un conglomerat format din experiențe, valori și informații contextuale care
stau la baza unui cadru ce permite evaluarea și încorporarea de noi experiențe și
informații
• Înțelepciunea - crearea de principii generalizate bazate pe existenta unor cunoștințe din
diferite surse

2021 - 2022 Business Intelligence 3


Informație

• Scopul informației: diminuarea incertitudinii

• Factori pentru aprecierea calității informației:


• Relevanța
• Corectitudinea
• Acuratețea
• Precizia
• Completitudinea
• Sincronizarea în timp
• Utilizabilitatea
• Accesibilitatea
• Consistența
• Conformitatea cu așteptările
• Costul

2021 - 2022 Business Intelligence 4


Cunoștințe tacite vs. cunoștințe explicite

Cunoștințele explicite sunt structurate, pot Cunoștințele tacite nu pot fi codificate și


fi codificate și incluse într-un document este aproape imposibil sa fie incluse într-
sau într-o bază de date, de unde pot fi un document sau într-o bază de date,
extrase cu ușurință. deoarece acestea sunt în interiorul
persoanei care le deține.

Caracteristici: Caracteristici:
• tangibilitatea; • intangibilitatea;
• ușurința observării în timpul utilizării; • imposibilitatea observării în timpul utilizării;
• simplitatea; • complexitatea;
• sunt schematice; • bogăția;
• sunt documentate. • nu sunt documentate.

2021 - 2022 Business Intelligence 5


Cunoștințe tacite vs. cunoștințe explicite

• Socializarea reprezintă procesul prin care se


creează cunoștințe tacite comune prin
Socializare punerea în comun a experiențelor acumulate.

• Exteriorizarea reprezintă procesul prin care


Cunoştinţe
Interiorizare
cunoștințele tacite sunt transformate în
tacite
cunoștințe explicite (concepte și/sau
diagrame) prin utilizarea de metafore sau
analogii.

Exteriorizare
Cunoştinţe • Combinarea reprezintă procesul de asamblare
explicite
al cunoștințelor explicite în scopul obținerii de
cunoștințe sistemice .

• Interiorizarea reprezintă procesul de


Combinare

„întrupare” a cunoștințelor explicite în cele


tacite.

2021 - 2022 Business Intelligence 6


Sisteme informaționale (SI)

• Tipologia SI
• Transaction Processing Systems (TPS): un sistem care permite înregistrarea tranzacțiilor zilnice din
cadrul unei organizații care ofera managerilor operaționali răspunsul la întrebări de rutină și
posibilitatea monitorizării fluxurilor de tranzacții prin organizație.

• Systems for Business Intelligence (SIB)


• Management Information Systems (MIS): oferă middle managers rapoarte despre performanța curentă a
organizației. Aceste informații sunt utilizate pentru a monitoriza și controla afacerea și pentru a estima
performanța viitoare. MIS sumarizează și raportează operațiunile de bază ale companiei folosind datele
furnizate de TPS
• Decision Support Systems (DSS): sunt focalizate pe rezolvare unor probleme ”unice”, ale căror condiții se
schimbă rapid și pentru care, de multe ori, nu există o procedură completă pentru obâinerea unei soluții.
DSS utilizează date furnizate de TPS și MIS, însă pot apela și la surse externe de date (de ex. prețurile
competitorilor)
• Executive Support Systems (ESS): vin în sprijinul managerilor seniori în procesul de adoptare a deciziilor. ESS
prezintă grafice și date din mai multe surse printr-o interfață ușor de utilizat. Adesea, informațiile sunt livrate
printr-un portal, care utilizează o interfață web pentru a prezenta conținut integrat de afaceri personalizat.

2021 - 2022 Business Intelligence 7


Bibliografie

• Ackoff, R. L. (1989). From data to wisdom. Journal of Applied Systems Analysis, 16, 3–9.
• Laudon, K.C., Laudon, J.P. (2019). Management Information Systems: Managing the
Digital Firm (16th edition) – Chapter 2 Global E-business and Collaboration
• Nonaka, I. (1994). A Dynamic Theory of Organizational Knowledge
Creation. Organization Science, 5(1), 14–37. http://www.jstor.org/stable/2635068

2021 - 2022 Business Intelligence 8


Q&A

2021 - 2022 Business Intelligence 9


Business Intelligence

Sisteme de asistare a deciziilor

Ionut ANICA-POPA Ph.D.


ionut.anica@ase.ro
Obiective

• Înțelegerea procesului adoptării deciziei

• Prezentarea conceptului de sistem de asistare a deciziilor (SAD)

• Prezentarea caracteristicilor sistemelor de asistare a deciziilor

• Prezentarea arhitecturii şi componentelor sistemelor de asistare a deciziilor

2021 - 2022 Business Intelligence 2


Decizie

• Reprezintă elementul fundamental al sistemului decizional, cuantificarea nivelului calitativ


al managementului putând fi realizată prin aprecierea metodelor utilizate în
fundamentarea deciziilor adoptate

• „adoptarea deciziei manageriale este sinonimă cu întreg procesul managerial” (Simon,


1977)

2021 - 2022 Business Intelligence 3


Decizie

• selectarea unei modalități de acțiune (Simon; 1960);


• un caz aparte de implicare într-o anumită acțiune (Mintzberg et al.; 1976);
• rezultatul unei prelucrări a informațiilor, având drept finalitate alegerea unui plan de
acțiune (Bonczek et al.; 1984);
• rezultatul unor activități conștiente de alegere a unei variante de acțiune și de angajare în
aceasta, precum și, în majoritatea cazurilor, repartizarea unor resurse (Filip; 2002).

• Decizia constă în alegerea, în mod conștient, a unei variante dintr-un set de posibilități,
urmată, în majoritatea cazurilor, de alocarea resurselor necesare.

2021 - 2022 Business Intelligence 4


Proces decizional

2021 - 2022 Business Intelligence 5


Evaluarea sistemelor informaționale

• Indicatori pentru evaluarea sistemelor informaționale


• Eficacitatea
• gradul de îndeplinire al obiectivelor propuse.
• a face lucrurile care trebuie (doing the right things)

• Eficiența
• gradul de utilizare al resurselor pentru obținerea rezultatelor
• a face lucrurile cum trebuie (doing things right)

• Effectiveness is doing the right thing. Efficiency is doing the thing right. (Peter Drucker)

2021 - 2022 Business Intelligence 6


Mediul de afaceri și sisteme de asistare a deciziei

Factori externi organizației Răspunsurile organizației

• Piața (globalizarea, • Strategii • Analize


metode de marketing Provocări
inovative etc. ) • Răspuns în timp real • Previziuni
• Cerințele clienților • Creșterea
(calitatea ridicată, productivității • Decizii
diversitatea produselor,
loialitate scăzută etc.) Oportunități
• Noi modele de afaceri
• Tehnologia • Colaborarea cu Sisteme de asistare
• Societatea (legislația, partenerii de afaceri a deciziilor
forța de muncă, CSR • etc.
etc.)

2021 - 2022 Business Intelligence 7


Sisteme de asistare a deciziei (SAD)

• “Un set de instrumente, date, modele și alte resurse pe care decidenții le utilizează pentru
a înțelege, evalua și rezolva probleme nestructurate“ (Kroenke, 1992).

• “Un sistem care furnizează informații interactive în scopul sprijinirii decidenților în timpul
procesului adoptării deciziilor“ (O'Brien, 1999).

• SAD reprezintă un sistem informațional care încorporează date și modele, utilizat în


scopul sprijinirii, nu înlocuirii, factorului uman în procesul adoptării deciziei, atunci când
deciziile care urmează să fie luate sunt semistructurate sau nestructurate.

2021 - 2022 Business Intelligence 8


Caracteristicile SAD (I)

• furnizează suport pentru asistarea deciziei în cazul problemelor nestructurate sau


semistructurate;

• sprijinul acordat în adoptarea deciziei este furnizat pentru toate categoriile de decidenți
din cadrul unei organizații;

• scopul este de asistare a decidentului în raționamentele efectuate, nu de înlocuire a


acestuia;

• asistența este furnizată în toate fazele procesului decizional;

• asistă atât decidenții individuali, cât și grupurile de decizie;

2021 - 2022 Business Intelligence 9


Caracteristicile SAD (II)

• sunt flexibile, în sensul realizării cu ușurință, de către utilizator, a adăugării, modificării,


ștergerii etc. a elementelor problemei analizate;

• trebuie să îmbunătățească mai mult eficacitatea decât eficiența procesului decizional;

• decidentul trebuie să aibă controlul în orice etapă a procesului decizional aferent


problemei respective;

• trebuie să furnizeze asistență pentru decizii independente cât și interdependente;

2021 - 2022 Business Intelligence 10


Caracteristicile SAD (III)

• să se bazeze pe modele, date și cunoștințe;

• să poată fi folosit și ca un instrument de învățare de către decidenții mai puțin


experimentați;

• interacțiunea cu utilizatorul să fie ușoară, rapidă și eficientă;

• să dispună de facilități sporite de modelare și analiză;

• să asiste decidentul indiferent de stilul care trebuie folosit pentru adoptarea deciziei.

2021 - 2022 Business Intelligence 11


Clasificarea SAD

• SAD orientate pe modele

• SAD orientate pe date

2021 - 2022 Business Intelligence 12


Q&A

2021 - 2022 Business Intelligence 13


Business Intelligence

Sisteme de asistare a deciziilor


orientate pe modele

Ionut ANICA-POPA Ph.D.


ionut.anica@ase.ro
Obiective

• Înțelegerea conceptului de model și a clasificării acestora

• Înțelegerea proiectării modeleleor

2021 - 2022 Business Intelligence 2


Ce este un model?

• un model este asemănător cu o cutie neagră care transformă variabilele de decizie în


indicatori de măsurare ai performanței pentru un set specific de variabile exogene și de
restricții” (Bonini et al., 1997)

2021 - 2022 Business Intelligence 3


Clasificarea modelelor

• Mallach (2000) propune următoarea clasificare a modelelor:

• modele grafice

• modele narative

• modele fizice

• modele matematice

• modele simbolice (bazate pe informație)

2021 - 2022 Business Intelligence 4


Proces decizional

Modele

Descriptive Prescriptive
(sistem) (proces)

Statice Dinamice

Care descriu Care descriu


Continue Discrete
sisteme statice sisteme dinamice

Adaptare după Mallach E.G. (2000)


Decision Support and Data Warehouse Systems

2021 - 2022 Business Intelligence 5


Proiectarea modelelor utilizate în SAD orientate pe modele

• variabile de decizie - variabilele aflate sub controlul direct al decidentului


• variabile exogene - variabilele externe care sunt importante în procesul adoptării deciziei,
dar care nu se află sub influența directă a decidentului
• restricții (constrângeri) - strategia și politica firmei la un moment dat, de legislația în
vigoare, de limitările fizice existente etc
• indicatori de măsurare ai performanței - criterii care cuantifică performanța sau
profitabilitatea unei activități
• variabile intermediare - variabile care sunt necesare pentru a stabili o corelație între
indicatorii de măsurare ai performanței și variabilele de decizie și cele exogene

2021 - 2022 Business Intelligence 6


Interacțiunea dintre componentele unui model

Variabile
exogene

Indicatori
Variabile MODEL de măsurare
de decizie (set de relaţii) ai performanţei

Restricţii
(constrângeri)

Bonini, C.P., Hausman, W.Bierman H. (1997)


Quantitative analysis for management. Ninth Edition.

2021 - 2022 Business Intelligence 7


Diagrama de influență

• „o reprezentare grafică a unui model, utilizată în scopul asistării proiectării, realizării și


înțelegerii unui model” (Turban şi Aronson, 1998)
• Simboluri grafice utilizate în diagramele de influență
Formă
Simbol Descriere
geometrică
variabilă de
dreptunghi
decizie
variabilă intermediară
cerc
sau necontrolabilă
variabilă rezultat
elipsă
(final sau parţial)
săgeată
certitudine
simplă
săgeată
incertitudine
în zig-zag
săgeată
preferinţă
dublă

2021 - 2022 Business Intelligence 8


Model pentru determinarea profitului

Volumul total al Rata medie a dobânzii Cheltuieli


depozitelor atrase X la depozit = cu depozitele atrase
+
Alte cheltuieli

Cheltuieli

Volumul total al Rata medie a dobânzii Venituri


creditelor acordate X la credit = din creditele acordate
+
Alte venituri

Venituri

Venituri - Cheltuieli = Profit

2021 - 2022 Business Intelligence 9


Diagrama de influență pentru determinarea profitului

Volumul
total al
depozitelor
atrase
Cheltuieli cu
depozitele
atrase

Rata medie a
dobânzii la Cheltuieli
depozit

Alte
cheltuieli

Volumul
total al PROFIT
creditelor
acordate
Venituri din
creditele
acordate

Rata medie a
dobânzii la Venituri
credit

Alte venituri

2021 - 2022 Business Intelligence 10


Optimizare matematică

• Programarea liniară presupune maximizarea sau minimizarea unei funcții obiectiv în funcție de un
anumit set de restricții (de ex. maximizarea profitului, a veniturilor, minimizarea cheltuielilor de
personal, a cheltuielilor de producție etc.)
• Elemente principale:
• Funcția obiectiv f(x) – trebuie maximizată sau minimizată
• Variabilele de decizie (x1, x2,... xn)
• Restricțiile: ecuații sau inecuații

• O companie trebuie sa achiziționeze 1250 de echipamente care pot fi procurate în loturi de 35


de bucăți la prețul de 1750 Eur echipamentul, fie în loturi de 25 bucăți la prețul de 1850 Eur
echipamentul. Obiectivul său este de a cumpăra cantitatea necesară de echipamente la cel mai
mic cost. Să se scrie funcția obiectiv și restricțiile modelului.
• Studiu de caz: identificați funcția obiectiv și cel puțin două restricții pentru:
• O companie de curierat care trebuie să livreze colete clienților
• Un birou de contabilitate care trebuie să finalizeze raportările clienților săi în conform reglementărilor legale

2021 - 2022 Business Intelligence 11


Simulare

• Etape
• Definirea problemei
• Planificarea proiectului
• Definirea sistemului
• Definirea modelului
• Analiza și colectarea datelor de intrare
• Translatarea modelului
• Verificarea și validarea
• Experimentele și analiza rezultatelor
• Implementarea

2021 - 2022 Business Intelligence 12


Modele predictive și modele euristice

• Modele predictive
• Analiza de regresie

• Analiza de corelație

• Modele euristice

2021 - 2022 Business Intelligence 13


Q&A

2021 - 2022 Business Intelligence 14


Business Intelligence

Sisteme de asistare a deciziilor


orientate pe date

Ionut ANICA-POPA Ph.D.


ionut.anica@ase.ro
Obiective

• Înțelegerea conceptului de depozit de date

• Prezentarea modelelor de date multidimensionale

• Prezentarea arhitecturii depozitelor de date

2021 - 2022 Business Intelligence 2


Depozit de date (Data Warehouse – DW)

• Data warehouse (depozit de date)


• “O colecție de date orientate pe subiect (tematice), integrate, non-volatile și istorice, organizate în scopul
asistării procesului decizional” (Inmon, 2005).

• Data warehousing
• Procesul de construire și utilizare al unui data warehouse

• Data mart (magazin de date)


• un subset dintr-un depozit de date
• depozitul de date acoperă cerințele informaționale ale întregii organizații
• magazinul de date se rezumă la furnizarea informațiilor necesare unui anumit departament din cadrul
companiei

2021 - 2022 Business Intelligence 3


Depozit de date – orientate pe subiect

• Datele din depozitul de date sunt organizate în jurul problemelor principale: clienți,
produse, vânzări etc.

• Focalizate pe modelarea și analizarea datelor necesare decidenților, nu pentru operații


zilnice sau procesarea tranzacțiilor

• Furnizează o imagine simplă și concisă asupra unui anumit subiect prin excluderea
datelor care nu sunt necesare în asistarea procesului decizional

2021 - 2022 Business Intelligence 4


Depozit de date – integrate

• Construite prin integrarea de multiple surse de date eterogene


• Baze de date relaționale, fișiere text, foi de calcul, fișiere XML etc.
• Datele pot proveni din sisteme operaționale din interiorul sau exteriorul organizației

• Sunt utilizate procesul de curățare și tehnicile de integrare a datelor


• Când datele sunt transferate în depozitul de date sunt convertite
• Se asigura consistența privind: convențiile de denumire, unitățile de măsură, structurile codurilor etc.
între diferite surse de date.

2021 - 2022 Business Intelligence 5


Depozit de date – non-volatile

• Un spațiu fizic distinct al datelor transformate din sistemele operaționale

• Nu necesită operații de procesare a tranzacțiilor, recuperare a datelor sau mecanisme de


control al accesului concurent la date

• Necesită numai două operații în accesarea datelor:


• Încărcarea cu date
• Accesul la date

2021 - 2022 Business Intelligence 6


Depozit de date – istorice

• Orizontul de timp pentru un depozit de date este mult mai mare decât cel al unui sistem
operațional
• Baze de date operaționale: valori curente ale datelor

• Depozite de date: furnizează informații dintr-o perspectivă istorică (de ex. ultimii 5-10 ani)

• Cheile din depozitele de date conțin în mod explicit elementul timp

2021 - 2022 Business Intelligence 7


Arhitectura unui depozit de date

• Kimball și Ross (2002):


• Prin utilizarea depozitelor de date, informațiile existente în cadrul organizației trebuie să poată fi
accesate ușor
• Informațiile organizației existente în depozitul de date trebuie să fie consistente
• Depozitul de date trebuie să fie flexibil şi adaptabil la schimbări
• Depozitul de date trebuie să contribuie la fundamentarea deciziilor tactice și strategice adoptate în
cadrul organizației
• Depozitul de date trebuie să o „fortăreață” care să protejeze informațiile organizației
• Organizația trebuie să accepte existenta depozitului de date și să îl exploateze pentru fundamentarea
deciziilor tactice și strategice

2021 - 2022 Business Intelligence 8


Arhitectura unui depozit de date

Monitorizare Server
Alte surse Metadate & OLAP
de date Integrare

Analize
BD Extract Cereri
operaţionale Transform Depozit de date Serveşte
Repoarte
Load
Refresh Data mining

Magazine de date

Surse de date Stocarea datelor Motor OLAP Instrumente Front-End

2021 - 2022 Business Intelligence 9


Modelarea multidimensională a datelor (I)

• Tabela de dimensiuni conține descrieri textuale ale activității


• Într-un model bine proiectat tabelele de dimensiuni au multe câmpuri (pot să conțină și peste 100 de
câmpuri), ținându-se să fie incluse cât mai multe date cu putință
• Fiecare dimensiune trebuie explicitată într-o tabelă distinctă, tabelă care trebuie să respecte
următoarele condiții
• să descrie datele din tabela de fapte
• fiecare cheie trebuie să fie unică
• cheile trebuie să reprezinte nivelul de detaliere cel mai reprezentativ pentru problema dată
• Numărul dimensiunilor trebuie să fie rezonabil, întrucât un număr prea mare de dimensiuni conduce la
o gestionare mai dificilă a acestora, precum și la un timp de răspuns ridicat din partea sistemului în
urma solicitărilor venite de la utilizatori

2021 - 2022 Business Intelligence 10


Modelarea multidimensională a datelor (II)

• Tabela de fapte reprezintă tabela principală a modelului multidimensional, locul unde


sunt stocați indicatorii care cuantifică performanțele activităților desfășurate în
organizație

• Condiții care trebuie respectate

• să realizeze cuantificarea datelor descrise de către dimensiuni

• fiecare cheie primară trebuie să fie o combinație unică a cheilor primare din tabelele de dimensiuni

• cheia primară trebuie să conțină întotdeauna dimensiunea timp

2021 - 2022 Business Intelligence 11


Modelarea conceptuală a depozitelor de date

• Modelul stea

• Modelul fulg de nea

• Modelul constelație

2021 - 2022 Business Intelligence 12


Baza de date operațională

• Categorie Produs (Cod Categorie Produs, Denumire, Descriere)


• Produs (Cod Produs, Denumire, Descriere, Cod Categorie Produs)
• Județ (Cod Județ, Denumire, Regiune)
• Localitate (Cod Localitate, Denumire, Cod Județ)
• Categorie Client (Cod Categorie Client, Denumire, Descriere)
• Client (Cod Client, Nume, Tip Client, Cod Categorie Client, Cod Localitate, Observații)
• Filială (Cod Filială, Denumire, Cod Localitate)
• Factură (Număr Factură, Dată, Dată Scadentă, Cod Client, Cod Filială)
• Factură Produs (Număr Factură, Cod Produs, Cantitate, Preț)

2021 - 2022 Business Intelligence 13


Modelul stea

2021 - 2022 Business Intelligence 14


Modelul fulg de nea

2021 - 2022 Business Intelligence 15


Baza de date operațională

• Categorie Produs (Cod Categorie Produs, Denumire, Descriere)


• Produs (Cod Produs, Denumire, Descriere, Cod Categorie Produs)
• Județ (Cod Județ, Denumire, Regiune)
• Localitate (Cod Localitate, Denumire, Cod Județ)
• Categorie Client (Cod Categorie Client, Denumire, Descriere)
• Client (Cod Client, Nume, Tip Client, Cod Categorie Client, Cod Localitate, Observații)
• Filială (Cod Filială, Denumire, Cod Localitate)
• Factură (Număr Factură, Dată, Dată Scadentă, Cod Client, Cod Filială)
• Factură Produs (Număr Factură, Cod Produs, Cantitate, Preț)
• Tip Încasare (Tip Încasare, Denumire, Descriere)
• Încasare (Număr Încasare, Dată Încasare, Tip Încasare)
• Încasare Factură (Număr Încasare, Număr Factură, Sumă Încasată)

2021 - 2022 Business Intelligence 16


Modelul constelație

2021 - 2022 Business Intelligence 17


Q&A

2021 - 2022 Business Intelligence 18


Business Intelligence

Business Intelligence (I)

Ionut ANICA-POPA Ph.D.


ionut.anica@ase.ro
Obiective

• Prezentarea conceptului de Business Intelligence(BI)

• Prezentarea procesului extraction, transformation, loading(ETL)

• Prezentarea procesului data mining

• Prezentarea conceptului OLAP

• Metodologii de stocare a datelor pentru OLAP

2021 - 2022 Business Intelligence 2


Business Intelligence

• Abilitatea companiilor de a studia Ce s-a


întâmplat?
comportamentul și acțiunile din perioadele
anterioare în scopul înțelegerii poziției
actuale a organizației și de a previziona sau
de a încerca să schimbe ceea ce urmează
să se întâmple în următoarea perioadă de
timp (Imhoffet al., 2003) Performanța
afacerii

De ce s-a Ce dorim să
întâmplat? se
înyâmple?

2021 - 2022 Business Intelligence 3


Importanța strategică a Business Intelligence
Importanța
strategică a BI Competitive advantage
Mai Capacități BI ale
mult companiei sunt
superioare
Externally neutral concurenților

Capabilitățile BI ale
companiei sunt la
egalitate cu
Internally enhancing concurenții
Capacitățile BI ale
companiei
îmbunătățesc
Internally neutral execuția strategiei de
afaceri
Capacitățile BI ale
companiei nu
împiedică execuția Capabilitățile BI ale
Mai strategiei de afaceri companiei vs. competitori
puțin
Mai puține capabilități BI Mai multe capabilități BI

2021 - 2022 Business Intelligence 4


Aplicații tipice de Business Intelligence (I)

• Rapoarte: informații standard, preformatate pentru analiză retrospectivă.


• Analize definite de utilizator: informații prestabilite în care „listele de alegere” le permit
utilizatorilor să filtreze (selecteze) informațiile pe care doresc să le analizeze, cum ar fi
vânzările pentru o regiune selectată într-un interval de timp anterior selectat.
• Analize ad-hoc: utilizatorii își scriu propriile interogări pentru a extrage informații
prestabilite auto-selectate și apoi le folosesc pentru a efectua o analiză creată de
utilizator.
• Scorecards and dashboards: metrici predefinite de performanță a afacerii pentru
variabilele de performanță care sunt importante pentru organizație, prezentate într-un
format tabelar sau grafic care le permite utilizatorilor să vadă dintr-o privire performanța
organizației.

2021 - 2022 Business Intelligence 5


Aplicații tipice de Business Intelligence (II)

• Analiza multidimensională (On-line analytical processing - OLAP): analiză flexibilă, bazată


pe instrumente definite de utilizator, a performanței afacerii și a factorilor care stau la
baza acesteia.
• Alerte: analize predefinite ale variabilelor cheie de performanță a afacerii, comparație cu
un standard sau un interval de performanță și comunicarea către utilizatorii desemnați
atunci când performanța este în afara standardului sau intervalului de performanță
predefinit.
• Analiză avansată: aplicarea metodelor de cercetare statistică asupra datelor istorice ale
afacerii pentru a caracteriza un aspect relevant al performanței afacerii, de obicei prin
utilizarea statisticilor descriptive.
• Analiză predictivă: aplicarea metodelor de cercetare statistică asupra datelor istorice ale
afacerii pentru a estima, modela sau simula performanța viitoare a afacerii și, eventual, a
propune un curs favorit de acțiune pentru viitor.

2021 - 2022 Business Intelligence 6


Componentele BI

• Extraction, Transformation and Loading – ETL (extragerea, transformarea și încărcarea


datelor)

• Data mining (explorarea datelor)

• Online Analytical Processing – OLAP (procesarea analitică a datelor)

• Enterprise reporting

2021 - 2022 Business Intelligence 7


Extraction, Transformation and Loading (ETL)

• Prin ce se diferențiază datele existente în sistemele operaționale față de cele aflate în


depozitele de date?

• Rolul ETL este de a remodela datele existente în sistemele operaționale în scopul


obținerii de informații utile care să fie stocate în depozitele de date, în absența acestui
proces neputându-se discuta despre existența informațiilor strategice la nivelul unui
depozit de date (Ponniah; 2001)

2021 - 2022 Business Intelligence 8


Etapele ETL

• determinarea tuturor datelor necesare pentru construirea depozitului de date;


• determinarea tuturor surselor de date (atât cele interne, cât și cele externe);
• stabilirea unui set de reguli cuprinzător pentru extragerea datelor;
• determinarea transformărilor care trebuie aplicate datelor și a regulilor de „curățare”
a acestora;
• identificarea, stabilirea și organizarea instrumentelor de testare;
• realizarea procedurilor pentru încărcarea datelor;
• extragerea, transformarea și încărcarea datelor pentru tabelele de dimensiuni;
• extragerea, transformarea și încărcarea datelor pentru tabelele de fapte

2021 - 2022 Business Intelligence 9


Extragerea datelor

• Etape
• Identificarea surselor

• Tehnici de extragere a datelor

• Frecvența de extragere a datelor

• Intervalul orar

• Secvența de extragere

• Tratarea excepțiilor

2021 - 2022 Business Intelligence 10


Calitatea datelor care intră în componența unui depozit de date

• Datele trebuie să fie corecte

• Datele trebuie să fie exacte

• Datele trebuie să fie consistente

• Datele trebuie să fie complete

• Datele trebuie să respecte legislația în vigoare, precum și politica (strategia) organizației

• Datele trebuie să fie integrate

2021 - 2022 Business Intelligence 11


Încărcarea datelor

• Încărcarea inițială (initial loading)

• Încărcarea periodică (incremental loading)

• Reactualizarea totală (full refresh)

2021 - 2022 Business Intelligence 12


References

• Williams, S. (2016). Business Intelligence Strategy and Big Data Analytics – Chapter 3 The
Strategic Importance of Business Intelligence

2021 - 2022 Business Intelligence 13


Q&A

2021 - 2022 Business Intelligence 14


Business Intelligence

Business Intelligence (II)

Ionut ANICA-POPA Ph.D.


ionut.anica@ase.ro
Knowledge Data Discovery (I)

• este procesul de identificare a modelelor noi, valide, potențial utile și în cele din urmă
ușor de înțeles din date existente.

• Procesul Knowledge Discovery in Databases

2021 - 2022 Business Intelligence 2


Knowledge Data Discovery (II)

• Selecția - al cărei scop principal este de a crea un set de date țintă din datele originale, respective
selectarea unui subset de date, pe care trebuie efectuată descoperirea;
• Preprocesarea - care are ca scop „curățarea” datelor prin efectuarea diverselor operațiuni,
precum modelarea și eliminarea “zgomotului”, definirea strategiilor adecvate pentru manipularea
câmpurilor cu date lipsă;
• Transformarea - care se ocupă de reducerea și proiectarea datelor, pentru a obține o
reprezentare adecvată scopului propus; se realizează de obicei prin implicarea tehnicilor sau
metodelor de transformare care sunt capabile să identifice reprezentări invariante ale datelor;
• Data mining - care se ocupă cu extragerea modelelor interesante prin alegerea (i) unei anumite
metode de extragere a datelor (de exemplu, clasificare, grupare, regresie etc.), (ii) algoritmi
adecvati pentru realizarea scopului propus și (iii) o reprezentare adecvată a rezultatelor;
• Interpretare / Evaluare - este folosita de utilizator pentru a interpreta și extrage cunoștințe din
șabloanele/tiparele explorate, prin vizualizarea șabloanelor.

2021 - 2022 Business Intelligence 3


Data mining

• „extragerea, de o manieră nu tocmai simplă, a unor informații potențial utile, implicite și


necunoscute anterior dintr-o bază de date” (Frawley et al., 1992)
• o activitate „care permite analiștilor și managerilor să identifice în depozitele de date
răspunsuri la problemele organizației, pe care aceștia nici măcar nu și le puseseră” (Gray și
Watson, 1996)
• „căutarea de corelații, legături schematice într-o bază voluminoasă sau complexă de
informații în scopul transformării acestora în cunoștințe” (Goglin, 1998)
• „procesul de extragere a cunoștințelor din volume foarte mari de date, stocate în baze de
date, depozite de date sau în alte surse” (Han şi Kamber, 2001)
• este procesul de descoperire a unor noi corelații, modele și tendințe semnificative prin
analizarea unor cantități mari de date stocate în depozite de date, folosind tehnologii de
recunoaștere a modelelor, precum și tehnici statistice și matematice (Gartner Group)

2021 - 2022 Business Intelligence 4


Data mining: Domenii de aplicabilitate

• Financiar: Modelarea riscului de credit, detectarea fraudelor

• Vânzări: Cross-selling, Segmentarea clienților, Estimarea vânzărilor

• Web: recomandări de conținut, direcționare anunțurilor

• Asistență medicală: Supraveghere epidemiologică, Predicția reacțiilor adverse la


medicamentelor, Monitorizarea sănătății în timp real

• Managementul riscului

2021 - 2022 Business Intelligence 5


Data mining: Obiective

• explicarea unui proces, eveniment sau fenomen

• confirmarea unei ipoteze

• explorarea datelor în scopul descoperirii unor corelații necunoscute

2021 - 2022 Business Intelligence 6


Tehnici utilizate în data mining

• Clasificarea

• Asocierea

• Regresia

• Clustering-ul

2021 - 2022 Business Intelligence 7


Clasificarea

• Clasificarea pornește de la o colecție de înregistrări, numită set de antrenament, în care


fiecare înregistrare este compusă dintr-un set de atribute, iar unul dintre atribute denotă
clasa înregistrării.
• Scopul este de a găsi un model pentru atributul de clasă în funcție de valorile celorlalte
atribute. Modelul este apoi utilizat pentru a prezice atributul de clasă al înregistrărilor
neobservate anterior
• Algoritmi:
• Arbori de decizie
• K cCei mai apropiați vecini (k Nearest Neighbors - KNN)
• Support Vector Machines (SVM)
• Rețele neuronale

2021 - 2022 Business Intelligence 8


Clasificarea: arbori decizionali

• Algoritmi utilizați:
• arborii decizionali
• Noduri - fiecare reprezentând un test.
• Ramuri - reprezentând rezultatele testului din noduri.
• Frunze - reprezentând una dintre valorile posibile de ieşire.
• rețelele neuronale
• Informația necesară pentru realizarea unei clasificări
m
I ( s1, s 2,..., sm ) = −  pi log 2( pi )
i =1
• unde pi reprezintă probabilitatea de realizare a variantei din clasa i.
• Entropia (informația așteptată pe baza cunoașterii unui subset A):
v
s1 j + s 2 j + ... + smj
E ( A) =  I (s1 j, s 2 j,..., smj )
j =1 s
• Sporul de informație (reducerea entropiei determinată de cunoașterea valorii atributului
A):
Gain( A) = I ( s1 j, s 2 j,..., smj ) − E ( A)

2021 - 2022 Business Intelligence 9


Asocierea

• Pornind de la un set de înregistrări (tranzacții), fiecare dintre ele conținând un număr de


articole dintr-o colecție dată, scopul constă în descoperirea regulilor de asociere care
determină reguli de dependență și care pot prezice apariția unui articol pe baza apariției
altor elemente.

• dacă A, B, ... atunci X cu probabilitatea p

2021 - 2022 Business Intelligence 10


Clustering

• Având în vedere un set de date, gruparea vizează identificarea unui set finit de grupuri de obiecte
(clustere), astfel încât obiectele din cadrul aceluiași cluster să fie „asemănătoare” între ele, în timp ce
obiectele aparținând unor grupuri diferite sunt „diferite”
• cluster 1 – conține elementele a căror lichiditate curentă și solvabilitate patrimonială înregistrează valori scăzute;
• cluster 2 – conține elementele a căror lichiditate curentă, cât și solvabilitate patrimonială înregistrează valori medii;
• cluster 3 – conține elementele pentru care valorile lichidității curente și ale solvabilității patrimoniale sunt ridicate

Cluster 3

Lichiditate curentă

Cluster 2

Cluster 1

Solvabilitate patrimonială

2021 - 2022 Business Intelligence 11


References

• Gullo, F. (2015). From Patterns in Data to Knowledge Discovery: What Data Mining Can
Do. Physics Procedia 62 ( 2015 ) 18 – 22

2021 - 2022 Business Intelligence 12


Q&A

2021 - 2022 Business Intelligence 13


Business Intelligence

Business Intelligence (III)

Ionut ANICA-POPA Ph.D.


ionut.anica@ase.ro
Online Analytical Processing (OLAP)
• tehnică de analiză a datelor care dispune de funcționalități de rezumare, consolidare, agregare, precum şi de
capacitatea vizualizării datelor din perspective diferite (Han şi Kamber; 2001)

• tehnologie care utilizează o vedere multidimensională a datelor agregate pentru furnizarea unui acces rapid
la informații strategice, în scopul realizării unei analize avansate a datelor (Ramakrishnan şi Gehrke; 2003)

• termen utilizat pentru a descrie analiza datelor complexe existente în depozitele de date (Elmasri şi Navathe;
2004)

• sistem pentru colectarea, gestionarea, procesarea și prezentarea datelor multidimensionale, în scopul


analizării acestora și a asistării deciziilor de ordin tactic și strategic (Boon şi Tan; 2006)

2021 - 2022 Business Intelligence 2


Reguli îndeplinite de aplicațiile OLAP

• multidimensionalitate
• transparență
• accesibilitate
• acces stabil
• client-server
• dimensionalitate generică
• gestionarea eficientă a matricelor
• accesare multiplă
• intersectarea dimensiunilor
• manipularea datelor
• suplețea de afișare
• număr nelimitat de dimensiuni și de niveluri de agregare

2021 - 2022 Business Intelligence 3


Testul FASMI (Fast Analysis Shared Multidimensional Information)

• Fast (rapiditate)

• Analysis (analiză)

• Shared (partajabilitate)

• Multidimensional (multidimensionalitate)

• Information (informare)

2021 - 2022 Business Intelligence 4


Operații OLAP (I)

• Roll-up: Takes the current aggregation level of fact values and does a further
aggregation on one or more of the dimensions.
• Drill-down: Summarizes data at a lower level of a dimension hierarchy, thereby viewing
data in a more specialized level within a dimension.

2021 - 2022 Business Intelligence 5


Operații OLAP (II)

• Slice: Efectuează o selecție pe o dimensiune a cubului dat, rezultând un subcub.


• Dice: Definește un sub-cub prin selecția a uneia sau mai multor dimensiuni.
• Pivot:

2021 - 2022 Business Intelligence 6


Metodologii de stocare a datelor

• ROLAP

• MOLAP

• HOLAP

2021 - 2022 Business Intelligence 7


ROLAP (Relational OLAP)

• Avantaje:
• Medii bine cunoscute (bază de date relațională).
• Poate valorifica funcționalitățile care vin cu bazele de date relaționale cu tehnologiile ROLAP.
• Poate fi utilizat cu sisteme de depozit de date și OLTP.
• Nu este nevoie de pre-agregare – se poate evita efectul de Țexplozie a datelorȚ pe care îl implică unele
implementări MOLAP.
• Poate gestiona cantități mari de date, OLAP în sine nu are nicio limitare în ceea ce privește volumul datelor.
• Securitatea și administrarea completă sunt asigurate prin SGBD relațional.
• Funcționează mai bine decât MOLAP atunci când datele sunt rare.
• Performanța este din ce în ce mai bună prin utilizarea diferitelor tehnici de stocare și optimizare a
interogărilor
• Dezavantaje:
• Performanța poate fi lentă, deoarece fiecare raport ROLAP este o interogare SQL în baza de date
relațională.
• Nu are funcții complexe care sunt furnizate de instrumentele OLAP.
• Limitat de funcționalitatea SQL.
• Greu de menținut tabelele agregate în depozitul de date.

2021 - 2022 Business Intelligence 8


ROLAP (Relational OLAP)

2021 - 2022 Business Intelligence 9


MOLAP (Multidimensional OLAP)

• Avantaje:
• Performanță excelentă, deoarece pre-agregarea oferă timp de răspuns mai rapid.
• Disponibilitatea unor biblioteci extinse de funcții complexe pentru analize OLAP.
• Optim pentru operațiuni de slice and dice.
• Funcționează mai bine decât ROLAP atunci când datele sunt dense.
• Dezavantaje:
• De obicei, mai mult de 90% din celule sunt goale.
• Limitări în ceea ce privește volumul de date care poate fi gestionat, deoarece toate calculele sunt
efectuate atunci când cubul este construit. Prin urmare, nu este folosit în mod obișnuit peste 20-50 GB
(problemă de scalabilitate).
• Este dificil de schimbat dimensiunile fără reagregare.
• Datele trebuie copiate și mutate în depozite de date.
• Lipsa funcțiilor de securitate și administrare pe care SGBD-urile relaționale le pot furniza.

2021 - 2022 Business Intelligence 10


MOLAP (Multidimensional OLAP)

2021 - 2022 Business Intelligence 11


HOLAP (Hybrid OLAP)

• Advantages:
• Avantaje combinate ale MOLAP și ROLAP.
• Poate combina tehnologia ROLAP pentru regiunile cu date ”rare” și MOLAP pentru regiunile cu date
”dense”.
• Dezavantaje:
• Complex - serverul HOLAP trebuie să suporte atât motoarele și instrumentele MOLAP, cât și ROLAP
pentru a combina atât motoarele de stocare, cât și operațiunile.
• Suprapunere de funcționalități - între tehnicile de stocare și optimizare în motoarele ROLAP și MOLAP

2021 - 2022 Business Intelligence 12


HOLAP (Hybrid OLAP)

2021 - 2022 Business Intelligence 13


Latice de cuboide

toate
Cuboid 0-D

timp produs localitate client Cuboid 1-D

timp,produs timp, localitate produs,localitate localitate,client


Cuboid 2-D
timp,client produs, client

timp,localitate,client
timp,produs,localitate Cuboid 3-D

timp,produs,client produs,localitate,client

timp,produs,localitate,client Cuboid 4-D

2021 - 2022 Business Intelligence 14


Exemplu de cub

Dată
Trim I Trim II Trim III Trim IV total
TV
Romania
HC
DVD
total

Ţara
Ungaria

Cehia

total

2021- 2022 Business Intelligence 15


References

• Codd, E.F., Codd, S.B., Salley, C.T. (1998). Providing OLAP (On-Line Analytical Processing)
to User Analyst: An IT Mandate.
• Han, J., Kamber, M., Pei, J. (2012). Data Mining. Concepts and Techniques, 3rd Edition –
Chapter 4 Data Warehousing and Online Analytical Processing

2021 - 2022 Business Intelligence 16


Q&A

2021 - 2022 Business Intelligence 17


Business Intelligence

Impactul sistemelor BI în organizații

Ionut ANICA-POPA Ph.D.


ionut.anica@ase.ro
Obiective

• Tendințe viitoare

• Probleme etice

2021 - 2022 Business Intelligence 2


Big Data

• Big Data reprezintă colecții de date care ocupă un spațiu (volum) mare, se modifică cu o
viteză mare și/sau sunt foarte variate, care necesită tehnologii inovatoare și rentabile de
procesare a datelor, fiind utilizate în vederea îmbunătățirii procesului adoptării deciziilor

• 3V (Gartner)
• Volum (Volume): presupune un volum mare de date

• Viteză (Velocity): este măsura care cuantifică cât de repede sunt ”produse” datele

• Varietate (Variety): indică diferite formate în care se regăsesc datele

2021 - 2022 Business Intelligence 3


Tendințe viitoare în BI

• Inteligenţă artificială

• Securitatea datelor

• Vizualizarea datelor

• Software as a Service (SaaS) BI

• Instrumente de analiză predictivă și prescriptivă

• Analiză în timp real

• Mobile BI

2021 - 2022 Business Intelligence 4


Probleme etice

• Supravegherea electronică

• Etica în proiectarea sistemelor BI

• ”Invazia” vieții private a persoanelor

• Utilizarea bazelor de date obținute ”pe diverse căi”

• Acuratețea datelor, informațiilor și cunoștințelor

• Accesibilitatea informațiilor

• Procentul în care este delegată computerelor procesul adoptării deciziei

2021 - 2022 Business Intelligence 5


Cadrul problemelor etice

• Confidențialitate

• Precizie

• Proprietate

• Accesibilitate

2021 - 2022 Business Intelligence 6


Cadrul problemelor etice (I)

• Confidențialitate
• Ce date cu caracter personal ar trebui să i se solicite unei persoane (și ulterior să fie dezvăluite altor
entități)?

• Ce fel de supraveghere poate folosi un angajator asupra angajaților săi?

• Ce date pot oamenii să păstreze pentru ei înșiși și să nu fie forțați să le dezvăluie altora?

• Ce date despre persoane ar trebui păstrate în baze de date și cât de sigur este accesul la acestea?

2021 - 2022 Business Intelligence 7


Cadrul problemelor etice (II)

• Precizie
• Cine este responsabil pentru autenticitatea, fidelitatea și acuratețea datelor colectate?

• Cum ne putem asigura că datele vor fi procesate corect și prezentate cu acuratețe utilizatorilor?

• Cum ne putem asigura că erorile din bazele de date, transmisiile de date și procesarea datelor sunt
accidentale și nu intenționate?

• Cine trebuie să fie tras la răspundere pentru erorile datelor și cum este compensată persoana
vătămată?

2021 - 2022 Business Intelligence 8


Cadrul problemelor etice (III)

• Proprietate
• Cine deține informațiile?

• Care sunt prețurile juste și corecte pentru schimbul acestora?

• Cine deține canalele de informare?

• Cum ar trebui să se ocupe de pirateria software?

• Pot fi utilizate computerele organizațiilor în scopuri personale?

• Cum ar trebui să fie compensați experții care contribuie cu cunoștințele pentru a crea sisteme expert?

• Cum ar trebui să fie alocat accesul la canalele de informare?

2021 - 2022 Business Intelligence 9


Cadrul problemelor etice (IV)

• Accesibilitate
• Cui îi este permis accesul la informații?

• Care este prețul ”corect” pentru a permite accesul la informații?

• Cui i se asigură echipamentul necesar pentru accesarea informațiilor?

• Ce informații poate o persoană sau o organizație să obțină, în ce condiții și cu ce garanții?

2021 - 2022 Business Intelligence 10


References

• Turban, E., Aronson, J.E., Liang, T.P. (2007). Decision Support Systems and Intelligent
Systems, 7th Ed. – Chapter 15.1 1 Issues of Legality, Privacy, and Ethics

2021 - 2022 Business Intelligence 11


Q&A

2021 - 2022 Business Intelligence 12

S-ar putea să vă placă și