Documente Academic
Documente Profesional
Documente Cultură
Sisteme informaționale
în organizații
Ionut ANICA-POPA Ph.D.
ionut.anica@ase.ro
Obiective
• „este foarte ușor să se realizeze confuzie între date și cunoștințe sau informație și
tehnologia informației” – Peter Drucker (1995)
Caracteristici: Caracteristici:
• tangibilitatea; • intangibilitatea;
• ușurința observării în timpul utilizării; • imposibilitatea observării în timpul utilizării;
• simplitatea; • complexitatea;
• sunt schematice; • bogăția;
• sunt documentate. • nu sunt documentate.
Exteriorizare
Cunoştinţe • Combinarea reprezintă procesul de asamblare
explicite
al cunoștințelor explicite în scopul obținerii de
cunoștințe sistemice .
• Tipologia SI
• Transaction Processing Systems (TPS): un sistem care permite înregistrarea tranzacțiilor zilnice din
cadrul unei organizații care ofera managerilor operaționali răspunsul la întrebări de rutină și
posibilitatea monitorizării fluxurilor de tranzacții prin organizație.
• Ackoff, R. L. (1989). From data to wisdom. Journal of Applied Systems Analysis, 16, 3–9.
• Laudon, K.C., Laudon, J.P. (2019). Management Information Systems: Managing the
Digital Firm (16th edition) – Chapter 2 Global E-business and Collaboration
• Nonaka, I. (1994). A Dynamic Theory of Organizational Knowledge
Creation. Organization Science, 5(1), 14–37. http://www.jstor.org/stable/2635068
• Decizia constă în alegerea, în mod conștient, a unei variante dintr-un set de posibilități,
urmată, în majoritatea cazurilor, de alocarea resurselor necesare.
• Eficiența
• gradul de utilizare al resurselor pentru obținerea rezultatelor
• a face lucrurile cum trebuie (doing things right)
• Effectiveness is doing the right thing. Efficiency is doing the thing right. (Peter Drucker)
• “Un set de instrumente, date, modele și alte resurse pe care decidenții le utilizează pentru
a înțelege, evalua și rezolva probleme nestructurate“ (Kroenke, 1992).
• “Un sistem care furnizează informații interactive în scopul sprijinirii decidenților în timpul
procesului adoptării deciziilor“ (O'Brien, 1999).
• sprijinul acordat în adoptarea deciziei este furnizat pentru toate categoriile de decidenți
din cadrul unei organizații;
• să asiste decidentul indiferent de stilul care trebuie folosit pentru adoptarea deciziei.
• modele grafice
• modele narative
• modele fizice
• modele matematice
Modele
Descriptive Prescriptive
(sistem) (proces)
Statice Dinamice
Variabile
exogene
Indicatori
Variabile MODEL de măsurare
de decizie (set de relaţii) ai performanţei
Restricţii
(constrângeri)
Cheltuieli
Venituri
Volumul
total al
depozitelor
atrase
Cheltuieli cu
depozitele
atrase
Rata medie a
dobânzii la Cheltuieli
depozit
Alte
cheltuieli
Volumul
total al PROFIT
creditelor
acordate
Venituri din
creditele
acordate
Rata medie a
dobânzii la Venituri
credit
Alte venituri
• Programarea liniară presupune maximizarea sau minimizarea unei funcții obiectiv în funcție de un
anumit set de restricții (de ex. maximizarea profitului, a veniturilor, minimizarea cheltuielilor de
personal, a cheltuielilor de producție etc.)
• Elemente principale:
• Funcția obiectiv f(x) – trebuie maximizată sau minimizată
• Variabilele de decizie (x1, x2,... xn)
• Restricțiile: ecuații sau inecuații
• Etape
• Definirea problemei
• Planificarea proiectului
• Definirea sistemului
• Definirea modelului
• Analiza și colectarea datelor de intrare
• Translatarea modelului
• Verificarea și validarea
• Experimentele și analiza rezultatelor
• Implementarea
• Modele predictive
• Analiza de regresie
• Analiza de corelație
• Modele euristice
• Data warehousing
• Procesul de construire și utilizare al unui data warehouse
• Datele din depozitul de date sunt organizate în jurul problemelor principale: clienți,
produse, vânzări etc.
• Furnizează o imagine simplă și concisă asupra unui anumit subiect prin excluderea
datelor care nu sunt necesare în asistarea procesului decizional
• Orizontul de timp pentru un depozit de date este mult mai mare decât cel al unui sistem
operațional
• Baze de date operaționale: valori curente ale datelor
• Depozite de date: furnizează informații dintr-o perspectivă istorică (de ex. ultimii 5-10 ani)
Monitorizare Server
Alte surse Metadate & OLAP
de date Integrare
Analize
BD Extract Cereri
operaţionale Transform Depozit de date Serveşte
Repoarte
Load
Refresh Data mining
Magazine de date
• fiecare cheie primară trebuie să fie o combinație unică a cheilor primare din tabelele de dimensiuni
• Modelul stea
• Modelul constelație
De ce s-a Ce dorim să
întâmplat? se
înyâmple?
Capabilitățile BI ale
companiei sunt la
egalitate cu
Internally enhancing concurenții
Capacitățile BI ale
companiei
îmbunătățesc
Internally neutral execuția strategiei de
afaceri
Capacitățile BI ale
companiei nu
împiedică execuția Capabilitățile BI ale
Mai strategiei de afaceri companiei vs. competitori
puțin
Mai puține capabilități BI Mai multe capabilități BI
• Enterprise reporting
• Etape
• Identificarea surselor
• Intervalul orar
• Secvența de extragere
• Tratarea excepțiilor
• Williams, S. (2016). Business Intelligence Strategy and Big Data Analytics – Chapter 3 The
Strategic Importance of Business Intelligence
• este procesul de identificare a modelelor noi, valide, potențial utile și în cele din urmă
ușor de înțeles din date existente.
• Selecția - al cărei scop principal este de a crea un set de date țintă din datele originale, respective
selectarea unui subset de date, pe care trebuie efectuată descoperirea;
• Preprocesarea - care are ca scop „curățarea” datelor prin efectuarea diverselor operațiuni,
precum modelarea și eliminarea “zgomotului”, definirea strategiilor adecvate pentru manipularea
câmpurilor cu date lipsă;
• Transformarea - care se ocupă de reducerea și proiectarea datelor, pentru a obține o
reprezentare adecvată scopului propus; se realizează de obicei prin implicarea tehnicilor sau
metodelor de transformare care sunt capabile să identifice reprezentări invariante ale datelor;
• Data mining - care se ocupă cu extragerea modelelor interesante prin alegerea (i) unei anumite
metode de extragere a datelor (de exemplu, clasificare, grupare, regresie etc.), (ii) algoritmi
adecvati pentru realizarea scopului propus și (iii) o reprezentare adecvată a rezultatelor;
• Interpretare / Evaluare - este folosita de utilizator pentru a interpreta și extrage cunoștințe din
șabloanele/tiparele explorate, prin vizualizarea șabloanelor.
• Managementul riscului
• Clasificarea
• Asocierea
• Regresia
• Clustering-ul
• Algoritmi utilizați:
• arborii decizionali
• Noduri - fiecare reprezentând un test.
• Ramuri - reprezentând rezultatele testului din noduri.
• Frunze - reprezentând una dintre valorile posibile de ieşire.
• rețelele neuronale
• Informația necesară pentru realizarea unei clasificări
m
I ( s1, s 2,..., sm ) = − pi log 2( pi )
i =1
• unde pi reprezintă probabilitatea de realizare a variantei din clasa i.
• Entropia (informația așteptată pe baza cunoașterii unui subset A):
v
s1 j + s 2 j + ... + smj
E ( A) = I (s1 j, s 2 j,..., smj )
j =1 s
• Sporul de informație (reducerea entropiei determinată de cunoașterea valorii atributului
A):
Gain( A) = I ( s1 j, s 2 j,..., smj ) − E ( A)
• Având în vedere un set de date, gruparea vizează identificarea unui set finit de grupuri de obiecte
(clustere), astfel încât obiectele din cadrul aceluiași cluster să fie „asemănătoare” între ele, în timp ce
obiectele aparținând unor grupuri diferite sunt „diferite”
• cluster 1 – conține elementele a căror lichiditate curentă și solvabilitate patrimonială înregistrează valori scăzute;
• cluster 2 – conține elementele a căror lichiditate curentă, cât și solvabilitate patrimonială înregistrează valori medii;
• cluster 3 – conține elementele pentru care valorile lichidității curente și ale solvabilității patrimoniale sunt ridicate
Cluster 3
Lichiditate curentă
Cluster 2
Cluster 1
Solvabilitate patrimonială
• Gullo, F. (2015). From Patterns in Data to Knowledge Discovery: What Data Mining Can
Do. Physics Procedia 62 ( 2015 ) 18 – 22
• tehnologie care utilizează o vedere multidimensională a datelor agregate pentru furnizarea unui acces rapid
la informații strategice, în scopul realizării unei analize avansate a datelor (Ramakrishnan şi Gehrke; 2003)
• termen utilizat pentru a descrie analiza datelor complexe existente în depozitele de date (Elmasri şi Navathe;
2004)
• multidimensionalitate
• transparență
• accesibilitate
• acces stabil
• client-server
• dimensionalitate generică
• gestionarea eficientă a matricelor
• accesare multiplă
• intersectarea dimensiunilor
• manipularea datelor
• suplețea de afișare
• număr nelimitat de dimensiuni și de niveluri de agregare
• Fast (rapiditate)
• Analysis (analiză)
• Shared (partajabilitate)
• Multidimensional (multidimensionalitate)
• Information (informare)
• Roll-up: Takes the current aggregation level of fact values and does a further
aggregation on one or more of the dimensions.
• Drill-down: Summarizes data at a lower level of a dimension hierarchy, thereby viewing
data in a more specialized level within a dimension.
• ROLAP
• MOLAP
• HOLAP
• Avantaje:
• Medii bine cunoscute (bază de date relațională).
• Poate valorifica funcționalitățile care vin cu bazele de date relaționale cu tehnologiile ROLAP.
• Poate fi utilizat cu sisteme de depozit de date și OLTP.
• Nu este nevoie de pre-agregare – se poate evita efectul de Țexplozie a datelorȚ pe care îl implică unele
implementări MOLAP.
• Poate gestiona cantități mari de date, OLAP în sine nu are nicio limitare în ceea ce privește volumul datelor.
• Securitatea și administrarea completă sunt asigurate prin SGBD relațional.
• Funcționează mai bine decât MOLAP atunci când datele sunt rare.
• Performanța este din ce în ce mai bună prin utilizarea diferitelor tehnici de stocare și optimizare a
interogărilor
• Dezavantaje:
• Performanța poate fi lentă, deoarece fiecare raport ROLAP este o interogare SQL în baza de date
relațională.
• Nu are funcții complexe care sunt furnizate de instrumentele OLAP.
• Limitat de funcționalitatea SQL.
• Greu de menținut tabelele agregate în depozitul de date.
• Avantaje:
• Performanță excelentă, deoarece pre-agregarea oferă timp de răspuns mai rapid.
• Disponibilitatea unor biblioteci extinse de funcții complexe pentru analize OLAP.
• Optim pentru operațiuni de slice and dice.
• Funcționează mai bine decât ROLAP atunci când datele sunt dense.
• Dezavantaje:
• De obicei, mai mult de 90% din celule sunt goale.
• Limitări în ceea ce privește volumul de date care poate fi gestionat, deoarece toate calculele sunt
efectuate atunci când cubul este construit. Prin urmare, nu este folosit în mod obișnuit peste 20-50 GB
(problemă de scalabilitate).
• Este dificil de schimbat dimensiunile fără reagregare.
• Datele trebuie copiate și mutate în depozite de date.
• Lipsa funcțiilor de securitate și administrare pe care SGBD-urile relaționale le pot furniza.
• Advantages:
• Avantaje combinate ale MOLAP și ROLAP.
• Poate combina tehnologia ROLAP pentru regiunile cu date ”rare” și MOLAP pentru regiunile cu date
”dense”.
• Dezavantaje:
• Complex - serverul HOLAP trebuie să suporte atât motoarele și instrumentele MOLAP, cât și ROLAP
pentru a combina atât motoarele de stocare, cât și operațiunile.
• Suprapunere de funcționalități - între tehnicile de stocare și optimizare în motoarele ROLAP și MOLAP
toate
Cuboid 0-D
timp,localitate,client
timp,produs,localitate Cuboid 3-D
timp,produs,client produs,localitate,client
Dată
Trim I Trim II Trim III Trim IV total
TV
Romania
HC
DVD
total
Ţara
Ungaria
Cehia
total
• Codd, E.F., Codd, S.B., Salley, C.T. (1998). Providing OLAP (On-Line Analytical Processing)
to User Analyst: An IT Mandate.
• Han, J., Kamber, M., Pei, J. (2012). Data Mining. Concepts and Techniques, 3rd Edition –
Chapter 4 Data Warehousing and Online Analytical Processing
• Tendințe viitoare
• Probleme etice
• Big Data reprezintă colecții de date care ocupă un spațiu (volum) mare, se modifică cu o
viteză mare și/sau sunt foarte variate, care necesită tehnologii inovatoare și rentabile de
procesare a datelor, fiind utilizate în vederea îmbunătățirii procesului adoptării deciziilor
• 3V (Gartner)
• Volum (Volume): presupune un volum mare de date
• Viteză (Velocity): este măsura care cuantifică cât de repede sunt ”produse” datele
• Inteligenţă artificială
• Securitatea datelor
• Vizualizarea datelor
• Mobile BI
• Supravegherea electronică
• Accesibilitatea informațiilor
• Confidențialitate
• Precizie
• Proprietate
• Accesibilitate
• Confidențialitate
• Ce date cu caracter personal ar trebui să i se solicite unei persoane (și ulterior să fie dezvăluite altor
entități)?
• Ce date pot oamenii să păstreze pentru ei înșiși și să nu fie forțați să le dezvăluie altora?
• Ce date despre persoane ar trebui păstrate în baze de date și cât de sigur este accesul la acestea?
• Precizie
• Cine este responsabil pentru autenticitatea, fidelitatea și acuratețea datelor colectate?
• Cum ne putem asigura că datele vor fi procesate corect și prezentate cu acuratețe utilizatorilor?
• Cum ne putem asigura că erorile din bazele de date, transmisiile de date și procesarea datelor sunt
accidentale și nu intenționate?
• Cine trebuie să fie tras la răspundere pentru erorile datelor și cum este compensată persoana
vătămată?
• Proprietate
• Cine deține informațiile?
• Cum ar trebui să fie compensați experții care contribuie cu cunoștințele pentru a crea sisteme expert?
• Accesibilitate
• Cui îi este permis accesul la informații?
• Turban, E., Aronson, J.E., Liang, T.P. (2007). Decision Support Systems and Intelligent
Systems, 7th Ed. – Chapter 15.1 1 Issues of Legality, Privacy, and Ethics