Sunteți pe pagina 1din 9

Instrumente de Business Intelligence

Cătălina-Gabriela Sfetcu
ETTI - Ingineria Informației și a Sistemelor de Calcul
Universitatea Politehnica din București
București, Romania

Abstract — Această lucrare oferă o și intuiția celor din companie. Deciziile bazate
introducere scurtă în contextul actual al pe date concrete sunt mult mai eficiente decât
inteligenței afacerii (Business Intelligence) cu cele bazate numai pe intuiție. Acțiunile bazate pe
accent pe algoritmii fundamentali și progresele date, informații, cunoștințe, experimentări și
recente. Business Intelligence (BI) este procesul de teste exacte, ce utilizează date noi, pot avea un
transformare a datelor brute în informații utile succes mult mai mare și pot duce la o creștere
pentru a avea o eficiență mai mare din punct de sustenabilă.
vedere al deciziilor strategice și operaționale, Prin urmare, organizațiile ar trebui să adune
lucruri ce oferă beneficii mari în domeniul date, să le prelucreze, să le analizeze și să le
afacerilor. De asemenea, lucrarea are scopul de a descopere utilitatea, să găsească informații și să
evidenția importanța utilizării instrumentelor de încorporeze aceste informații în procedurile lor
business intelligence în cadrul unei companii care de funcționare.
dispune de foarte multe date relevante din toate
departamentele sale, în contextul în care
concurența este acerbă și este necesară abordarea
unui mod de lucru în care deciziile se iau cu
rapiditate pe baza unor date procesate aproape în
timp real pentru ca informațiile culese, agregate și
puse la dispoziție pentru vizualizare sa fie cât mai
noi. Degeaba s-ar face o analiză asupra unor date
vechi, când piața este într-o continuă schimbare.
Deci este necesară culegerea a cât mai multe date
relevante, procesarea lor în mod rapid și Figura 1. Business intelligence și ciclul de exploatare a
disponibilitatea acestor date spre a fi vizualizate datelor
cu ajutorul unui instrument cat mai ușor de
folosit, capabil să contureze grafice utile în luarea Există o nouă necesitate de importanță și de
unor decizii de business. urgență în ceea ce privește informația, deoarece
este privită ca o nouă resursă naturală. Aceasta
1. INTRODUCERE poate fi exploatată pentru valoare, perspectivă și
„Business Intelligence” (BI) este un termen avantaj competitiv. Într-o lume hiperconectată,
general care include o varietate de aplicații IT ce unde totul este posibil conectat la orice, cu
sunt folosite pentru a analiza datele unei potențiale infinite de corelații, datele reprezintă
organizații și pentru a comunica informațiile impulsuri sub forma anumitor evenimente și
obținute utilizatorilor pentru care sunt relevante atribute. [2]
acele date. Componentele sale principale sunt
depozitarea datelor, exploatarea datelor, 2. INSTRUMENTE DE BI
interogarea și raportarea. [1]
Informația este esențială pentru afacere. BI include o varietate de instrumente și tehnici
Business-urile folosesc diverse tehnici pentru a software pentru a oferi managerilor informațiile
înțelege mediul lor de afaceri și pentru a prezice și informațiile necesare pentru a conduce
viitorul, acest lucru fiind necesar dezvoltării și afacerea. Pot fi furnizate informații cu privire la
creșterii lor. Deciziile sunt luate din experiența starea actuală a afacerilor, cu capacitatea de a
detalia informațiile și, de asemenea, informații
despre modelele emergente care duc la proiecții 3. DEPOZITAREA DATELOR
în viitor. Instrumentele BI includ depozitarea
datelor, procesarea analitică online, analiza Un depozit de date (DW - data warehouse)
social media, raportarea, tablourile de bord, este o colecție organizată de baze de date
interogarea și extragerea datelor. integrate, bazate pe obiecte, concepute pentru a
Instrumentele BI pot varia de la instrumente sprijini funcțiile de suport decizional. DW este
foarte simple care ar putea fi considerate organizat la un nivel adecvat de granularitate
instrumente ale utilizatorilor finali, până la pentru a furniza date clare la nivel de companie
instrumente sofisticate care oferă un set de într-un format standardizat pentru rapoarte,
funcționalități foarte larg și complex. Astfel, interogări și analize. DW este fizic și funcțional
directorii executivi pot fi propriii experți BI sau
separat de o bază de date operațională și
se pot baza pe specialiștii BI pentru a stabili
tranzacțională. Crearea unui DW pentru analiză
mecanismele BI pentru ele. Astfel, organizațiile
mari investesc în soluții sofisticate de BI care și interogări reprezintă o investiție semnificativă
oferă informații bune în timp real. [3] de timp și efort. Trebuie să fie constant
Un instrument de calcul tabelar, cum ar fi menținută la zi pentru ca aceasta să fie utilă. DW
Microsoft Excel, poate funcționa ca un oferă multe avantaje comerciale și tehnice. DW
instrument BI simplu, dar eficient. Datele pot fi sprijină activitățile de raportare și activitățile de
descărcate și stocate în foaia de calcul, apoi exploatare a datelor. Poate facilita accesul
analizate pentru a genera perspective, apoi distribuit la cunoștințele de afaceri actualizate
prezentate sub formă de grafice și tabele. Acest pentru departamente și funcții, îmbunătățind
sistem oferă o automatizare limitată, utilizând astfel eficiența afacerii și servicii pentru clienți.
macrocomenzi și alte funcții. Caracteristicile DW poate prezenta un avantaj competitiv prin
analitice includ funcțiile de bază statistice și facilitarea procesului de luare a deciziilor și prin
financiare. Tabelele de tip pivot ajută la analiza
facilitarea proceselor de afaceri. DW permite o
de tip „what-if”. Modulele de tip add-on pot fi
instalate pentru a permite analiza statistică vizualizare consolidată a datelor întregii
moderată. [3] companii, toate ajustate și organizate. Astfel,
Un sistem de tip dashboard, cum ar fi Tableau, întreaga organizație poate vedea o viziune
Qlick sau Microsoft Power BI, poate oferi un set integrată asupra ei înșiși. DW oferă astfel
sofisticat de instrumente pentru colectarea, informații mai bune și mai rapide. Acesta
analizarea și prezentarea datelor. La end user, simplifică accesul la date și permite utilizatorilor
dashboard-urile modulare pot fi proiectate și finali să efectueze analize ample. Îmbunătățește
reproiectate cu ușurință cu o interfață grafică performanța generală a informațiilor prin faptul
pentru utilizator. Capacitățile analitice de date că nu împovărează bazele de date operaționale
back-end includ multe funcții statistice. utilizate alte sisteme. [5]
Dashboard-urile sunt legate la data warehouse
pentru a se asigura că tabelele, graficele și alte 4. ARHITECTURA DW
elemente ale dashboard-ului sunt actualizate în
timp real. DW are patru elemente cheie. Primul element
Sistemele de data minning, cum ar fi IBM SPSS reprezintă sursele de date care furnizează datele
Modeler, sunt sisteme de rezistență industrială brute. Al doilea element este procesul de
care oferă capabilități de a aplica o gamă largă transformare a acestor date pentru a răspunde
de modele analitice pe seturi de date mari. nevoilor decizionale. Cel de-al treilea element
Sistemele open source, cum ar fi Weka, sunt sunt metodele de încărcare regulată și precisă a
platforme populare menite să ajute cantități mari acestor date în EDW sau martor de date. Al
de date pentru a descoperi modele. [4] patrulea element este partea de acces și analiză a
datelor, în care dispozitivele și aplicațiile
utilizează datele de la DW pentru a furniza
informații și alte beneficii utilizatorilor. [1]
DW-urile sunt create din surse structurate de de baze non-relaţionale de baze de date. În unele
date. Datele nestructurate, cum ar fi datele de cazuri, procesul de extracţie poate fi necesar să
text, ar trebui structurate înainte la inserarea în facă o regulă de validare a datelor pentru a
DW. accepta datele şi pentru a trece in faza
Un DW util constă în procesul de populare cu urmatoare. [8]
date corecte. În etapa de transformare a datelor, se aplică o
Acest proces se numește extragere-transformare- serie de reguli sau funcţii datelor extrase pentru
încărcare (ETL – extract-trasform-load). a fi pregătite pentru încarcarea la destinaţia
1. Datele ar trebui extrase din mai multe surse de finală. Câteva exemple sunt:
baze de date operaționale (tranzacționale) în - Selectarea numai a anumitor coloane pentru
mod regulat. încărcare;
2. Datele extrase ar trebui aliniate împreună cu
câmpurile cheie. Ar trebui să fie curățate de - Codarea valorilor formelor libere;
orice nereguli sau valori lipsă. Ar trebui să fie - Traducerea valorilor codificate;
agregate la același nivel de granularitate.
Câmpurile dorite, cum ar fi totalul zilnic de - Derivarea unei noi valori calculate;
vânzări, ar trebui calculate. Întreaga informație - Sortarea sau ordonarea datelelor pe baza unei
trebuie să fie adusă la același format ca și tabelul liste de coloane pentru a îmbunătăţi performanţa
central al DW. căutării;
3. Datele transformate ar trebui apoi încărcate în
DW. [6] - Agregarea;
Conceptul de proces ETL a devenit popular în
- Generarea valorilor cheie-valoare;
anii 1970. Extracţia de date este atunci când
datele sunt extrase din surse de date,fie - Integrarea datelor din mai multe surse
omogene,fie eterogene; transformarea datelor
este atunci când datele sunt transformate pentru - Împărţirea unei coloane în mai multe coloane;
a fi stocate în formatul sau structura - Transpunerea sau pivotarea;
corespunzătoare pentru interogare şi analiză;
încărcarea datelor se intamplă atunci când datele - Dezagregarea coloanelor repetate;
sunt încarcate în baza de date de destinție ( care - Căutarea și validarea datelor relevante din
poate fi un depozit de date). [7] tabele sau fișiere referenţiale. [7]
Deoarece extragerea datelor este un proces
consumator de timp, se optează pentru Ultima fază, aceea de încarcare a datelor la
executarea celor trei faze în paralel. În timp ce destinaţie, care poate fi realizată sub forma unui
datele sunt extrase, un alt proces de transformare fişier simplu sau a unui depozit de date. În
se execută în timpul prelucrării datelor deja funcţie de cerinţele organizaţiei, acest proces
primite şi se pregătește pentru încarcare, în timp variază foarte mult. În unele depozite de date se
ce încărcarea altor date începe fără a aştepta pot suprascrie datele existente cu informaţii;
finalizarea etapelor anterioare. actualizarea datelor extrase se face frecvent pe o
Prima parte a procesului ETL implica extragerea bază zilnică, săptămânală sau lunară. În alte
datelor din sistemele sursă. În multe cazuri, depozite de date se pot adăuga noi date într-o
aceasta reprezintă cel mai important aspect al formă istorică la intervale regulate.
ETL, deoarece extragerea datelor stabileşte în Procesele ETL pot implica o mare complexitate
mod corect etapa pentru succesul proceselor şi pot apărea probleme operaționale
ulterioare. Cele mai multe proiecte de depozitare semnificative. Gama de valori de date sau de
a datelor combină date din diferite sisteme sursă. calitate a datelor într-un sistem operațional poate
Fiecare sistem separat poate utiliza, de depăşi aşteptările designerilor la momentul
asemenea, o altă organizaţie şi / sau format de validării şi a regulilor de transformare. Profilarea
date . Formatele de date comune-source includ datelor unei surse în timpul analizei datelor
baze de date relaţionale , XML , JSON şi fişiere poate identifica condiţiile de date care trebuie
plate , dar pot include , de asemenea , structuri
gestionate prin specificarea normelor de fie valide, noi, cu potențial mare de utilitate și
transformare, ceea ce duce la o modificare a ușor de înțeles. Presupunerea implicită este că
regulilor de validare implementate explicit şi datele din trecut pot dezvălui modele de
implicit în procesul ETL. [8] activitate care pot fi proiectate în viitor.
Depozitele de date sunt de obicei asamblate Explorarea datelor este un domeniu
dintr-o varietate de surse de date cu diferite multidisciplinar care împrumută tehnici dintr-o
formate şi scopuri. Ca atare, ETL este un proces varietate de domenii. Acesta utilizează
cheie pentru a aduce toate datele într-un mediu cunoștințele privind calitatea datelor și
standard, omogen. [9] organizarea datelor din zona bazelor de date. Ea
Acest proces ETL trebuie să funcționeze cu o atrage tehnici de modelare și analitice din
frecvență optimă. Datele de tranzacție zilnice pot domeniile statisticilor și informaticii (inteligența
fi extrase din sisteme integrate, transformate și artificială). De asemenea, atrage cunoștințele de
încărcate în baza de date în aceeași noapte. luare a deciziilor din domeniul managementului
Astfel, DW este actualizat în dimineața afacerilor.
următoare. Dacă DW este necesar pentru accesul Domeniul exploatării datelor a apărut în
la informații în timp real, procesele ETL ar contextul recunoașterii modelului în apărare,
trebui să fie executate mai frecvent. Activitatea cum ar fi identificarea unui prieten sau dușman
ETL este de obicei automatizată folosind pe un câmp de luptă. Precum multe alte
scripturi de programare care sunt scrise, testate tehnologii bazate pe apărare, a evoluat pentru a
și apoi implementate pentru actualizarea ajuta la obținerea unui avantaj competitiv în
periodică a DW.
afaceri. [10]
Schema stea este arhitectura de date preferată
pentru majoritatea DW-urilor. Există un tabel 6. COLECTAREA ȘI
central care oferă majoritatea informațiilor de
interes. Există tabele de căutare care furnizează SELECTAREA DATELOR
valori detaliate pentru codurile utilizate în Valoarea totală a datelor din lume se dublează la
tabelul central. fiecare 18 luni. Există o avalanșă tot mai mare
Alte scheme includ arhitectura fulg de zăpadă. de date cu viteză, volum și varietate mai mari.
Diferența dintre o stea și fulg de zăpadă este Datele trebuie folosite rapid sau se pot pierde.
aceea că în tabelul de căutare, tabelele de căutare Trebuie să luăm decizii rapide cu privire la ceea
pot avea propriile tabele de căutare ce trebuie să colectăm și să ignorăm, pe baza
suplimentare. scopului exercițiilor de extragere a datelor.
Există multe opțiuni tehnologice pentru Pentru a învăța din date, trebuie să colectăm în
dezvoltarea DW. Aceasta include selectarea mod eficient date de calitate, să le structurăm, să
sistemului de gestionare a bazelor de date le organizăm și apoi să le procesăm eficient.
potrivite și setul corespunzător de instrumente Unele necesită abilitățile și tehnologiile pentru
de gestionare a datelor. Există câțiva furnizori consolidarea și integrarea elementelor de date
mari și fiabili de sisteme DW. Furnizorul SGBD din mai multe surse. Majoritatea organizațiilor
operațional poate fi ales și pentru DW. dezvoltă un model de companie, un model
Alternativ, ar putea fi utilizat un furnizor DW de unificat, la nivel înalt, al tuturor datelor stocate
cea mai bună calitate. Există, de asemenea, o în bazele de date ale unei organizații. Va include
varietate de instrumente pentru migrarea datelor, chiar datele generate de toate sistemele interne.
încărcarea datelor, recuperarea datelor și analiza Oferă meniul de bază al datelor pentru a crea un
datelor. [6] depozit de date pentru un anumit scop
decizional. Depozitele de date ajută la
5. DATA MINING organizarea tuturor acestor date într-o manieră
Explorarea datelor este știința de a descoperi utilă, astfel încât să poată fi selectate și
cunoștințe, informații și modele în date. Este un desfășurate pentru exploatare. Poate, de
act de extragere a modelelor utile dintr-o asemenea, să-și imagineze ce date externe
colecție organizată de date. Modelele trebuie să
relevante ar trebui colectate pentru a dezvolta până la 60 până la 70% din timpul necesar
relațiile bune de predicție cu datele interne. [11] pentru un proiect de extragere de date. [13]
Colectarea și structurarea datelor necesită Exemple de reguli folosite la procesul de
timp și efort, mai ales atunci când acestea sunt curățare și pregatire:
nestructurate sau semistructurate. Datele  Datele duplicate trebuie eliminate. Aceleași
nestructurate pot veni în mai multe forme, cum date pot fi primite din mai multe surse.
ar fi baze de date, bloguri, imagini, videoclipuri  Valorile lipsă trebuie să fie completate sau
și chat-uri. Există fluxuri de date sociale acele rânduri ar trebui eliminate din analiză.
nestructurate din bloguri, chat-uri și tweet-uri. Valorile lipsă pot fi completate cu valori medii
Există, de asemenea, fluxuri de date generate de sau modale sau implicite.
 Este posibil ca elementele de date să fie
mașini, internetul obiectelor (IOT – internet of
transformate de la o unitate la alta. De exemplu,
things) și așa mai departe. Datele trebuie puse în
este posibil ca aceste costuri totale ale asistenței
forme de date rectangulare, cu coloane și rânduri medicale și numărul total de pacienți să fie
clare, înainte de al trimite la minare. reduse la cost / pacient pentru a permite
Cunoașterea domeniului afacerii ajută la comparabilitatea acestei valori.
selectarea fluxurilor potrivite de date pentru a  Este posibil ca elementele de date să fie
obține informații noi. Datele care se potrivesc ajustate pentru a le face comparabile în timp. De
problemei trebuie colectate. Elementele de date exemplu, este posibil ca valorile valutare să
ar trebui să fie relevante și să abordeze în mod trebuiască să fie ajustate în funcție de inflație;
adecvat problema care trebuie rezolvată. Acestea acestea ar trebui să fie convertite în același an de
ar putea afecta direct problema sau ar putea fi un bază pentru comparabilitate. Este posibil ca
proxy adecvat pentru măsurarea efectului. acestea să fie convertite într-o monedă comună.
Selectarea datelor va fi colectată și din depozitul  Orice prejudecăți în selectarea datelor ar trebui
corectate pentru a asigura că datele sunt
de date. [12]
reprezentative pentru fenomenele analizate.
7. CURĂȚAREA ȘI Dacă datele includ mai mulți membri dintr-un
gen decât cel tipic pentru populația de interes,
PREGĂTIREA DATELOR atunci trebuie adaptate datele.
Calitatea datelor este esențială pentru  Datele ar trebui aduse la aceeași granularitate
succesul și valoarea proiectului de extracție a pentru a asigura comparabilitatea. Datele de
vânzări pot fi disponibile zilnic, dar datele de
datelor.. Calitatea datelor primite variază în
compensare ale persoanelor de vânzări pot fi
funcție de sursa și de natura datelor. Datele din
disponibile numai lunar. Pentru a lega aceste
operațiunile interne sunt susceptibile de a fi de o variabile, datele trebuie aduse la cel mai mic
calitate superioară, deoarece vor fi corecte și numitor comun, în acest caz, lunar.
concrete. Datele din mass-media sociale și alte  Este posibil ca datele să fie selectate pentru a
surse publice sunt mai puțin sub controlul crește densitatea informației. Este posibil ca
afacerilor și este mai puțin probabil să fie fiabile. unele date să nu arate o mare variabilitate,
Datele trebuie aproape cu siguranță să fie deoarece nu au fost înregistrate corect sau din
curățate și transformate înainte ca acestea să alte motive. Aceste date pot afecta efectele
poată fi folosite pentru exploatarea datelor. altor diferențe în date și ar trebui eliminate
Există multe modalități în care pot fi necesare pentru a îmbunătăți densitatea informațională
curățarea datelor - umplerea valorilor lipsă, a datelor. [14]
împărțirea în efectele extragerii, transformarea
câmpurilor, binarea variabilelor continue și 8. TEHNICI DE DATA-MINING
multe altele - înainte de a fi gata pentru analiză. Există două tipuri principale de procese de
Curățarea și pregătirea datelor este o activitate extragere a datelor: învățarea supravegheată și
intensivă sau semiautomată, care poate dura învățarea nesupravegheată. În învățarea
supravegheată, poate fi creat un model de
decizie utilizând datele anterioare, iar modelul procesează și le comunică succesiv altor neuroni
poate fi apoi utilizat pentru a prezice răspunsul și, în cele din urmă, un neuron emite o decizie.
corect pentru viitoarele instanțe de date. O sarcină de decizie poate fi procesată de un
Clasificarea este principala categorie de singur neuron, iar rezultatul poate fi comunicat
activitate de învățare supravegheată. Există în curând. Alternativ, ar putea exista multe
multe tehnici de clasificare, arborii de decizie straturi de neuroni implicați într-o sarcină de
fiind cei mai populari. Fiecare dintre aceste decizie, în funcție de complexitatea domeniului.
tehnici poate fi implementată cu mai mulți Rețeaua neuronală poate fi instruită prin luarea
algoritmi. O metrică comună pentru toate unei decizii de mai multe ori cu multe puncte de
tehnicile de clasificare este precizia predictivă. date. Acesta va continua să învețe prin ajustarea
[14] parametrilor interni de calcul și de comunicare
Datele pot fi extrase pentru a ajuta la luarea bazat pe feedbackul primit asupra deciziilor sale
deciziilor mai eficiente în viitor. Sau poate fi anterioare. Valorile intermediare trecute în
folosit pentru a explora datele pentru a găsi straturile neuronilor nu pot face un sens intuitiv
interesante modele asociative. Tehnica corectă unui observator. Astfel, rețelele neuronale sunt
depinde de tipul de problemă care trebuie considerate un sistem cutie neagră. [10]
rezolvată. La un moment dat, rețeaua neuronală va
Cea mai importantă clasă de probleme rezolvate învăța suficient și va începe să se potrivească cu
prin utilizarea minelor de date reprezintă precizia predictivă a unui expert uman sau cu
probleme de clasificare. Acestea sunt probleme tehnici alternative de clasificare. Predicțiile
în care datele din deciziile anterioare sunt anumitor anunțuri ANN care au fost instruite pe
extrase pentru a extrage câteva reguli și modele o perioadă lungă de timp, cu o cantitate mare de
care ar îmbunătăți acuratețea procesului date, au devenit cu mult mai precise decât
decizional în viitor. Datele deciziilor anterioare experții umani. În acest moment, RNA-urile pot
sunt organizate și exploatate pentru reguli de începe să fie serios luate în considerare pentru
decizie sau ecuații, care apoi sunt codificate desfășurare, în situații reale în timp real. ANN
pentru a produce decizii mai precise. Tehnicile sunt populare deoarece sunt în cele din urmă
de clasificare se numesc învățare supravegheată, capabili să atingă o precizie predictivă înaltă.
deoarece există o modalitate de a supraveghea
Ans sunt, de asemenea, relativ simplu de
dacă predicția modelului este corectă sau greșită.
implementat și nu au probleme cu calitatea
[13]
Un arbore de decizie este o structură ierarhică datelor. ANN necesită o mulțime de date pentru
organizată, structurată pentru a ajuta la luarea a instrui pentru a dezvolta abilități bune de
unei decizii într-o manieră simplă și logică. predicție.
Regresia este o tehnică relativ simplă și cea mai Analiza cluster este o tehnică de învățare
populară de date statistice. Scopul este să se exploratorie care ajută la identificarea unui set
potrivească unei curbe bine definite a datelor. de grupuri similare în date. Este o tehnică
Tehnicile de analiză a regresiei, de exemplu, pot utilizată pentru identificarea automată a
fi folosite pentru a modela și anticipa consumul grupărilor naturale ale lucrurilor. Instanțele de
de energie ca o funcție a temperaturii zilnice. date care sunt similare cu (sau aproape) reciproc
Simpla reprezentare a datelor arată o curbă sunt clasificate într-un singur grup, în timp ce
neliniară. Aplicarea unei ecuații de regresie instanțele de date care sunt foarte diferite (sau
neliniară se va potrivi foarte bine cu o precizie îndepărtate) una de cealaltă sunt clasificate în
ridicată. Astfel, consumul de energie în orice zi clustere separate. Pot exista orice număr de
viitoare poate fi prezis utilizând această ecuație. clustere care ar putea fi generate de date.
Rețeaua neuronală artificială (ANN) este o Tehnica K-means este o
tehnologie sofisticată de extragere a datelor din tehnică populară și permite orientarea
fluxul de inteligență artificială din Informatică. utilizatorului în selectarea numărului corect (K)
Aceasta imita comportamentul structurii al clusterelor din date.
neuronale umane: Neuronii primesc stimuli, le
Clustering-ul este, de asemenea, cunoscut sub versiune beta. Un impuls puternic pe o piață
numele de tehnica de segmentare. Tehnica arată competitivă și sensibilă la prețuri, îmbunătățirea
grupurile de lucruri din datele anterioare. Ieșirea continuă a produselor au condus la poziția sa.
este centroidii pentru fiecare cluster și alocarea [15]
punctelor de date către clusterul lor. Definiția Avantajele utilizării acestui intrument sunt:
centroidului este utilizată pentru a atribui noi  Standard înalt pentru explorarea vizuală
instanțe de date care pot fi atribuite caselor lor interactivă: Principalele avantaje ale produselor
de cluster. Gruparea este, de asemenea, o parte a Tableau continuă să fie vizualizarea și
familiei de tehnici de inteligență artificială. explorarea interactivă intuitivă și capabilitățile
Regulile de asociere sunt o metodă populară de analitice de bord, mobilizând setul conectorilor
valorificare a datelor în afaceri, în special în de date, atât în memorie, cât și direct interogarea
cazul în care este implicată vânzarea. De accesului pentru seturi de date mai mari. Această
asemenea, cunoscut sub numele de „analiza combinație, care include funcții avansate de tip
coșului de pe piață”, aceasta ajută la răspunsul la drag-and-drop, cum ar fi prognozarea, gruparea,
întrebări despre oportunitățile de vânzare geocodarea automată și editarea asistată a
încrucișată. Aceasta este elementul de bază al formularelor, permite utilizatorilor să exploreze
motorului de personalizare folosit de site-urile și să manipuleze mai adânc datele mai ușor și
de comerț electronic, cum ar fi Amazon.com și mai repede decât în majoritatea platformelor
site-urile de filme streaming precum concurente. Clienții de referință ai Tableau
Netflix.com. Tehnica ajută la găsirea unor relații continuă să achiziționeze produsul pentru
interesante (afinități) între variabile (elemente experiența utilizatorului, ușurința în utilizare și
sau evenimente). Acestea sunt reprezentate ca funcționalitate, pentru care scorurile sale se
reguli ale formulei X Y, unde X și Y sunt seturi numără printre cele mai mari dintre toți
de elemente de date. O formă de învățare furnizorii evaluați aici.
nesupravegheată, nu are o variabilă dependentă;  Concentrarea pe experiența și succesul
și nu există răspunsuri corecte sau greșite. Sunt clienților: Clienții continuă să fie mulțumiți de
doar afinități mai puternice și mai slabe. Astfel, Tableau. Aceasta include un scor de top din
fiecare regulă are un nivel de încredere atribuit punct de vedere al calculelor pentru obținerea de
acesteia. [10] beneficii pentru întreprinderi și cel mai mare
scor pentru activarea utilizatorilor - ambele
9. TABLEAU măsuri cheie de succes. Abilitățile tableau sunt
în mare cerere și pentru a sprijini acest Tableau
Tableau oferă o experiență intuitivă de oferă o gamă largă de variante de învățare alături
explorare interactivă bazată pe vizual care de Tableau Public, comunitatea sa online și cu
permite utilizatorilor de afaceri și oricărui autor rețeaua extinsă de parteneri. Conferința sa
de conținut să acceseze, să pregătească, să anuală de utilizare a participanților, care a
analizeze și să prezinte constatările din datele lor depășit 14.000 de participanți în 2017, este o
fără abilități tehnice sau codare. Tableau oferă dovadă suplimentară a satisfacției utilizatorilor.
trei produse de bază: Tableau Desktop, Tableau  Extinderea implementărilor și a ratelor de
Server și Tableau Online (varianta cloud). standardizare: Un număr din ce în ce mai mare
Tableau s-a angajat întotdeauna să ofere tuturor de clienți de referință de la Tableau îl utilizează
celor din întreaga companie puterea de explorare pentru a permite echipelor centralizate să
a datelor. Acesta a lansat surse de date certificate furnizeze conținut pentru consumatori într-o
manieră agilă și iterativă. Alți clienți de
și recomandate pentru o mai bună guvernanță a
referință. Dimensiunea medie a implementării
implementărilor mari. Tableau a progresat în
continuă să crească în fiecare an, deoarece
transmiterea mai bună a datelor la scară mare. organizațiile standardizează Tableau la rate mai
Noul motor Hyper in-memory al lui Tableau a mari și o desfășoară într-o mai mare măsură pe
fost lansat în ianuarie 2018, iar produsul său de întreaga întreprindere.
pregătire a datelor Project Maestro este acum în
 Opțiuni de implementare flexibile: Tableau care este interogat direct de la Tableau. Noua
poate fi implementat în Cloud, Online sau local. bază de date Hyper in-memory este de așteptat
Tableau a fost la începutul Cloud, inițial să îmbunătățească semnificativ performanța în
bazându-se pe desfășurarea în propriile centre de extractele mari de date din memorie.
date. Opțiunile de implementare a cloud-ului au Instrumentul autonom de pregătire a datelor
evoluat și pentru a oferi mașini virtuale, pentru a Tableau (denumit cod Project Maestro) este în
simplifica implementarea. În ultimul an, a prezent în versiune beta și este destinat să
adăugat suport pentru platforma Google Cloud, ușureze utilizatorului să modeleze și să
precum și suport hibrid de date pentru sursele armonizeze date mari și complexe fără a recurge
localizate din cloud. la un alt instrument.
Dezavantajele sunt:  Viziune asupra produsului: Tableau investește,
 Integrarea pieței: Explorarea datelor bazate pe dar nu conduce, următorul val de inovație
vizual este oferită în prezent de către majoritatea perturbatoare. Marea majoritate a investițiilor
jucătorilor de pe această piață. Reducerea făcute în foaia de parcurs a produselor se
presiunii de preț de la opțiunile de licență cu concentrează pe reducerea decalajelor din
costuri reduse afectează mediul concurențial. caracteristicile întreprinderii și a extensibilității,
Acest lucru a provocat o creștere a concurenței și implementarea flexibilă, inclusiv cloud,
a unei concurențe sporite și a unor contracte de sprijinirea seturilor de date mai mari și mai
întreprinderi, deoarece se limitează diferențierea complexe, și facilitarea paradigmei de explorare
caracteristicilor, creșterea opțiunilor competitive vizuală. [15] [16] [17]
și a caracteristicilor întreprinderilor și a prețului
față de valoarea în decizia de cumpărare decât 10. CONCLUZII
înainte. Deși Tableau continuă să atragă noi În această lucrare au fost prezentate
clienți și să extindă dimensiunile de conceptele de business intelligence, au fost
implementare, acest mediu concurențial intens a descrise instrumentele folosite, arhitectura DW,
contribuit la creșterea lentă a veniturilor de la
cateva concepte despre data mining (colectarea,
Tableau în ultimii ani.
curățarea și pregatirea datelor), tehnici de data-
 Prețul și pachetul oferit: Costul licenței
mining și a fost prezentat tool-ul de Tableau ce
software, în special deoarece opțiunile cu costuri
reduse cresc și se îmbunătățesc, continuă să fie o servește ca instrument de BI pentru vizualizarea
provocare pentru Tableau. Unul dintre locurile datelor. De asemenea, au fost discutate două
slabe ale lui Tableau în scorurile de referință ale instrumente puternice ce determină dezvoltarea
clienților se axează pe costul licenței Prețurile la și productivitatea afacerilor. Primul instrument
intrarea pe piață la prețuri scăzute sunt din ce în se referă la data mining care este folosit pentru a
ce mai atractive pentru cumpărătorii cu o manevra cantităti mari de date și al doilea este
maturitate mai puțin analitică, în special pentru conceptul de business intelligence care se
implementarea unor întreprinderi mari, cu un folosește pentru realizarea unor decizii relevante
procent ridicat de consumatori. pe baza unor analize de business.
 Lipsa suportului complex al modelului de date:
Organizațiile caută intuiții din combinații mai
mari și mai variate de date, care necesită modele
de date mai complexe. În timp ce o gamă largă
de opțiuni de conectivitate a surselor de date
sunt suportate de Tableau, modelarea complexă
a datelor trebuie să fie creată fie în afara Tableau
într-un depozit de date, fie prin intermediul
partenerilor de pregătire a datelor de auto-
service. Mai mult decât atât, performanța slabă
pentru extractele mari în memorie necesită
deseori modelarea într-un depozit de date separat
11.BIBLIOGRAFIE [17]https://help.talend.com/reader/
93olCfmQi615MRwYBjy30g/
[1] Alan Simon, 2014, Enterprise Business 0jR_lL3USb1L51fZ1wZ4ig
Intelligence and Data Warehousing, ISBN:
9780128017463
[2] Andrew J Oppel, 2009, Databases: A
Beginner's Guide, ISBN: 9780071608466
[3] Rick Greenwald, Joseph Rayman, Robert
Stackowiak, 2007, Oracle® Data Warehousing
and Business Intelligence Solutions, Oracle®
Data Warehousing and Business Intelligence
Solutions
[4] Ahmed Sherif, 2016, Practical Business
Intelligence, ISBN: 9781785885433
[5] David Loshin , 2012, Business Intelligence,
2nd Edition, ISBN: 9780123858900
[6] Peter C. Bruce, Nitin R. Patel, Galit Shmueli,
2010, Data Mining For Business Intelligence:
Concepts, Techniques, and Applications in
Microsoft Office Excel® with XLMiner®,
Second Edition, ISBN: 9780470526828
[7] https://www.quora.com/What-is-the-first-
step-to-understand-Business-Intelligence-and-
perform-Data-Analysis
[8]https://en.wikipedia.org/wiki/
Online_analytical_processing
[9] https://www.edureka.co/blog/talend-etl-tool/
[10] Lyndsay Wise , 2012, Using Open Source
Platforms for Business Intelligence, ISBN:
9780124158764
[11] Paul Turner, Debra Paul, James Cadle,
2014, Business Analysis Techniques: 99
essential tools for success - 2nd edition, ISBN:
9781780172736
[12] Daniel T. Larose, Chantal D. Larose, 2015,
Data Mining and Predictive Analytics, 2nd
Edition, ISBN: 9781118116197
[13] Vicki L. Sauter, 2010, Decision Support
Systems for Business Intelligence, Second
Edition, ISBN: 9780470433744
[14] Wagner Meira Jr, Mohammed J. Zaki, 2014,
Data Mining and Analysis, ISBN:
9781107779105
[15] Donabel Santos , 2016, Tableau 10
Business Intelligence Cookbook, ISBN:
9781786465634
[16] Micheline Kamber, Jian Pei, Jiawei Han,
2011, Data Mining: Concepts and Techniques,
3rd Edition, ISBN: 9780123814807

S-ar putea să vă placă și