Sunteți pe pagina 1din 1

Data Mining vs.

OLAP
Data mining si OLAP (Online Analytical Processing) sunt doua tehnologii comune ale
Business Intelligence (BI). Business intelligence se refera la metode bazate pe calculator pentru
identificarea si extragerea de informatii utile din datele de afaceri. Data mining este campul din
informatica ce se ocupa cu extragerea modelelor interesante din seturi mari de date. Acesta
combina mai multe metode din inteligenta artificiala, statistici si managementul bazelor de date.
OLAP (procesare analitica online), dupa cum sugereaza si numele, este o compilatie de moduri
de interogare a bazelor de date multidimensionale.
Data mining este, de asemenea, cunoscut sub numele de Knowledge Discovery in Data
(KDD). Dupa cum am mentionat mai sus, este un camp din informatica, care se ocupa cu
extragerea de informatii anterior necunoscute si interesante din datele brute. Din cauza cresterii
exponentiale a datelor, in special in domenii cum ar fi afacerile, data mining a devenit un
instrument foarte important pentru a converti acest numar mare de date in business intelligence,
deoarece extragerea manuala de modele a devenit aparent imposibila in ultimele decenii. De
exemplu, acesta este n prezent utilizat pentru diverse aplicatii, cum ar fi analiza de retea sociala,
de detectare a fraudelor si marketing. Data mining, se ocup de obicei, cu urmatoarele patru
activitai: gruparea, clasificarea, regresia si asocierea. Gruparea este identificarea grupurilor
similare din date nestructurate, clasificarea este invatarea regulilor care pot fi aplicate la noile
date si va include de obicei urmtoarele etape: preprocesarea de date, proiectarea, modelarea,
caracteristica de selectie si evaluare/validare. Regresia este gasirea functiilor cu erori minime la
modelele de date. Iar asocierea este in cautarea de relatii intre variabile. Data mining este utilizat
de obicei pentru a raspunde la intrebari cum ar fi: care sunt principalele produse care ar putea
ajuta sa se obtina profit mare anul viitor la Carrefour.
OLAP este o clasa de sisteme, care furnizeaza raspunsuri la interogari multidimensional.
OLAP de baza este folosit pentru marketing, bugetare, prognozare si aplicatii similare. Se
subintelege ca bazele de date utilizate de OLAP sunt configurate pentru interogari complexe si
ad-hoc, cu o performanta rapida. De obicei, o matrice este utilizata pentru a afisa datele de iesire
ale un OLAP. Randurile si coloanele sunt formate din dimensiunile de interogare. Acestea
folosesc adesea metodele de agregare pe mai multe tabele pentru a obtine rezumate. De exemplu,
acesta poate fi utilizat pentru a afla detalii despre vanzarile din acest an la Carrefour, comparativ
cu anul trecut?Care este previziunea vanzarilor in urmatorul trimestru? Ce se poate spune despre
tendinta, uitandu-ne la modificarea procentuala?
Desi este evident ca Data mining si OLAP sunt similare deoarece opereaza pe date pentru
a obtine informatii, principala diferenta vine de la modul in care acestea opereaza pe date.
Instrumentele OLAP furnizeaza analiza de date multidimensionale si le ofera rezumate ale
datelor, in contrast cu Data mining, se concentreaza pe rapoarte, modele si influente in setul de
date. O diferenta notabila este ca, in timp ce instrumentele Data mining modeleaza datele si
returneaza reguli de actionarii, OLAP va efectua tehnici comparatie si contrastare de-a lungul
dimensiunii afacerilort in timp real.

S-ar putea să vă placă și