Sunteți pe pagina 1din 19

DATA MINING

TEHNOLOGII DEDICATE EXTRAGERII


CUNOSTINTELOR

OBIECTIVE
nsusirea

tehnologiei
Data Mining de
extragere a
cunostintelor din
colectiile de date
existente

OBIECTIVE

nsusirea unor tehnici Data Mining pentru


obtinerea unor solutii n cadrul problemelor
decizionale.

CUM A APARUT DATA MINING?


Mineritul de date(data mining) s-a
dezvoltat ca o consecinta a disponibilizarii
marilor rezervoare de date. Pentru stocarea lor
au nceput sa se foloseasca depozitele de date
(data warehouses).
Mineritul de datea aparut ca raspuns la
provocarile cu care s-a confruntat comunitatea
specialistilor n baze de date, care se ocupau cu
cantitati masive de date, aplicarea analizei
statistice si aplicarea tehnicilor de cautare,
specifice inteligentei artificiale asupra datelor.

CE ESTE DATA MINING?


Data miningeste
procesul prin care
informatiile si
cunostintele sunt
extrase din volumele
mari de date folosind
tehnici care sunt mai
mult dect o simpla
cautare n date.

DATA MINING
Informatiile care se pot obtine prin Data Mining sunt
predictive sau descriptive.
De exemplu:

directionarea actiunilor
de marketing poate
constitui o problem
tipic predictiv.
detectarea fraudelor
produse cu carduri
bancare reprezint o
problem tipic de
aplicatie descriptiv

DATA MINING

DATA MINING

Depozitele de date (data warehouses) pot fi surse


pentru Data Mining, iar rezultatele obtinute pot
completa cmpurile nregistrrilor din depozitele de
date, care apoi pot fi valorificate prin proiectiile
multidimensionale specifice OLAP(online analytical
processing).

DATA MINING

De multe ori, actiunea de Data Mining poate fi un esec


si nu o reusit, fiind posibil ca msurile luate s nu fie
adecvate informatiilor obtinute.

EXPLORAREA DATELOR CONTINUT SI ETAPE

Tehnicile de Data Mining se pot utiliza


numai n procese specifice complexe si
de cele mai multe ori neliniare. Se pot
astfel distinge etapele:
definirea problemei
identificarea surselor de date
colectarea si selectarea datelor
pregtirea datelor
definirea si construirea modelului
evaluarea modelului
integrarea modelului

EXPLORAREA DATELOR CONTINUT SI ETAPE

EXPLORAREA DATELOR CONTINUT SI ETAPE

DEFINIREA PROBLEMEI

Definirea problemei
const n sesizarea unei
oportunitti sau
necesitti de afaceri.

EXPLORAREA DATELOR CONTINUT SI ETAPE

IDENTIFICAREA SURSELOR DE DATE

Identificarea surselor de date


const n stabilirea structurii
generale a datelor necesare
pentru rezolvarea problemei,
precum si regulile de constituire
a acestora si localizarea lor.

EXPLORAREA DATELOR CONTINUT SI ETAPE

COLECTAREA SI SELECTAREA DATELOR

Colectarea si selectia datelor este etapa n care


se face extragerea si depunerea ntr-o baz
comun a datelor care urmeaz a fi utilizate
ulterior.
Aceast etap ocup un timp
mare, cam 80% din timpul
total, iar existenta depozitelor
de date constituie un real
avantaj.

EXPLORAREA DATELOR CONTINUT SI ETAPE

PREGATIREA DATELOR
Datele sunt de obicei stocate n colectii de date
care au fost construite pentru alte scopuri. De
aceea firesc este s existe o faz preliminar de
pregtire nainte de extragere prin Data Mining.
Transformrile la care sunt supuse datele pentru
Data Mining se refer la:

valori

extreme
valori lips
valori de tip text
tabele.

EXPLORAREA DATELOR CONTINUT SI ETAPE

DEFINIREA SI CONSTRUIREA MODELULUI


Aceasta etapa se apropie cel mai mult de notiunea de
Data Mining si se refer la crearea modelului
informatic care va efectua exploatarea.
Este nsotit de faza de testare sau nvtare,
depinznd de tehnicile de Data Mining utilizate.

Invatarea presupune existenta unui set suficient de


reprezentativ de exemple complete de la care se porneste
pentru a identifica relatiile de legtur ntre valorile
cmpurilor sau atributelor.
Nu intotdeauna rezultatele procesului de invatare sunt
cele scontate si atunci modelul va fi supus testrii cu
date diferite fata de cele folosite pentru nvtare.

EXPLORAREA DATELOR CONTINUT SI ETAPE

EVALUAREA MODELULUI
Evaluarea modelului are ca scop de a determina
corect valorile pentru cazurile noi.
Procentul de eroare ce se stabileste acum va fi
considerat acceptat si pentru datele noi.

EXPLORAREA DATELOR CONTINUT SI ETAPE

INTEGRAREA MODELULUI

Integrarea modelului este etapa n care se finalizeaz


procesul, prin ncorporarea modelului n SIAD(Decision
Support Systems) ca element de baz, sau prin
includerea sa ntr-un proces decizional general din
organizatie.

CONCLUZIE

Pentru a concluziona, instrumentele de minerit


de date sunt orientate catre a obtine abilitati de
analiza multimedia si capabilitati de analizare
simultana a numeroase tipuri de baze de date.