Documente Academic
Documente Profesional
Documente Cultură
Sisteme de gestiune a
cunotinelor i Data Mining
Introducere.
Data Mining i KDD
Prezentare elaborat de lect. sup. RUSU Viorel
29 octombrie 2012
Masterat TI
Introducere. Data Mining i KDD
Prezentare elaborat de lect. sup.
RUSU Viorel
Structura cursului
Ore de Curs : prezentm, ascultm,
punem ntrebri, rspundem
Ore de laborator: implementm,
testm, prezentm rapoarte i le
susinem
Lucrare de curs: alegem tema,
studiem/cercetm, susinem
Examen(scris): demonstrm c nc 3
sptmni de studii nu au trecut n
zadar i primim aprecieri
2
Introducere. Data Mining i KDD
Prezentare elaborat de lect. sup.
RUSU Viorel
Orar
l m m j v s
sapt. 1
c (505) c (505) l* (505) c (505)
sapt. 2 c (505) l (501) l (501) l (501) c (505)
sapt. 3 c (505) l (501) l (501) l (501) c (505) c**(505)
3
Orele de desfurare: 18:00-20:00
* ntlnire cu toata grupa la primul laborator
** ntlnire recapitulativ final; susinere complet a
lucrrilor de laborator (orele 9-12)
Introducere. Data Mining i KDD
Prezentare elaborat de lect. sup.
RUSU Viorel
Resurse
4
Pagina cursului:
http://francophonie.utm.md/master_info/
Utilizator: student
Parol: master_TI_2012
Introducere. Data Mining i KDD
Prezentare elaborat de lect. sup.
RUSU Viorel
5
1. Introducere. Data mining i KDD
2. Descrierea conceptelor caracterizare i
comparaie
3. Depozite de date i tehnologii OLAP
4. Preprocesarea datelor
5. Descoperirea regulilor de asociere (analiza
asocierilor)
6. Clasificare i predicie
7. Clusterizare (analiza clusterilor)
8. Standarde i software data mining ODM,
Microsoft OLE DB
9. Aplicaii i tendine in data mining
Planul cursului:
Introducere. Data Mining i KDD
Prezentare elaborat de lect. sup.
RUSU Viorel
Introducere. Data Mining i KDD
Datele, Informaia, Cunotinele
Ce sunt datele?
Ce este informaia?
Ce sunt cunotinele?
Ce este Data Mining?
Ce este KDD?
6
Introducere. Data Mining i KDD
Prezentare elaborat de lect. sup.
RUSU Viorel
Introducere. Data Mining i KDD
Datele, Informaia, Cunotinele
Datele
nite nouti cu o via scurt
nite note temporale
nite simboluri
Informaia
date semi-structurate (agregate),
care pot servi drept baz pentru
luarea anumitor decizii
semnal material capabil s
declaneze o reacie a unui sistem.
7
Introducere. Data Mining i KDD
Prezentare elaborat de lect. sup.
RUSU Viorel
Introducere. Data Mining i KDD
Datele, Informaia, Cunotinele
Cunotinele
posedarea unor informaii speciale;
rezultatul prelucrrii informaiei, ce
definete o anumit idee i determin
un context;
faptul de nelegere: perceperea clar
a adevrului
Cunotinele sunt puterea!
8
Introducere. Data Mining i KDD
Prezentare elaborat de lect. sup.
RUSU Viorel
Introducere. Data Mining i KDD
Datele, Informaia, Cunotinele
9
Date Informaie Cunotine
Preprocesare Analiz
Informaia e ceea ce poate avea
atribuie la soluionarea problemei, iar
cunotinele sunt ceea de ce e nevoie
pentru soluionarea problemei
Relaia Date-Informaii-Cunotine:
Introducere. Data Mining i KDD
Prezentare elaborat de lect. sup.
RUSU Viorel
Introducere. Data Mining i KDD
Tipuri de Cunotine
Explicite : uor se reprezint cu date
clare, mesaje, cuvinte i cifre.
Tacite : greu de redat, des se includ n
intuiie i n experiene, deprinderi sau
obiceiuri ce nu se supun unei analize.
10
Introducere. Data Mining i KDD
Prezentare elaborat de lect. sup.
RUSU Viorel
Introducere. Data Mining i KDD
Tipuri de Cunotine
Gestiunea Cunotinelor:
Crearea: obinerea noilor cunotine.
Identificarea: din cunotine tacite n explicite
Organizarea: clasificarea i categorizarea
Accesul: transmiterea i rspndirea cunotinelor
Folosirea: aplicarea cunotinelor pentru luarea
deciziilor
11
Domeniul afacerilor (cadrul corporativ):
Externe: cunoaterea clientului, informaii
analitice independente.
Interne: de producere, a personalului, experiena
ntreprinderii, active intelectuale, etc.
Introducere. Data Mining i KDD
Prezentare elaborat de lect. sup.
RUSU Viorel
Introducere. Data Mining i KDD
Ce este Data Mining?
12
Cteva definiii:
Data Mining (explorarea datelor) definete
procesul de descoperire a modelelor de
cunotine i/sau informaii utile dintr-o
cantitate mare de date, colectate si stocate
n diferite tipuri de depozite de date (baze
de date, data warehouses, WWW etc.)
Data Mining este o etap din procesul de
extragere a cunotinelor, care consist n
aplicarea algoritmilor de analiz a datelor.
Introducere. Data Mining i KDD
Prezentare elaborat de lect. sup.
RUSU Viorel
Introducere. Data Mining i KDD
Ce este Data Mining?
13
Etapele procesului de
descoperire a cunotinelor
Introducere. Data Mining i KDD
Prezentare elaborat de lect. sup.
RUSU Viorel
Introducere. Data Mining i KDD
Ce este KDD?
14
The non-trivial process of identifying
valid, novel, potentially useful, and
ultimately understandable patterns in
data.
Fayyad, U. M.; Piaetsky-Shapiro, G.; Smyth, P. 1996. From
Data Mining to Knowledge Discovery: An Overview. In ,
Advances In Knowledge Discovery and Data Mining.
AAAI/MIT press, Cambridge mass.
Traducere liber: Proces netrivial de
identificare n date a abloanelor valide,
novatoare, potenial utilizabile i
inteligibile.
Introducere. Data Mining i KDD
Prezentare elaborat de lect. sup.
RUSU Viorel
Introducere. Data Mining i KDD
Ce este KDD?
15
Descoperirea cunotinelor i data mining-ul
au emers ca un domeniu interdisciplinar
aflat ntr-o dezvoltare rapid ce fuzioneaz
baze de date, statistici, domenii de
activitate aflate n strns legtur n
dorina de a extrage informaii valoroase si
cunotine ntr-un volum ct mai mare.
Exist o diferen n nelegerea termenilor
descoperire de cunotine i data
mining.
Introducere. Data Mining i KDD
Prezentare elaborat de lect. sup.
RUSU Viorel
Introducere. Data Mining i KDD
Ce este KDD?
16
Descoperirea cunotinelor (Knowledge
Discovery) n baza de date este un
proces de identificare a unor
modele/abloane de date valide,
novatoare, folositoare si, n ultima
msura, de neles.
Data mining este un pas n procesul de
descoperire a informaiei constnd ntr-un
set de algoritmi care, n limitele accep-
tate, descoper abloane (patterns)
semnificative n structura datelor.
Introducere. Data Mining i KDD
Prezentare elaborat de lect. sup.
RUSU Viorel
Introducere. Data Mining i KDD
Ce este KDD?
17
Knowledge Discovery in Databases
Knowledge Discovery from Data
Data miningcore of knowledge discovery
process, deci KDD = Data Mining
Knowledge extraction
Knowledge mining from databases
Information discovery
Exploratory data analysis
Data archeology
Data pattern analysis
Intelligent Data Analysis
Introducere. Data Mining i KDD
Prezentare elaborat de lect. sup.
RUSU Viorel
Introducere. Data Mining i KDD
De ce Data Mining?
18
Cretere exploziv a datelor : de la terabytes la petabytes
Colecii de date i date disponibile
Colecii de date automatizate, sisteme de baze de
date, Web, societate computerizat
Surse majore de date abundente