Documente Academic
Documente Profesional
Documente Cultură
Web Mining
Bibliografie
1/ 19
Data Mining
Web Mining
Bibliografie
Cuprins
Data Mining
Definitie
Etape implicate n descoperirea de cunostinte
Metode de analiza specifice Data Mining
Exemple
Web Mining
Definitii si concepte generale
Tehnici de analiza specifice Web Mining
2/ 19
Data Mining
Web Mining
Bibliografie
Definitie
Descoperirea de cunostinte
Definitie
Descoperirea de cunostinte (data mining sau knowledge discovery) nseamna
extragerea informatiilor (cunostintelor) interesante netriviale, eventual implicite,
necunoscute anterior si potential utile sau descoperirea de tipare printre datele
stocate n baze de date sau n alte forme de stocare.
Observatii
Interpretarea solutiilor oferite este strict dependenta de domeniul de
aplicabilitate.
Este important de stiut ca[6]:
Data mining is a tool, not a magic wand. It wont sit in your
database watching what happens and send you e-mail to get your
attention when it sees an interesting pattern. It doesnt eliminate
the need to know your business, to understand your data, or to
understand analytical methods.
RIWeb 2014 2015/C10: Data/Web Mining
3/ 19
Data Mining
Web Mining
Bibliografie
Cur
atarea datelor: colectarea informatiilor necesare pentru modelarea sau
recunoasterea zgomotelor, nlaturarea acestor zgomote si a datelor ce nu
furnizeaza informatii relevante, generarea de strategii pentru tratarea
campurilor de date lipsa sau incomplete.
4/ 19
Data Mining
Web Mining
Bibliografie
Analiza rezultatelor
1
5/ 19
Data Mining
Web Mining
Bibliografie
6/ 19
Data Mining
Web Mining
Bibliografie
Metode de analiz
a specifice Data Mining
7/ 19
Data Mining
Web Mining
Bibliografie
Metode de analiz
a specifice Data Mining
Regresia
Tip: analiz
a predictiv
a.
Scop: determinarea unei functii de mapare a valorilor atributelor de
interes peste valori reale pentru a prezice un anumit comportament.
Identificarea tiparelor frecvente si a regulilor de asociere
Tip: analiz
a descriptiv
a.
Scop: determinarea subseturilor ce apar mpreun
a ntr-un anumit set de
valori sau determinarea unor relatii (n mod uzual, relatii de coexistent
a)
n cadrul acelui set de valori.
8/ 19
Data Mining
Web Mining
Bibliografie
Metode de analiz
a specifice Data Mining
Analiza secventelor
Tip: analiz
a descriptiv
a.
Scopt: determinarea acelor secvente ce apar mpreun
a n cadrul unui
anumit volum de date. Spre deosebire de determinarea tiparelor frecvente, n
cadrul analizei secventelor entit
atile ce pot constitui o secvent
a nu sunt
n mod necesar omogene (nu au aceeasi semnificatie). In plus, o secventa
frecventa nu este conditionat
a de o limit
a de tip suport minim.
9/ 19
Data Mining
Web Mining
Bibliografie
Exemple
Economie
Analiza cosului de cumparaturi Ce produse sunt frecvent achizitionate mpreuna?
Tipare frecvente si reguli de asociere
Analiza dosarului de credit Este sau nu un client de ncredere?
Reguli de clasificare
Genetica
Analiza secventelor ADN Exista legaturi ntre structura ADN si predispozitia fata
de anumite boli/afectiuni?
Reguli de asociere, tipare frecvente, analiza secventelor
10/ 19
Data Mining
Web Mining
Bibliografie
Exemple
Pedagogie
Analiza situatiilor scolare Determinarea grupelor de risc sau determinarea
factorilor ce influenteaza performantele academice
Reguli de clasificare
IT
Securitatea sistemelor informatice Detectia intruziunilor
Clusterizare, reguli de clasificare
Motoare de cautare Optimizarea functionalitatii, cresterea performantelor
Regresie, clusterizare, reguli de clasificare, reguli de asociere
sau analiza grafurilor (graph mining)
11/ 19
Data Mining
Web Mining
Bibliografie
12/ 19
Data Mining
Web Mining
Bibliografie
Definitie
WEB Mining reprezinta procesul de utilizare a tehnicilor data mining
(extragerea automata/semi-automata de cunostinte) asupra documentelor si
serviciilor WEB.
Tipuri de date WEB ce pot fi analizate
date de continut:
fisiere HTML, text, XML, continut generat dinamic, continut multimedia;
date de structura:
leg
aturile dintre pagini, stuctura site-urilor/documentelor WEB;
13/ 19
Data Mining
Web Mining
Bibliografie
Tehnici de analiz
a specifice Web Mining
14/ 19
Data Mining
Web Mining
Bibliografie
Tehnici de analiz
a specifice Web Mining
Analiza continutului
Analiza paginilor WEB sau analiza unui set de rezultate tinta.
Tehnici asemanatoare cu tehnicile clasice de extragere de cunostinte n sensul
regasirii aceluiasi tip de cunostinte.
Opereaza asupra unor tipuri foarte variate de date: fisiere ascii, fisiere
imagine, video, audio, etc.
Tipuri de cunostinte ce pot fi extrase:
relatii de generalizare;
reguli de caracterizare, de clasificare sau de asociere.
15/ 19
Data Mining
Web Mining
Bibliografie
Tehnici de analiz
a specifice Web Mining
16/ 19
Data Mining
Web Mining
Bibliografie
Tehnici de analiz
a specifice Web Mining
17/ 19
Data Mining
Web Mining
Bibliografie
Tehnici de analiz
a specifice Web Mining
Implica de cele mai multe ori analiza fisierelor de tip log generate de
server-ele WEB.
Exemple:
se pot obtine informatii importante legate de ce site-uri sunt vizitate mpreun
a
de utilizatori (n cazul general) sau de grupuri de utilizatori (ca si caz
paticular) prin extragerea tiparelor frecvente si a regulilor de asociere.
18/ 19
Data Mining
Web Mining
Bibliografie
Bibliografie
1
19/ 19