Documente Academic
Documente Profesional
Documente Cultură
Curs 9
1. Data mining - definire
2. Data mining și personalizarea
3. Web Usage Mining
4. Tipuri de tehnici data mining pentru e-commerce
5. Tipuri de reguli data mining pentru e-commerce
6. Studiu de caz: ebay
Definiție generală
Astfel datele unui site web pot fi “săpate” astfel încât să se poată dezvolta
profile ale vizitatorilor și ale clienților.
- orice tranzacție financiară ce are loc este procesată de o aplicație data mining
pentru detectarea fraudelor.
- Companiile de telefonie mobilă monitorizează îndeaproape utilizarea
telefoanelor mobile pentru a detecta șabloane tipice telefoanelor furate sau a
apelurilor telefonice neobișnuite.
TRANSFORMAREA DATELOR
D
A
T APLICAREA TEHNICILOR DE DATA MINING
A
DETERMINAREA DE ȘABLOANE ȘI MODELE
M
I INTERPRETAREA ȘI EVALUAREA DATELOR
N
I OBȚINEREA INFORMAȚIILOR DORITE
N
G
❑ Datale de intrare se pot găsi într-o varietate de formate: fișiere text, baze de
date relaționale, date semistructurate (de exemplu XML, HTML), imagini,
filme etc.
❑ Datele se selectează din întreaga colecție de surse.
❑ Preprocesarea și transformarea datelor sunt etape ce pot fi realizate chiar și în
60% din timpul total al unui proces de extragere a informațiilor relevante.
❑ Există numeroase tehnici de data mining și, de multe ori, sunt testate mai
multe metode astfel încât să se ajungă la o performanță ridicată.
❑ La final, informațiile rezultate sunt post-procesate, eliminându-se astfel
rezultatele invalide sau neintersante. Forma de prezentare poate fi sub formă
de reguli sau integrate în alte sisteme (de exemplu un sistem pentru
detectarea fraudelor).
Data mining și personalizarea
O sesiune (sesiune a server-ului) reprezintă totalitatea paginilor unui site web din cadrul
unei sesiuni de utilizator.
Fiecare click de mouse corespunde unei cereri de pagina web, succesiunea click-urilor
corespunde astfel succesiunii link-urilor. Analiza fluxului click-urilor succesive poate fi
folosită pentru a înţelege cea mai probabilă cale de navigare într-un site web cu scopul
previziunii online a paginilor pe care un vizitator le va accesa dată find succesiunea
link-urilor (calea) pe care a urmat-o până atunci.
Tipuri de analiză a click-streamurilor:
Ex: Care este relația dintre un moment al zilei și cumpararea unor anumite produse?
…se explorează data warehouse și se realizează o tabelă ordonată cu primele 10
produse vândute în fiecare oră a zilei. Astfel vânzătorul poate să schimbe conținutul
site-ului pentru a stimula vânzările, reliefând anumite produse în anumite momente
de timp sau plasând anumite produse în pagina principală care se schimba în funcție
de momentul zilei.
Implică utilizarea unui model care analizează variabilele de interes și astfel se iau
anumite decizii.
Ex: Utilizatorii care au cheltuit aproximativ 50 Euro în urma unei vizite pe site și
au vizualizat articole pentru călătorie, vor avea afișate și oferte de excursii.
1. Căutarea de produse
2. Recomandarea de produse
3. Detectarea produselor similare
4. Detectarea fraudelor
5. Business Intelligence
1. Căutarea de produse =“sortarea” produselor în funcție de
popularitate. (product ranking)
Rank-ul unui produs crește în funcție de:
- numărul de vizualizări
- numărul de articole vândute
2. Recomandarea de produse
Se creează anumite pattern-uri de utilizatori.
Se recomandă cele mai populare produse vizualizate de utilizatorii din
aceeași categorie cu tine.
3. Produse similare.
Se analizează:
▪ Proprietățile produsului
▪ Gama de prețuri
▪ User-ii din aceeași categorie cu utilizatorul subiect ce au fost atrași