Sunteți pe pagina 1din 24

Sisteme de recomandare

Lupule Corneliu
Neculciu Filip
Velicu Ovidiu
ambrea Constantin
Tbrana Cristian

Sisteme de recomandare
Un sistem de recomandare este un instrument care
ncearc s prezinte utilizatorilor, obiecte i noiuni de interes
pentru acetia (filme, muzic, tiri, imagini, persoane).

Recomandarea se face pe baza cunoaterii (explicit sau


implicit) a profilului utilizatorului (modelul de preferine)

Descriere formal
U mulimea utilizatorilor
A mulimea articolelor cunoscute de sistem (i care pot fi
recomandate)

funcie care msoar interesul unui utilizator


pentru un anumit articol
Scopul
De a estima ct mai bine aceast funcie n punctele n
care nu este definit, adic de a prezice ce anume este posibil
s-i plac (i ct de mult) unui utilizator ale crui gusturi
apreciem c sistemul le cunoate.

Clasificare
Construirea profilului utilizatorului se poate face n mod:
o explicit - sistemul cere informaii de la utilizatori
(ex: note acordate filmelor)
o implicit - prin analiza articolelor sau paginilor web vizitate
n funcie de tehnica de estimare folosit, exist
o recomandri bazate pe coninut
o recomandri colaborative
Filtrare colaborativ:
o utilizator
o articol
o atribut

Probleme
La sistemele bazate pe filtrare colaborativ centrat pe utilizatori
exist dou probleme bine-cunoscute:
First-Rater Problem
- Problema articolelor nou introduse n baza de date;
Cold-Start Problem
- Problema utilizatorilor nou venii n sistem

Item-based filtering
Filtrare user-based - probleme de scalabilitate
Item-based - avantaj - procesul de determinare a
similaritii ntre articole poate fi independent de cel de
prezicere (recomandare) i poate fi realizat offline.
Poate fi mbuntit cu informaii semantice provenite din
alte surse (ex: ontologii specifice domeniului)
Se poate folosi tehnica "Latent Semantic Indexing"
(LSI) pentru reducerea dimensiunii matricii iniiale (item,
item) la un grup restrns de atribute strns corelate.

Exemple de Sisteme
- Google News
- Amazon
- Yahoo Movies!
- iTunes
- Youtube
- StumbleUpon
- Photoree
- BookLamp

Crearea unui profil


Probleme:
sistemul are nevoie de multe
informaii pentru a funciona cu o
precizie acceptabil
utilizatorul nu are:
o timpul
o dorina
o cunotinele
o s dea explicit toate informaiile
de care sistemul are nevoie

Solutia Google: Web History


Web History este o facilitate introdus de Google pentru a
reine ce pagini a vizitat utilizatorul.

Avantaje/Dezavantaje
Avantaje:
adun date foarte repede
odat format, sistemul este foarte stabil anomaliile de comportament cauzate de
curiozitate, greeli, etc. au efect neglijabil
Dezavantaje:
cold-start - sunt prezentate subiectele cele mai
populare, nu neaprat cele mai interesante pentru
utilizatorul curent
funcioneaz doar dac utilizatorul e logat pe
contul de google i a activat Web History
poate fi lent in detectarea schimbrilor de
preferine

StumbleUpon

comunitate Web
faciliteaz descoperirea de site-uri
sistem de recomandare bazat pe utilizator
peers (utilizatori cu "gusturi" similare)
friends (alei de utilizator)
filtrare colaborativ (eng. "colaborative filtering")
automatizeaz "word of mouth"

Principiile sistemului

Filtrare colaborativ bazat pe utilizator

Avantaje / dezavantaje
Avantaje:
viteza
practic pentru numr uria de site-uri comparativ cu analiza
de coninut
Dezavantaje:
"First-Rater" problem
"Cold-Start" problem
rating-uri subiective

Exemplu de utilizare

Yahoo Movies!
Industria filmelor este foarte vast. Din acest
motiv, a fost necesar un algoritm de recomandare
diferit, optimizat i pentru filme vizionate de ctre
puini utilizatori.
Sistemul folosit de Yahoo Movies! se bazeaz
pe motorul de recomandare fcut de Choice Stream:
Modelarea bayesian a preferinelor pe baza
atributelor (eng. Attributed Bayesian Choice
Modelling).

Attributed Bayesian Choice Modelling

Avantaje/dezavantaje
Avantaje:
o
o
o

"First-Rater" Problem dispare


"Cold-Start" Problem este atenuat
Eficienta recomandrilor

Dezavantaje:
o

Alegerea valorilor atributelor este subiectiv

Exemple de utilizare - Yahoo Movies!

Genius
Genius este un feature introdus n aplicaia iTunes
ncepnd cu versiunea 8
genereaz automat o list de melodii similare cu melodia
curent
pentru utilizare este nevoie de cont iTunes
Genius va colecta periodic informaiile legate de utilizator i
bibliotecile personale de melodii i le va trimite n mod
anonim la baza de date Apple
Genius analizeaz metadatele melodiilor(ritmul, ratingurile,
poziia n playlisturi)
se presupune ca Genius creeaz amprenta acustic a
melodiilor
strategie comercial

Mod de Utilizare

Avantaje/Dezavantaje
Avantaje:
Genius este un feature util userilor care vor s asculte
melodii "nrudite" sau chiar s le cumpere
Dezavantaje:
trimiterea datelor n anonimat reduce Genius doar la un
sistem bazat pe itemi
nclinatie spre comercial i nu spre utilizator

Bibliografie
Semantically Enhanced Collaborative Filtering on the Web:
http://maya.cs.depaul.edu/~mobasher/papers/ewmf04-web/ewmf04.html
Item based collaborative filtering recommendation algorithms:

http://www.cs.tau.ac.il/~fiat/dmsem03/ItemBasedCollaborativeFilteringRecommendationAlgorithms.ppt

StumbleUpon's recommendation technology:


http://www.stumbleupon.com/technology/

Google News

http://www.searchenginejournal.com/google-news-adds-most-popular-recommended-sections/2809/

Collaborative Filtering vs Attributed Bayesian Choice Modelling


http://behavioraltargeting.info/downloadattachment.php?aId=cf74d490a8b97edd535b4ccdbfd0df55&articleId=31

V Mulumim!
ntrebri ?

S-ar putea să vă placă și