Documente Academic
Documente Profesional
Documente Cultură
Razvan Stoenescu, Alexandru Marinescu, Ioana Mihaela Mihalache, Marin Ilinca, Marius Airinei,
1.determinarea parametrului K 2.calcularea dinstantelor intre item-ul cautat si celelalte elemente 3.sortarea distantelor si alegerea primelor K elemente 4. adunarea valorilor din elementele selectate 5. atribuirea itemului valoarea medie a sumei elementelor selectate
Utilizare kNN
Optimizari
metode pentru gasirea distantelor intre elemente introducerea de parametri care evidentiaza cantitatea de informatie adusa de un element metode de a selecta parametrul K
Algoritmul PageRank
1. Se stabileste setul de pagini 2. Se acorda PR egal tuturor paginilor 3. Se calculeaza PR dupa una din formulele:
unde d este un indice ce se presupune a avea valoarea 0.85, N este numarul de pagini din set, iar L(X) reprezinta numarul de linkuri externe ale paginii X.
Fie 4 pagini A, B, C si D. Initializam valorile: PR(A) = PR(B) = PR(C) = PR(D) = 0.25 --adica 1/n (1/4)
Fie ca paginile B, C si D sa aiba link catre A. Atunci: PR(A) = PR(B) + PR(C) + PR(D) = 0.75. Fie ca pagina B sa aiba link catre C, iar D catre toate celelalte 3. Atunci am avea: PR(A) = PR(B)/2 + PR(C)/1 + PR(D)/3 = 0.125 + 0.25 + 0.083 = 0.458
Algoritmul SimRank
SimRank este un algoritm folosit pentru a desemna documente/obiecte asemanatoare. Spre exemplu, atunci cand se incearca o cautare pentru un document asemanator. Acest algoritm poate conduce spre posibilitatea de a clusteriza obiectele. Un exemplu este Yahoo! Search, unde avem in bara din stanga rezultatele cautarii organizate pe categorii.
Linkuri utile:
1. http://en.wikipedia.org/wiki/PageRank 2. http://en.wikipedia.org/wiki/SimRank 3. http://en.wikipedia.org/wiki/HITS_algorithm 4. http://en.wikipedia.org/wiki/Hilltop_algorithm 5. http://en.wikipedia.org/wiki/TrustRank 6. http://en.wikipedia.org/wiki/Topic-Sensitive_PageRank 7. http://en.wikipedia.org/wiki/EigenTrust
Metrica influenei
bazat pe conexiunile dintre utilizatori se urmrete comportamentul vecinilor se selecteaz primii k vecini care au dat rating itemului m
Concluzii
influena poate varia de la un utilizator la altul chiar dac au dat acelai numr de ratinguri numrul de opinii - component important a influenei metrica propus - NUPD - independent de algoritmi