Post on 03-Jan-2016
description
Sisteme de recomandare
Lupuleţ CorneliuNeculciu FilipVelişcu Ovidiu
Ţambrea ConstantinTăbărana Cristian
Un sistem de recomandare este un instrument care încearcă să prezinte utilizatorilor, obiecte şi noţiuni de interes pentru aceştia (filme, muzică, ştiri, imagini, persoane).
Sisteme de recomandare
Recomandarea se face pe baza cunoaşterii (explicită sau implicită) a profilului utilizatorului (modelul de preferinţe)
Descriere formală
• U mulţimea utilizatorilor• A mulţimea articolelor cunoscute de sistem (şi care pot fi
recomandate)• funcţie care măsoară interesul unui utilizator
pentru un anumit articol
Scopul
De a estima cât mai bine această funcţie în punctele în care nu este definită, adică de a prezice ce anume este posibil să-i placă (şi cât de mult) unui utilizator ale cărui “gusturi” apreciem că sistemul le cunoaşte.
Clasificare
Construirea profilului utilizatorului se poate face în mod:o explicit - sistemul cere informaţii de la utilizatori
(ex: note acordate filmelor)o implicit - prin analiza articolelor sau paginilor web vizitate
În funcţie de tehnica de estimare folosită, existăo recomandări bazate pe conţinut o recomandări colaborative
Filtrare colaborativă:o utilizatoro articolo atribut
Probleme
La sistemele bazate pe filtrare colaborativă centrată pe utilizatori există două probleme bine-cunoscute:
• First-Rater Problem - Problema articolelor nou introduse în baza de date;
• Cold-Start Problem - Problema utilizatorilor nou veniţi în sistem
Item-based filtering
• Filtrare user-based - probleme de scalabilitate
• Item-based - avantaj - procesul de determinare a similarităţii între articole poate fi independent de cel de prezicere (recomandare) şi poate fi realizat offline.
• Poate fi îmbunătăţit cu informaţii semantice provenite din alte surse (ex: ontologii specifice domeniului)
• Se poate folosi tehnica "Latent Semantic Indexing" (LSI) pentru reducerea dimensiunii matricii iniţiale (item, item) la un grup restrâns de atribute strâns corelate.
- Google News - Amazon - Yahoo Movies! - iTunes - Youtube - StumbleUpon - Photoree - BookLamp
Exemple de Sisteme
Crearea unui profil
Probleme:• sistemul are nevoie de multe
informații pentru a funcționa cu o precizie acceptabilă
• utilizatorul nu are: o timpulo dorințao cunoștințeleo să dea explicit toate informațiile
de care sistemul are nevoie
Solutia Google: Web History
Web History este o facilitate introdusă de Google pentru a reţine ce pagini a vizitat utilizatorul.
Avantaje/Dezavantaje
Avantaje:• adună date foarte repede• odată format, sistemul este foarte stabil -
anomaliile de comportament cauzate de curiozitate, greșeli, etc. au efect neglijabil
Dezavantaje:• cold-start - sunt prezentate subiectele cele mai
populare, nu neapărat cele mai interesante pentru utilizatorul curent
• funcționează doar dacă utilizatorul e logat pe contul de google și a activat Web History
• poate fi lent in detectarea schimbărilor de preferințe
StumbleUpon
• comunitate Web• facilitează descoperirea de site-uri• sistem de recomandare bazat pe utilizator• peers (utilizatori cu "gusturi" similare)• friends (aleşi de utilizator)• filtrare colaborativă (eng. "colaborative filtering")• automatizează "word of mouth"
Principiile sistemului
Filtrare colaborativă bazată pe utilizator
Avantaje / dezavantaje
Avantaje:• viteza• practic pentru număr uriaş de site-uri comparativ cu analiza
de conţinut
Dezavantaje:• "First-Rater" problem• "Cold-Start" problem• rating-uri subiective
Exemplu de utilizare
Yahoo Movies!
Industria filmelor este foarte vastă. Din acest motiv, a fost necesar un algoritm de recomandare diferit, optimizat şi pentru filme vizionate de către puţini utilizatori. Sistemul folosit de Yahoo Movies! se bazează pe motorul de recomandare făcut de Choice Stream: Modelarea bayesiană a preferinţelor pe baza atributelor (eng. Attributed Bayesian Choice Modelling).
Attributed Bayesian Choice Modelling
Avantaje/dezavantaje
Avantaje:
o "First-Rater" Problem dispareo "Cold-Start" Problem este atenuată o Eficienta recomandărilor
Dezavantaje:
o Alegerea valorilor atributelor este subiectivă
Exemple de utilizare - Yahoo Movies!
Genius
• Genius este un feature introdus în aplicaţia iTunes începând cu versiunea 8
• generează automat o listă de melodii similare cu melodia curentă
• pentru utilizare este nevoie de cont iTunes• Genius va colecta periodic informaţiile legate de utilizator şi
bibliotecile personale de melodii şi le va trimite în mod anonim la baza de date Apple
• Genius analizează metadatele melodiilor(ritmul, ratingurile, poziţia în playlisturi)
• se presupune ca Genius creează amprenta acustică a melodiilor
• strategie comercială
Mod de Utilizare
Avantaje/Dezavantaje
Avantaje:• Genius este un feature util userilor care vor să asculte
melodii "înrudite" sau chiar să le cumpere Dezavantaje:• trimiterea datelor în anonimat reduce Genius doar la un
sistem bazat pe itemi• înclinatie spre comercial şi nu spre utilizator
Bibliografie
Semantically Enhanced Collaborative Filtering on the Web:http://maya.cs.depaul.edu/~mobasher/papers/ewmf04-web/ewmf04.html
Item based collaborative filtering recommendation algorithms:http://www.cs.tau.ac.il/~fiat/dmsem03/ItemBasedCollaborativeFilteringRecommendationAlgorithms.ppt
StumbleUpon's recommendation technology:http://www.stumbleupon.com/technology/
Google Newshttp://www.searchenginejournal.com/google-news-adds-most-popular-recommended-sections/2809/
Collaborative Filtering vs Attributed Bayesian Choice Modellinghttp://behavioraltargeting.info/downloadattachment.php?aId=cf74d490a8b97edd535b4ccdbfd0df55&articleId=31
Vă Mulţumim!
Întrebări ?