Presentazione Laurea - Cataldo

16
Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Relatore: Chiar.mo Prof. Giovanni Semeraro Laureando: dott. Marco de Gemmis Cataldo Musto dott. Pasquale Lops Università degli Studi di Bari – Facoltà di Scienze MM.FF.NN. Corso di Laurea Specialistica in Informatica a.a 2006/2007

description

Augmenting Content-Based Recommender Systems with Tags

Transcript of Presentazione Laurea - Cataldo

Page 1: Presentazione Laurea - Cataldo

Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche

Relatore:Chiar.mo Prof. Giovanni SemeraroLaureando:dott. Marco de Gemmis Cataldo Mustodott. Pasquale LopsUniversità degli Studi di Bari – Facoltà di Scienze MM.FF.NN.

Corso di Laurea Specialistica in Informatica – a.a 2006/2007

Page 2: Presentazione Laurea - Cataldo

Sommario Estensione di un sistema di

raccomandazione Motivazioni

Web 2.0 Folksonomie

Implementazione del modello Estensione del modello di training Integrazione delle folksonomie nei profili

utente Sperimentazione

Commenti e sviluppi futuri

2/16

Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Page 3: Presentazione Laurea - Cataldo

Sistemi di raccomandazione Obiettivo

Apprendere i gusti dell’utente in uno specifico dominio e suggerirgli altri “oggetti” cui potrebbe essere interessato

ITR – Item Recommender Realizzato dall’Università di Bari Approccio Content-Based

Accuratezza predittiva soddisfacente Eredita alcuni limiti dei modelli content-based

3/16

Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Page 4: Presentazione Laurea - Cataldo

Motivazioni Limiti

In assenza di contenuto testuale, il sistema non può fornire raccomandazioni

Contenuto testuale di cattiva qualità può portare a un peggioramento dell’accuratezza predittiva

Raccomandazioni simili a contenuti precedentemente graditi dall’utente Bassa probabilità di ottenere raccomandazioni “sorprendenti”

Necessità di migliorare il modello originario del sistema di raccomandazione Eliminazione dei limiti del modello content-

based Integrazione di elementi di innovatività

Ricerca di sovrapposizioni con l’area del Web 2.0

4/16

Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Page 5: Presentazione Laurea - Cataldo

Annotazione dei contenuti della Rete Web 2.0

Sistemi di Tagging Collaborativo

Concetto chiave: Tagging L’utente fruisce contenuti (foto, video, audio, testi,

ecc.) Associa a queste risorse delle parole chiave, dette tag Tag

Vocabolario libero Informazione sul contenuto, sul contesto o percezione

soggettiva

La stessa risorsa può essere annotata da vari utenti Al crescere degli utenti, cresce anche il numero dei tag

associati ad una risorsa

5/16

Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Page 6: Presentazione Laurea - Cataldo

Folksonomie (1) L’insieme dei tag associati ad una risorsa

prende il nome di folksonomia La folksonomia è una struttura lessicale Emerge dalle annotazioni collaborative degli utenti

es) Immaginiamo come risorsa un brano musicale

6/16

Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Page 7: Presentazione Laurea - Cataldo

Folksonomie (2) Punti di forza

Ci fornisce informazioni sul modello mentale degli utenti Cosa gli utenti “vedono” in ciò che fruiscono

Associa una semantica ai contenuti della Rete Semantica collaborativa, non espressa formalmente

Una folksonomia ci permette di acquisire delle informazioni sul contenuto associato ad una risorsa

Riflessione La correlazione tra tag e contenuto associato ad una

risorsa ci riporta alle motivazioni che avevano giustificato la necessità di estendere il modello

7/16

Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Page 8: Presentazione Laurea - Cataldo

Estensione del modello di ITR Assunzione

I tag non sono dei semplici metadati, forniscono informazioni sul contenuto

Intuizione Quando il contenuto non è disponibile o non è affidabile,

si può sfruttare l’informazione lessicale fornita dai tag

Vantaggi Ci permette di ovviare al problema dell’assenza di

contenuti testuali Si utilizzano i tag forniti dalla comunità come “contenuto” che descriva

gli oggetti raccomandabili Riduce il “peso” di contenuti testuali di cattiva

qualità Probabile miglioramento dell’accuratezza predittiva

Diversifica potenzialmente le raccomandazioni Il set di termini che descrivono l’oggetto è dinamico, si evolve

assieme alle annotazioni fornite dagli utenti

8/16

Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Page 9: Presentazione Laurea - Cataldo

Scenario Raccomandazione di beni museali

Pinacoteca Vaticana Oggetti descritti da contenuto testuale

Titolo, Autore, Descrizione Necessità di raccogliere un set di tag che modelli le

opere

Come raccogliere una massa sufficiente di tag? Integrando dei meccanismi di collaboratività nel

modello di raccomandazione Coinvolgendo gli utenti nell’annotazione degli oggetti Estensione del modello di addestramento

9/16

Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Page 10: Presentazione Laurea - Cataldo

Modello di addestramento

Si è previsto che l’utente, assieme al

voto, potesse assegnare dei tag

descrittivi

Si è previsto che l’utente, assieme al

voto, potesse assegnare dei tag

descrittivi

10/16

Assegnazione del rating – Classico modello di

addestramento

Assegnazione del rating – Classico modello di

addestramento

Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Contenuti testualiContenuti testuali

Page 11: Presentazione Laurea - Cataldo

Disambiguazione dei contenuti Terminata la procedura di addestramento,

abbiamo a disposizione l’insieme dei tag con cui l’utente ha annotato le opere gradite

Per eliminare problemi di sinonimia, polisemia, ecc. il set dei tag è stato sottoposto ad una procedura di disambiguazione Passaggio dal Tag al concetto espresso da

quel tag Passaggio da Folksonomie a Folksonomie

Semantiche

11/16

Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Page 12: Presentazione Laurea - Cataldo

Integrazione delle folksonomie Come integrare nei profili l’informazione

aggiuntiva ? Individuazione di due modelli di profilazione

Personal Tags Confluiscono nel profilo dell’utente 1 i tag virgin, crowning, christ

Social Tags Il profilo viene arricchito dai tag utilizzati dalla comunità, al

profilo vengono aggiunti i tag madonna, panel, cross, deposition

12/16

Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Page 13: Presentazione Laurea - Cataldo

Integrazione delle folksonomie13/16 Intuizione

Se a due utenti piacciono gli stessi oggetti, per certi versi condividono lo stesso modello mentale

L’informazione lessicale fornita da utenti con lo stesso modello mentale può essere condivisa collaborativamente

Si sfrutta il lessico fornito da utenti con gusti simili per arricchire la terminologia contenuta nel proprio profilo

Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Page 14: Presentazione Laurea - Cataldo

Sperimentazione Campione di trenta utenti Valutazione del nuovo modello di ITR Confronto tra tre classi di profili

Content-based Titolo, Autore, Descrizione dell’opera

Content + Personal Tags, Content + Social Tags

Metriche adottate: Precision e Recall

Quesito Un modello di raccomandazione content-

based può trarre vantaggio dall’integrazione di elementi di collaboratività ?

14/16

Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Page 15: Presentazione Laurea - Cataldo

Risultati emersi 15/16

Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

L’informazione lessicale proveniente dai tag migliora la precision di ITR del 2.5%

L’approccio basato sui Social Tag, su training set piccoli, migliora la recall di ITR del 13%

+2,5%

+13%

Page 16: Presentazione Laurea - Cataldo

Conclusioni L’integrazione in un modello di

raccomandazione dell’informazione proveniente da annotazioni collaborative è un fattore in grado di migliorare l’accuratezza predittiva del sistema Modello innovativo, mai sperimentato finora I primi riscontri hanno sottolineato la bontà

dell’approccio presentato

Modello proposto nell’ambito delle attività del progetto CHAT Sviluppo di una piattaforma per la fruizione

personalizzata di beni museali

16/16

Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto