Presentation j srennes
Transcript of Presentation j srennes
READOR.NET
Christophe DESCLAUX@descl3
Outil pour effectuer sa veille rapidement et efficacement25 juin 2013JS Rennes
Christophe Desclaux@descl3
CLEAN your timeline
FOLLOW all kinds of news©The guardian
In a SINGLE locationCc-By-Sa Ed Yourdon
En résumé● Nous voulons construire un outil de veille
● Processus de surveillance systématique de l'information● Permet d'anticiper / de suivre des tendances● Sources d'informations multiples● Un outil de curation de news automatisé
Comment agréger autant d'information ?Comment filtrer automatiquement les news?
Quelle interface proposer ?Existe-t-il des solutions OpenSource de filtrage ?
SOLUTIONS exist
TRUST in providers
Google News
©Google News
PERSONAL aggregation©Feedly
Social media FILTERING©Scoopit
AUTOMATIC filtering©YahooPipes
Open Source
Personalaggregation
Filte
r in
g
News clustering
Semantic
Newsprovider
social
automatic
Goo
gle
new
s
Feed
ly
Scoo
p.it!
Yaho
o Pi
pes
Reador.net
Let's go to TECH®flickr_flip
Semantic web● Content accessible to computers
● Interconnected sources
● Shared vocabularies
OPEN DATApublish data on the web using open formats
e.g. list of all the streets of my village
®Fabien Gandon
OPEN DATAWEB DATA
Use web standards to identify things (URIs) and describe them (RDF)
http://myvillage.org/street/eiffel
®Fabien Gandon
OPEN DATAWEB DATA
LINKED DATAreuse and link web identifiershttp://myvillage.org/street/eiffel
namedFrom
http://dbpedia.org/page/Gustave_Eiffel
®Fabien Gandon
OPEN DATAWEB DATA
LINKED DATAOPEN SCHEMAS
publish data schemas on the web using open formats
http://myvillage.org/street/eiffel type Street
Street subClassOf Road
®Fabien Gandon
OPEN DATAWEB DATA
LINKED DATAOPEN SCHEMASWEB SCHEMAS
publish schemas as web datahttp://myvillage.org/street/eiffel
type http://myvillage.org/class/Street®Fabien Gandon
OPEN DATAWEB DATA
LINKED DATAOPEN SCHEMASWEB SCHEMAS
A WEB OF
Linked
Data
&
linked
Data
schemas
®Fabien Gandon
Semantic web● Content accessible to computers
● Interconnected sources
● Shared vocabularies
Feeds
Feedsreading
Feeds
Feedsreading
Feeds
Annotator
Feedsreading
Feeds
Annotator
●WikiMeta (polyMtl)
● Organisations● Personnalities● Objects
● OpenCalais (reuters)
● GeographySpotLight
(wikipedia)
pers.hum http://dbpedia.org/David_Cameronorg http://dbpedia.org/European_Unionloc http://dbpedia.org/Parliament
Feedsreading
Feeds
Annotator
pers.hum http://dbpedia.org/David_Cameronorg http://dbpedia.org/European_Unionloc http://dbpedia.org/Parliament
Feedsreading
Feeds
Annotator
®drawingbynumbers.org
● DBpedia
● Ajout d'URIs● Liens vers les connaissances
sous-jacentes● Je fournis un lien vers la base
de connaissances WikiPedia
● INSEE● Données géographiques
françaises● Base de connaissances
RDF● J'ai conçu l'API de requêtes
SPARQL
dbpedia:leader http://dbpedia.org/Conservative_Party_(UK)dbpedia:country http://dbpedia.org/United_Kingdom
Data miningCC-By ThiagoJ
Feedsreading
Feeds
Annotator
Feedsreading
Feeds Annotated news
BDDRDF
●Serveur RDF Virtuoso
● Serveur de triplets RDF scalable
● Requêtes en mode CRUD
● SPARQL EndPoint publique en ligne
● Des librairies pour TOUS les langages
Annotator
Feedsreading
Feeds Annotated news
BDDRDF
Annotatorextractor
● Gestion des informations sous forme de workflow
● Implémentation Java
● Nécessitée de gérer des processus d'annotation lents
topics
user
topics
user
topics SPARQL
BDDRDF
user
SELECT ?concept WHERE { ?concept annot:PERS <http://www.dbpedia.org/resource/David_Cameron>. ?concept annot:ORG <http://www.dbpedia.org/resource/EU>. ?concept rss:pubDate ?pubDate. } ORDER BY ?pubDate
SPARQL
topics SPARQL
BDDRDF
user
<http://bbc.co.uk/uk-cam-335> rss:pubDate "Wen Jan 23 16:28:18 2013 "<http://bbc.co.uk/uk-cam-335> rss:title "Cameron promises in/out referendum"<http://bbc.co.uk/uk-cam-335> annot:ORG <http://www.dbpedia.org/resource/EU><http://bbc.co.uk/uk-cam-335> annot:PERS <http://dbpedia.org/David_Cameron><http://bbc.co.uk/uk-cam-335> annot:LOC <http://dbpedia.org/United_Kingdom>
RDF
topics SPARQL
BDDRDF
XMLRSS Feeduser
Feedsreading
RSS Feed
topics
Annotated news
watcher
SPARQL
XML
extractor
Feeds
BDDRDF
user
Annotator
Open Source
Personalaggregation
Filte
r in
g
News clustering
Semantic
Newsprovider
social
automatic
READOR.NET
Une machinerie PUISSANTE et OPENSOURCE de filtrage de NEWS pour ORGANISER votre VEILLE PERSONNELLE et fonctionnant avec ...
Et maintenant ?
● Recherche de nouvelles pistes de travail
=> DiscoveryHub
=> QAKiS
=> projet NERO● Une liaison efficace avec twitter
● Comment continuer sur le projet après cette année de contrat?
[email protected] 62 59 64 17
@descl3
Code : http://www.zone-project.orgDemo: http://www.reador.net
@zone-project