Introduccion a la Web Semantica
-
Upload
juan-sequeda -
Category
Documents
-
view
1.461 -
download
0
description
Transcript of Introduccion a la Web Semantica
Hacia una Web Semantica
Juan F. Sequeda@juansequeda
Mayo 2011
Quien sabe que es …
• HTML• CSS• HTTP• XML• JSON• API• URL
• URI• RDF• RDFa• RDFS• OWL• RIF• SPARQL
Que es la Web Semantica?
Que es la Web Semantica?
Internet != Web
Que es la Web?
“… the Web, is a system of interlinked hypertext documents accessed via the Internet. With a web browser, one can view web pages that may contain text, images […] and navigate between them via hyperlinks”
http://en.wikipedia.org/wiki/World_Wide_Web
Web de Hoy = internet + links + docs
Historia de la Web
• Creado por Tim Berners-Lee en CERN en 1989• Mosaic Navegador 1993• W3C se fundo en 1994• Crecimiento exponencial mediados 90s• Amazon, Ebay - 1995• Search engines – Google 1998• Dot-com boom 1997 – 2001• Web 2.0 – blogs, Facebook, Twitter, etc
Cual es el problema?
• La web esta lleno de documentos• Nosotros no estamos siempre interesados en
documentos– Nos interesan COSAS (clima, libro, pelicula, bar)– Estas COSAS los podemos encontrar en documentos
• Nosotros podemos leer un documento HTML en un navegador para encontrar lo que estamos buscando– Dificil para computadores– Computadores tienen que “adivinar” (aunque son
buenos para adivinar)
La Web es un triturador de datos
Datos Estructurados
Dato No-estructurados
Thanks Martin Hepp
Que nos gustaria hacer?
BUSCAR o ENCUENTRAR
Busque por
Football Players who went to the University of Texas at Austin, played for
the Dallas Cowboys as Cornerback
Porque no lo puedo ENCONTRAR?
Adivine como lo ENCONTRE?
En una Web Semantica
La Web Semantica es una web de datos linkeados
La Web actual es un web de documentos linkeados
Pero ya no existe datos en la Web?
Datos en la Web hoy en dia
• Bases de Datos• APIs• XML• CSV• XLS• …• No podemos ENCONTRAR con estos datos?
Si! Pero todos los datos estan publicados en diferentes formatos y modelos!
(No hay un estandar…)
Eso hace que sea mas dificil integrar los datos
Datos en diferentes fuentes no estan linkeados
Por ejemplo, como se que el Juan Sequeda de Facebook es el mismo Juan Sequeda de
Twitter?
Si creo un mashup de datos proveniente de diferentes fuentes, necesito aprender cada API
por separado y recibo diferentes formatos
Que tal si tuvieramos un estandar para publicar datos en la Web?
Tenemos un estandar para publicar documentos en la Web!
HTML
Resource Description Framework (RDF)
• Un modelo de datos– i.e. Bases de datos relacionales utilizan un modelo
relacional• RDF es una tripleta• Grafo dirigido• Sujeto, Predicado, Objecto• <Juan> <was born in> <California>• <California> <is part of> <the USA>• <Juan> <has hobby> <Salsa dancing>
Quien utiliza RDF?• UK Government• US Government• Google• Yahoo• Facebook• BBC• Open Calais – Thomson Reuters• Freebase/Google• NY Times• Best Buy• CNET• Dbpedia• Overstock.com• O’Reilly Media• …
May 2007
Oct 2007
Nov 2007
Feb 2008
Mar 2008
Sept 2008
Mar 2009 (1)
Mar 2009 (2)
July 2009
September 2010
Mayo 2011
YOU GET THE PICTURE
ITS BIG and getting
BIGGER and
BIGGER
Como se ve RDF en realidad?
Document on the Web
Datos en una Base de Datos Relacional
Isbn Title Author PublisherID ReleasedData
978-0-596-15381-6
Programming the Semantic Web
Toby Segaran 1 July 2009
… … … … …
PublisherID PublisherName
1 O’Reilly Media
… …
This is a THING:A book title “Programming the Semantic Web” by Toby Segaran, …
THINGS have PROPERTIES:A Book as a Title, an author, …
RDF es un grafo
http://…/isbn978
Programming the Semantic Web
978-0-596-15381-6
Toby Segaran
http://…/publisher1 O’Reilly
title
name
author
publisher
isbn
RDF/XML
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/"> <rdf:Description rdf:about="http://en.wikipedia.org/wiki/Tony_Benn"> <dc:title>Tony Benn</dc:title> <dc:publisher>Wikipedia</dc:publisher> </rdf:Description></rdf:RDF>
RDF/N-Triples
<http://en.wikipedia.org/wiki/Tony_Benn><http://purl.org/dc/elements/1.1/title> “Tony Benn”.<http://en.wikipedia.org/wiki/Tony_Benn><http://purl.org/dc/elements/1.1/publisher> “Wikipedia”.
HTML
<div>My name is Bob Smith, but people call me Smithy. Here is my home page:<a href="http://www.example.com">www.example.com</a>.I live in Albuquerque, NM and work as an engineer at ACME Corp.My friends:<a href="http://darryl-blog.example.com">Darryl</a>,<a href="http://edna-blog.example.com">Edna</a></div>
RDFa (RDF in HTML)<div xmlns:v="http://rdf.data-vocabulary.org/#" typeof="v:Person"> My name is <span property="v:name">Bob Smith</span>, but people call me <span property="v:nickname">Smithy</span>. Here is my homepage: <a href="http://www.example.com" rel="v:url">www.example.com</a>. I live in <span rel="v:address"> <span typeof="v:Address"> <span property="v:locality">Albuquerque</span>, <span property="v:region">NM</span> </span> </span> and work as an <span property="v:title">engineer</span> at <span property="v:affiliation">ACME Corp</span>. My friends: <a href="http://darryl-blog.example.com" rel="v:friend">Darryl</a>, <a href="http://edna-blog.example.com" rel="v:friend">Edna</a></div>
Ahora si en serio…
Web Sematica HOY• RDF para Search Engine
Optimization– Google– Yahoo– Facebook
• RDF para grandes empresas– Integracion de Informacion
• Drupal– La Web es tu CMS
• Gobierno– US– UK
Web Semantica MANANA• Un Google Semantico• La Web es una Base de
Datos gigantezca
Web Semantica HOY
Google Rich Snippets
• Utilizar datos estructurados para mostrar mejores resultados
• Utilizar vocabularios especificos– Reviews– People– Products– Businesses and organizations– Recipes– Events
http://www.google.com/support/webmasters/bin/topic.py?topic=21997
http://stores.bestbuy.com/1116/
<div class="vcard" typeof="gr:LocationOfSalesOrServiceProvisioning" about="#store_1116"><h1 id="site_title" property="geo:lat_long" content="30.409273, -97.671532"><a href="http://stores.bestbuy.com/1116">Best Buy - Techridge</a></h1><div id="sidebar"><span rel="rdfs:seeAlso foaf:depiction">
<http://www.imdb.com/title/tt0117500/> <http://opengraphprotocol.org/schema/title> "The Rock (1996)".<http://www.imdb.com/title/tt0117500/> <http://opengraphprotocol.org/schema/type> "movie".<http://www.imdb.com/title/tt0117500/> <http://opengraphprotocol.org/schema/director> "Michael Bay".<http://www.imdb.com/title/tt0117500/> <http://opengraphprotocol.org/schema/site_name> "IMDb".
http://www.bbc.co.uk/music/artists/79239441-bfd5-4981-a70c-55c3f15c1287
http://www.bbc.co.uk/music/artists/79239441-bfd5-4981-a70c-55c3f15c1287.rdf
Drupal
• Si quieres generar RDFa y no quieres escribirlo a mano Drupal 7 lo hace por ti
• Si quieres consumir RDF en la Web, lo puedes importar automaticamente con Drupal 7
• http://www.ibm.com/developerworks/library/wa-rdf/
• http://www.ibm.com/developerworks/library/wa-datasets/
• http://semantic-drupal.com/
Integracion de Informacion
HTML XML
RDF RDF RDF RDF
Base de Datos RDF
Find all the locations of all the original paintings of Modigliani
Select all proteins that are linked to a curated interaction from the literature and to inflammatory response
http://linkedlifedata.com/
Web Semantica MANANA
http://dbpedia.neofonie.de/browse/
Buscadores Semanticos
• Como buscadores de hoy en dia(Google, Bing, Yahoo), excepto index RDF y sigue los links.– Hoy en dia solo indexan RDF que esta en HTML (RDFa)
• Human focus Search– Falcons - Keyword– SWSE – Keyword– VisiNav – Complex Queries
• Machine focus Search– Sindice – data instances– Swoogle - ontologies– Watson - ontologies– Uberblic – curated integrated data instances
http://sig.ma
Una web de datos esUNA
INMENSAGIGANTESCA
BASE DE DATOS!
Imaginase consultar la web como si estuvieras consultando una
base de datos
Encontrar todos los reviews sobre el libro “Programming the Semantic Web”
de personas que viven en Austin
http://…/isbn978
Programming the Semantic Web
978-0-596-15381-6
Toby Segaran
http://…/publisher1
O’Reilly
title
name
author
publisher
isbn
http://…/isbn978
sameAs
http://…/
review1
Awesome Book
http://…/
reviewer
Juan Sequeda
http://juansequeda.
com/id
hasReview
hasReviewer
description
name
sameAs
livesIn
Juan Sequedaname
http://dbpedia.org/Austin
Principios de Linked Data
1. Usar URIs para nombre cosas
2. Usar HTTP URIs para que los puedas dereferenciar
3. Cuando alguien busca una URI, devuelve informacion util
4. Crea links a otros URIs
http://www.bbc.co.uk/music/artists/79239441-bfd5-4981-a70c-55c3f15c1287.rdf
http://www.bbc.co.uk/music/artists/79239441-bfd5-4981-a70c-55c3f15c1287.html
http://www.bbc.co.uk/music/artists/79239441-bfd5-4981-a70c-55c3f15c1287#artistURI que identifica a Madonna
URI de un documento RDF sobre Madonna
URI de un documento HTML sobre Madonna
Conclusiones
La Web Semantica NO es un mito
Es REALIDAD
La Web Semantica NO es una web nueva
Web de Documentos Web de Datos
La Web Semantica permite publicar informacion mas explicita
Computadores ya no tienen que adivinar
La Web Semantica esta cambiando SEO
La Web Semantica nos permite reutilizar datos existentes facilmente
La Web Semantica todavia le falta…
Lo que le falta a la Web Semantica
• Navegador– IE/Chrome/Firefox son navegadores para
Documentos– Y para datos?
• Quien va crear el Google de la Web Semantica?
• Quien va crear el Amazon de la Web Semantica?
• Quien va crear las redes sociales de la Web Semantica?
Gracias
@juansequedawww.juansequeda.com