Anotaciones Semánticas

Post on 13-Jun-2015

2.879 views 3 download

Transcript of Anotaciones Semánticas

ANOTACIONES SEMÁNTICAS

Orlando Alemán Ortiz Samuel Díaz Cabrera

¿Qué es una anotación?• Por anotaciones entendemos comentarios, notas,

explicaciones, u otro tipo de reseñas que podamos asociar a un documento Web.

• Una anotación puede considerarse como una información sobre las entidades o conceptos de una ontología que aparecen en un texto, o también las referencias que hay en un texto sobre un repositorio semántico

¿Qué es una anotación?• Las anotaciones semánticas establecen una

relación entre:o Los contenidos o parte de ellos, por ejemplo una

palabra, una imagen, etc.o Y cierto identificador conceptual: una URI (Universal

Resource Identificador) tomado de una ontología o de otra fuente de conocimiento.

• Punto clave para hacer explícito el significado de un texto o página web para un ordenador

Ventajas• Su utilización es el primer paso para permitir el

procesamiento automático de la información de la WWW por parte de las máquinas

• Posibilita nuevas aplicaciones:o resaltado y categorización de la información de cara

a su indexado y recuperación, o adquisición de conocimiento a partir del análisis de

relaciones entre entidades, eventos y descripciones.o relevancia

Representación• Existen dos alternativas para realizar anotaciones:

o Anotaciones empotradas (o de autor)La meta información se incluye en las páginas Web mediante lenguajes de marcado (RDF, XML, etc)

o Anotaciones externasLa meta información no se almacena dentro de la misma página, sino en un repositorio destinado específicamente a mantener las anotaciones.

Representación• Anotaciones empotradas

o Aunque en algunos casos son más fáciles de mantener, generalmente a medida que aumenta la complejidad de las mismas.

o Rígidas: Sólo las añade y mantiene el administrador del sitio.

o No cambian de acuerdo al interés del usuario o el contexto de uso.

Representación• Anotaciones externas

o Entra en juego el usuario, quien añade sus anotaciones.

o Las anotaciones pueden ser compartidas con otros usuarios

o Dinámicaso Hacen uso de servidores externos donde almacenarlas.

Parece claro por qué el interés actual está en este tipo de representación

Características deseables• Posibilidad de:

o compartir las anotaciones con otros usuarioso vincular anotaciones con ontologíaso actualizar, modificar y eliminar nuestras anotacioneso valorar las anotaciones de otros usuarios y realizar

“anotaciones sobre anotaciones”o buscar en anotacioneso poder anotar en cualquier tipo de documento,

independientemente de su estructura

Características deseables• También resultaría interesante:

o Utilización de tecnologías abiertas y estandarizadas: lenguaje de consulta, especificación de metadatos, etc.

o El servidor donde se alojasen las anotaciones cumpliese unos requisitos mínimos de seguridad, robustez, disponibilidad y rendimiento.

o La herramienta de anotaciones fuera estable, robusta, que tuviera soporte, etc.

o Cada anotación contara con una URI.

Proyecto Annotea• Pretende mejorar el ambiente colaborativo mediante

la compartición de metadatos basada en etiquetas, marcadores y otras anotaciones.

• Propuesto por la W3C• Su función es asociar texto a partes de un

documento web sin modificarlo.• Arquitectura Cliente-Servidor.

Proyecto Annotea• Utiliza tecnologías abiertas:

o RDF Schema para describir las anotaciones como metadatos. Por tanto usa un estándar extensible diseñado para trabajar

con otros estándares de la W3Co Xpointer para localizar las anotaciones de un

documento.• Pueden existir anotaciones locales o remotas; estas

últimas pueden ser compartidas.• Usa servidores RDF genéricos

Proyecto Annotea• El tipo de una anotación es metadatos sobre ella

misma; esto permite a los usuarios clasificar las anotaciones en el momento de escribirlas.

• Los tipos de anotaciones pueden ser definidos por los usuarios.

• Metadatos que encontramos en una anotación:Keywords, Comments, Notes, Explanations, Errors, Corrections

Proyecto Annotea: Servidores

• Servidor público de pruebashttp://annotest.w3.org/annotations

Proyecto Annotea: Clientes• Actualmente los proyectos que trabajan activamente

en Annotea son:o Amayao Annozillao Annotea Ubimarks (abandonado)o Annosource

Amaya• Proyecto de la w3c. Disponible como SL.• Herramienta compuesta por un navegador web y

una herramienta de autor.• Permite editar directamente cualquier página web

que se abra puede ser editada inmediatamente. • Soporte para HTML, XHTML, CSS, MathML, SVG,

PNG....• Pero lo más importante, soporta Anotaciones

Amaya• Creando una anotación

Amaya• Otras pijerías: Editando directamente

Amaya• Conclusiones:

o “Revienta” cada dos por tres.o Proyecto activo: la última versión es del 10 de Julio de

2007o Permite anotaciones locales y compartidaso Con bastantes funcionalidadeso No renderiza bien la mayoría de páginas, por lo que no

es una alternativa a considerar por el usuario normalo Permite réplicas a las anotaciones

Annozilla• Extensión para Mozilla Firefox• Permite integrar la plataforma Annotea en el

navegador web• Las anotaciones pueden ser almacenadas en local

o en remoto• Es capaz de cargar anotaciones externas (propias o

de otros usuarios)• Sencillo de instalar, configurar y usar

Annozilla• Funcionamiento/Uso:

o El navegador carga automáticamente las anotaciones almacenadas.

o Las distintas clases de anotaciones (comment, see also, question, explanation, example, change, advice) se representan con un dibujo distinto.

o Para usar basta con seleccionar el texto o recurso y añadir la anotación.

Annozilla• Fundamental configurar un servidor local o externo.

Annozilla• Uso: Seleccionar y anotar

Annozilla• También proporciona una barra lateral

Annozilla• Conclusiones:

o Sencillo de usar y útilo Pero no deja de ser bastante básico (y desde mi punto

de vista, prescindible)o Proyecto activo: la última versión es de Febrero de

2007o No permite réplicas a las anotaciones existenteso En principio las anotaciones con ontologías tampoco

parecen posibles

Ontomat Annotizer• Herramienta para crear y mantener anotaciones

(marcas) basadas en ontologías OWL y RDF.• Anotaciones de autor y empotradas. Sirve para

enriquecer páginas web con metadatos OWL.• Soporta, por tanto, la carga de ontologías y la

creación de instancias• Incluye un pequeño navegador HTML.• Es un proyecto que parece abandonado. Los

últimos cambios en su sitio web datan de 2005

Ontomat Annotizer• Funciona en la plataforma Java• Su funcionamiento se basa en el drag & drop

Ontomat Annotizer (Ejemplo 1)

Ontomat Annotizer (Ejemplo 1)

Ontomat Annotizer (Ejemplo 2)

Ontomat (Ejemplo 2)

M-Ontomat• Desarrollado como plugin para Ontomat Annotizer• Extiende sus capacidades para soportar

descriptores visuales MPEG-7• Actualizado 2006

M-Ontomat

(M-) Ontomat Annotizer• Conclusiones:

o Su interfaz no es amigable.o Poco documentado. Con lo cual es más complejo de

entender su funcionamiento.o Utiliza un motor web demasiado simple, Las páginas

comunes contienen elementos más complejos que no son renderizados adecuadamente.

o Proyecto con “poco movimiento”. o Sencillo: Sólo hace lo que promete.

Proyecto KIM (Knowledge and Information Management)

• Provee la infraestructura y servicios necesarios para anotaciones semáticas automáticas, indexado y recuperación de contenido

• Analiza el texto tratando de asociar referencias con entidades conocidas (pares URI, Descripción) de la base de conocimiento.

• Genera automáticamente nuevas entidades (par URI-Descripción)

Proyecto KIM (Knowledge and Information Management)

• Front-End Toolso Browser Plug-in: Permite anotar, resaltar y enlazar

páginas, enviándolas al KIM Servero Web-UI, KB Explorer, Graph View y Search

• KIM Server and API• WorldKB: Una base de conocimiento del mundo con

más 200K descripciones de entidades• KIMO: Base de Ontologías (+300 Clases)

Proyecto KIM (Knowledge and Information Management)

• Soporta OWL Lite y RDF(S).• Posibilidad de utilizar servidores públicos o montar

el tuyo propio

VER DEMO

Proyecto KIM (Knowledge and Information Management)

• Conclusioneso Herramientas en constante desarrollo, pero que aún no

están disponibles para el gran públicoo Basado en una plataforma bien definida (clara) y

consistenteo Secretismo

Conclusiones Finales• El panorama actual está (o al menos parece)

demasiado verde• Entre las herramientas analizadas, sin duda KIM es

la más prometedora.• La w3c impulsa las anotaciones como simples

reseñas explicativas, pero algunas organizaciones van más allá y piensan en ontologías.

• Las anotaciones no siempre funcionan en páginas dinámicas

Conclusiones Finales• Hay herramientas, pero muchas abandonadas. y las

que hay son poco estables

Y ústedes, ¿qué opinan?

Referencias• OWL Web Ontology Language

http://www.w3.org/TR/owl-ref/• KIM Platform

http://www.ontotext.com/kim/• XPointer

http://www.w3.org/XML/Linking• Annotea:

http://www.w3.org/2001/Annotea/

Referencias• Annotation Server HOWTO

http://www.w3.org/1999/02/26-modules/User/Annotations-HOWTO

• Annozillahttp://annozilla.mozdev.org/

• Annotea Ubimarkshttp://www.annotea.org/mozilla/ubi.html

• Annosourcehttp://annosource.cs.latrobe.edu.au/UI/home.htm

Referencias• Ontomat Annotizer

http://annotation.semanticweb.org/ontomat/i• M-Ontomat

http://www.acemedia.org/aceMedia/results/software/m-ontomat-annotizer.html