Datos vinculados bibliotecarios la web 3.0 en las bibliotecas
-
Upload
wilmer-arturo-moyano-grimaldo -
Category
Technology
-
view
358 -
download
0
Transcript of Datos vinculados bibliotecarios la web 3.0 en las bibliotecas
Dr. Wilmer Arturo Moyano GrimaldoBiblioteca Nacional de Colombia
Datos abiertos y datos vinculados: las bibliotecas en la era de la Web Semántica
De que hablaremos…
• Lenguajes y transmisión de conocimiento
• Recuperación de información en la Web• La Web:
• Usuarios en la Web y su comportamiento
• y sus versiones… 1.0 - 2.0 - 3.0…• Web semántica (web de datos)
• Datos vinculados• Datos abiertos• Datos bibliográficos vinculados
Lenguaje
Lenguaje y conocimiento
KOS
Productor de conocimiento
Consumidor de conocimiento
¿Cómo se ve en la Web?
• Grandes organizaciones:₋ Producen y consumen (enfocadas a su línea de
trabajo)• Usuario de la Web
₋ Produce y consume (para cualquier cosa)
Adquirir
Encontrar Identificar
SeleccionarLos servicios Web más exitosos son aquellos que permiten agregar información que nos
interesa: Google, Facebook, entre otros
Usuario consumidor en la Web
El Problema de la organización, gestión y recuperación de información:
- Publicación de contenidos- Acceso a la información y
cambio constante de la información
- Integración de recursos distribuidos
- Categorización y valoración de contenidos
- Confianza o fiabilidad de los contenidos.
SOLUCIÓN tradicional:
La representación y recuperación de información en Internet
7
1. Ambigüedad en el significado de las cadenas de búsqueda
2. Multitud de resultados sin orden lógico (Google)
3. Imposible trasladar la relevancia subjetiva del usuario (incapacidad de entender el significado que el usuario tiene en mente)
4. No garantía de fiabilidad5. Falta ayuda para la formulación de las
búsquedas
¿Realmente son soluciones?
9
• Necesita visibilidad de sus contenidos/productos/servicios, y debería:₋ Reutilizar información de otros para potenciar
sus servicios₋ Compartir información de la manera más sencilla
posible, aunque no siempre estandarizada₋ Enlazar su información con posibles socios
estratégicos (redes de servicios)₋ Diversificar sus servicios y contenidos
Usuario productor en la Web
• Web 1.0: Web como portal de información– Información exclusiva
de pocos– Directorios de sitios
web útiles– Sin contexto, sin
interacción, sin escalabilidad
La evolución de la Web
• Web 2.0: Web como plataforma de información– Se centra en el compartir
contenidos– El usuario consumidor tiene
poder y es más libre– Enlaza contenidos por si
mismo y con sus propias herramientas
– No hay buena personalización, portabilidad ni interoperabilidad
(CC) Licensed 2007 Eboy
La evolución de la Web
• Web 3.0 (Web Semántica– Personalizable– Ubicuidad– Movilidad– Datos abiertos– Datos enlazados
¡Web de datos!
La evolución de la Web
• Semejante a un sistema de almacenamiento de ficheros
• Conformado principalmente por objetos digitales
• Documentos o sus partes (datos) enlazados
• Baja estructura de los objetos
• Diseñada para consumo humano y para su servicio
La Web actual es una Web de documentos donde la mayoría de los datos funcionan como islas semánticas
Tim Berners-Lee http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html
La Web de datos
• Es la forma en que la Web espera enlazar todo tipo de datos porque se encuentran diversificados
• Publicar bajo ciertos parámetros y estándares y también ligarlos para permitir la generación de contenidos enriquecidos (conocimiento).– Ser parte de la WEB, no solo publicar
para la Web (reutilización de contenidos)
– Colaboración• Una gran Base de datos
interconectados y consultables por una interfaz convencional (con HTML)
http://www.w3.org/2009/Talks/0204-ted-tbl/#%281%29
Datos vinculados (Linked data)
• Información relativa a cualquier cosa:– Lugares:
Granada (España) http://dbpedia.org/page/Granada
– Registros de autoridadesFederico García Lorca http://
id.loc.gov/authorities/names/n79034425.html
– Números de Clasificación861 Poesía española
http://dewey.info/class/861/2009-08/about.es
¿Qué se puede publicar con datos vinculados?
• Usar URIs como nombres para las cosas.
• Usar URIs HTTP, de modo que la gente pueda buscar y localizar esos nombres.
• Cuando alguien busque empleando un URI, proporcionar información útil, utilizando estándares (RDF, SPARQL).
• Incluir enlaces a otros URIs, para que se puedan descubrir y localizar más cosas.
¿Que se necesita?
• RDF (Resource Description Framework)
Sujeto Predicado Objeto
Federico García Lorca Es autor de Romancero Gitano
Recurso VALORTIPO DE
PROPIEDAD
¿En qué consiste?
• Vocabularios que describen (propiedades) o indican que tipo (Clases) de recursos estamos usando
Federico García Lorca es una PersonaRomancero gitano es una Obra
Ejemplo de vocabulario: Schema.org (Apodo, dirección física, etc.)
¿En qué consiste?
Recurso Tipo de Propiedad Valor
Federico García Lorca Nacido en Granada
Federico García Lorca Autor de Romancero Gitano
Recurso Tipo de Propiedad Valor
http://id.loc.gov/authorities/names/n79034425.html
foaf:birthPlace http://dbpedia.org/page/Granada
http://id.loc.gov/authorities/names/n79034425.html
frbr:isCreatorOf http://datos.bne.es/page/resource/bimo0000036030
Enlazado de datos
http://id.loc.gov/authorities/names/n79034425.html
http://dbpedia.org/page/Granada
foaf:birthPlace
http://datos.bne.es/page/resource/bimo0000036030
frbr:isCreatorOf
http://dewey.info/class/861/2009-08/about.es
skos:notation
Romancero Gitano
DC. title
Enlazado de datos
Archivo digital de El Espectador
Museo Nacional de Colombia
Biblioteca Nacional de ColombiaBib. Luis Ángel Arango
Título uniforme: [Cien años de Soledad Español]
Bib. Piloto de MedellínCo863,64 23
Cámara Colombiana del libro978-958-8774-06-0
Semantic Classification Search
Data.bnf.fr
Biblioteca Digital Mundial
Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
Datos abiertos
Datos vinculados
Datos abiertos
vinculados
Aclaración de términos
InteroperabilidadR.D.F
DUBLIN CORE
• DC.Creator• DC.Description• DC.Date
ENCODED ARCHIVAL DESCRIPTION
• <author>• <notestmt><note>• <publicationstmt><date>
R.D.F
• Desarrollado por el Library Linked Data Incubator Group – Entre mayo y agosto
de 2011– Informe final:
Octubre de 2011
• Objetivo:“contribuir a incrementar la interoperabilidad global de los datos de las bibliotecas en la Web, reuniendo a personas implicadas en actividades de la Web Semántica —centradas en los Datos Vinculados— en bibliotecas e instituciones afines, mediante el examen de las iniciativas en curso e identificando futuras vías de colaboración” * http://www.larramendi.es/LAM/Incubator/lld/XGR-lld-20111025.html
29
Informe Final del Grupo Incubador de Datos Vinculados de Bibliotecas del W3C*
• Alcance del informe• Ventajas del enfoque
de Datos Vinculados• Situación actual• Recomendaciones• Referencias • Agradecimientos
• Apendices:A. Inventario de
recursos existentes de Datos Vinculados de bibliotecas
B. Tecnologías pertinentes
C. Alineamiento semántico
Partes del informe
• Para “Bibliotecas” = todo tipo de unidad de información (Bibliotecas, archivos y museos LAM)
• Datos de bibliotecas: información digital que permite describir y recuperar información en las bibliotecas
• Datos vinculados (Interoperabilidad técnica)• Datos abiertos (desde el aspecto legal)• Datos vinculados de bibliotecas (library linked data)
Para que las bibliotecas puedan compartir, extender y reutilizar sus recursos con otras bibliotecas
Conceptos
• Directores de bibliotecas• Organismos de
normalización de bibliotecas
• Ingenieros de datos y de sistemas
• Bibliotecarios y archiveros
¿A quién se dirige?
• Investigadores, los estudiantes y los usuarios
• Las organizaciones • Los bibliotecarios,
archiveros y conservadores de museos
• Desarrolladores y firmas comerciales
¿A quién beneficia?
• General– Creación y distribución de
datos• Colaboración, reutilización
de datos, economía en los procesos e incremento en el valor de los datos
– Descripciones de metadatos más accesibles
– Compartir parte de sus datos, no la totalidad de los mismos
– Reducción de descripciones
• Específicos– Investigadores, los
estudiantes y los usuarios. (Centralización, mejor navegación, investigación multidisciplinar)
– Las organizaciones (mejor tratamiento de datos, desarrollo de Servicios)
– Los bibliotecarios, archiveros y conservadores de museos. (Colaboración)
– Desarrolladores y firmas comerciales (Uso de formatos abiertos, creación de productos y herramientas nuevas)
¿Cómo beneficia?
• Los datos de las bibliotecas no están integrados con los recursos Web
• Las normas de las bibliotecas están diseñadas únicamente para la comunidad bibliotecaria
• La comunidad bibliotecaria y la comunidad de la Web Semántica utilizan una terminología diferente para conceptos similares sobre metadatos
• Los cambios tecnológicos en las bibliotecas dependen del desarrollo de sistemas comerciales
¿Están preparadas las bibliotecas?
Propiedad de los derechos de autor
Algunas bibliotecas tienen un uso restringido de sus datosDepende mucho de la legislación del paísPresencia de pocos registros originalmente desarrollados por las bibliotecasCatalogación cooperativa
Derechos de autor como negocio para las organizaciones
Algunas agencias tienen su negocio en la creación de
registrosNo publicación abiertaPublicación limitadaDatos vinculados pero no abiertos
¿Y los derechos de autor?
• Directores de bibliotecas: Identificación de datos• Organismos de normalización: desarrollo de
normas y estandarización de bibliotecas• Ingenieros de datos y de sistemas: diseño de
servicios basados en Datos Vinculados• Bibliotecarios y archiveros: preservar los
conjuntos de elementos y los vocabularios de valores de Datos Vinculados, a través de la experiencia profesional.
Recomendaciones
• No hay iniciativas desde ninguna biblioteca– Desconocimiento del tema– Estrategias de Gobierno en
Línea • Guía para datos abiertos en
Colombia (2011)• Datos abiertos de gobierno
electrónicohttp://datosabiertoscolombia.cloudapp.net/frm/buscador/frmBuscador.aspx
– Biblioteca Nacional de Colombia
¿Y en Colombia?