Электронные книги и ресурсы в библиотеках – теория и практика
Обзор некоторых направлений интеграции гетерогенных...
-
Upload
malik-odonnell -
Category
Documents
-
view
92 -
download
0
description
Transcript of Обзор некоторых направлений интеграции гетерогенных...
![Page 1: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках](https://reader036.fdocuments.net/reader036/viewer/2022081421/56813493550346895d9b7bbe/html5/thumbnails/1.jpg)
Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотекахНовицкий А.В.Институт программных систем НАН Украины
![Page 2: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках](https://reader036.fdocuments.net/reader036/viewer/2022081421/56813493550346895d9b7bbe/html5/thumbnails/2.jpg)
RCDL 2009
2
Цели
•Выделить проблемы интеграции данных при онтологическом подходе
•Сделать обзор существующих проектов по интеграции данных в электронной библиотеке
•Семантической аннотации как необходимый компонент интеграции данных
![Page 3: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках](https://reader036.fdocuments.net/reader036/viewer/2022081421/56813493550346895d9b7bbe/html5/thumbnails/3.jpg)
RCDL 2009
3
Что такое интеграция данных (ИД) ? • Под процессом интеграции данных мы
понимаем построение единого унифицированного метода доступа к гетерогенным распределенным преимущественно структурированным данным
![Page 4: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках](https://reader036.fdocuments.net/reader036/viewer/2022081421/56813493550346895d9b7bbe/html5/thumbnails/4.jpg)
RCDL 2009
4
Проблемы интеграции данных
Гетерогенность:СинтаксическаяСтруктурнаяСемантическая
![Page 5: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках](https://reader036.fdocuments.net/reader036/viewer/2022081421/56813493550346895d9b7bbe/html5/thumbnails/5.jpg)
RCDL 2009
5
семантическая гетерогенность•семантические конфликты
•описательные конфликты
•структурные конфликты
![Page 6: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках](https://reader036.fdocuments.net/reader036/viewer/2022081421/56813493550346895d9b7bbe/html5/thumbnails/6.jpg)
RCDL 2009
6
Виды сопоставлений онтологий:
•Расширение
•Гармонизация
•Выравнивание
![Page 7: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках](https://reader036.fdocuments.net/reader036/viewer/2022081421/56813493550346895d9b7bbe/html5/thumbnails/7.jpg)
RCDL 2009
7
Семантическая интерпарабельность в Европейских проектах
•Проект SWHi
•Проект eCulture
•Проект IPISAR (Испания)
•Проект EPOCH и AMA
![Page 8: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках](https://reader036.fdocuments.net/reader036/viewer/2022081421/56813493550346895d9b7bbe/html5/thumbnails/8.jpg)
RCDL 2009
8
Проект SWHi
Онтология SWHi для ЭБ, построенная на базовой онтологии PROTON в результате сопоставления с отологиями:
•таксономии предметной классификации NewsBank/Readex
•Дублинского Ядра•словаря FOAF Vocabulary
![Page 9: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках](https://reader036.fdocuments.net/reader036/viewer/2022081421/56813493550346895d9b7bbe/html5/thumbnails/9.jpg)
RCDL 2009
9
Проект eCulture•eCulture это семантическая поисковая
система для одновременного поиска в нескольких коллекциях учреждений культурного наследия
![Page 10: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках](https://reader036.fdocuments.net/reader036/viewer/2022081421/56813493550346895d9b7bbe/html5/thumbnails/10.jpg)
RCDL 2009
10
IPISAR
![Page 11: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках](https://reader036.fdocuments.net/reader036/viewer/2022081421/56813493550346895d9b7bbe/html5/thumbnails/11.jpg)
RCDL 2009
11
Проект EPOCH и AMA библиотек культурного наследия•EPOCH представляет собой
библиотечную сеть из более ста европейских культурных институтов
•Для интеграции и обмена используется модель данных CIDOC CRM
AMA Mapping Tool - для отображения источников данных (неструктурированная информация) в онтологию CIDOC CRM
![Page 12: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках](https://reader036.fdocuments.net/reader036/viewer/2022081421/56813493550346895d9b7bbe/html5/thumbnails/12.jpg)
RCDL 2009
12
Семантическая аннотация Для автоматической обработки контента ЭБ метаданных недостаточно. Необходимы более детальные формальное объяснения (аннотации), доступные через Интернет.Эти механизмы заложены в Sematic Web.
![Page 13: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках](https://reader036.fdocuments.net/reader036/viewer/2022081421/56813493550346895d9b7bbe/html5/thumbnails/13.jpg)
RCDL 2009
13
Проблемы Semantic Web•Множество рекомендаций и
направлений•Отсутствие онтологий и RDF данных•Отсутствие приложений для роботы с
семантическими данными
![Page 14: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках](https://reader036.fdocuments.net/reader036/viewer/2022081421/56813493550346895d9b7bbe/html5/thumbnails/14.jpg)
RCDL 2009
14
RDFa
•это способ выражения RDF-данных в XHTML, в рамках которого данные, предназначенные для человека, используются повторно для автоматической обработки.
![Page 15: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках](https://reader036.fdocuments.net/reader036/viewer/2022081421/56813493550346895d9b7bbe/html5/thumbnails/15.jpg)
RCDL 2009
15
Пример
![Page 16: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках](https://reader036.fdocuments.net/reader036/viewer/2022081421/56813493550346895d9b7bbe/html5/thumbnails/16.jpg)
RCDL 2009
16
Пример работы GRDDL (Gleaning Resource Descriptions from Dialects of Languages)
![Page 17: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках](https://reader036.fdocuments.net/reader036/viewer/2022081421/56813493550346895d9b7bbe/html5/thumbnails/17.jpg)
RCDL 2009
17
Использование в ЭБ (автоматическая публикация)
XHTML с профилем и алгоритмом
Автоматическая публикация в интернете
GRDDL
GR
DD
L
Сбор публикаций в интернете
Хранилище RDF
Запрос SPARQLSPARQL
XML binding XSLT
Liked Data
![Page 18: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках](https://reader036.fdocuments.net/reader036/viewer/2022081421/56813493550346895d9b7bbe/html5/thumbnails/18.jpg)
RCDL 2009
18
Дальнейшее развитие
•Связывание аннотированных документов с моделью данных Linked Data
•Расширение построенной модели с хранилищем Linked Open Data
![Page 19: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках](https://reader036.fdocuments.net/reader036/viewer/2022081421/56813493550346895d9b7bbe/html5/thumbnails/19.jpg)
RCDL 2009
19
Linked Open Data
![Page 20: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках](https://reader036.fdocuments.net/reader036/viewer/2022081421/56813493550346895d9b7bbe/html5/thumbnails/20.jpg)
RCDL 2009
20
Спасибо за внимание !
![Page 21: Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках](https://reader036.fdocuments.net/reader036/viewer/2022081421/56813493550346895d9b7bbe/html5/thumbnails/21.jpg)
RCDL 2009
21
Принципы Linked Data
•Use URIs as names for things •Use HTTP URIs so that people can look
up those names. •When someone looks up a URI, provide
useful information, using the standards (RDF, SPARQL)
•Include links to other URIs. so that they can discover more things.