Перспективы применения семантических технологий при...

21
4 февраля 2010 года Денис Голомазов аспирант механико-математического факультета МГУ младший научный сотрудник НИИ механики МГУ [email protected]

description

Перспективы применения семантических технологий при построении виртуальных научных сообществ. Денис Голомазов аспирант механико-математического факультета МГУ младший научный сотрудник НИИ механики МГУ [email protected]. План доклада. Что такое семантические технологии? - PowerPoint PPT Presentation

Transcript of Перспективы применения семантических технологий при...

Page 1: Перспективы применения семантических технологий при построении виртуальных научных сообществ

4 февраля 2010 года

Денис Голомазоваспирант механико-математического факультета МГУ

младший научный сотрудник НИИ механики МГУ[email protected]

Page 2: Перспективы применения семантических технологий при построении виртуальных научных сообществ

Что такое семантические технологии?

Зачем они нужны?

Каково текущее состояние дел?

Каковы перспективы?

Page 3: Перспективы применения семантических технологий при построении виртуальных научных сообществ

Модель данных RDF Онтологии Логический вывод

Page 4: Перспективы применения семантических технологий при построении виртуальных научных сообществ

Рассмотрим утверждения вида «субъект – предикат – объект» (тройки) Земля является планетой Земля находится в солнечной системе

«Земля», «является», «планета», «находится», «солнечная система» - ресурсы, определяемые уникальными адресами

Так можно описывать действительность – мы задали модель данных

Page 5: Перспективы применения семантических технологий при построении виртуальных научных сообществ

Онтология – совокупность утверждений-троек Онтология состоит из терминологической и

фактологической частей Терминологическая часть (словарь):

«Планета – это небесное тело» «Звезда – это не планета» «Планета имеет орбиту» «Планета имеет массу (действительное число > 0)» «Планета может иметь спутники»

Фактологическая часть: «Земля – это планета» «Земля имеет массу 6x10^24 кг» «Луна – спутник Земли»

Page 6: Перспективы применения семантических технологий при построении виртуальных научных сообществ

Мы хотим автоматически выводить новые факты из существующих Например: «Земля является планетой», «Планета является

небесным телом» -> «Земля является небесным телом»

Для этого вводим специальные ресурсы, имеющие значение (правило выведения новых троек) Например, ресурсы «класс», «являться членом класса»,

«быть подклассом». Значение ресурсов: если существуют тройки «C – это

подкласс D», «x – член класса C», то из этого выводится новый факт «x – член класса D».

Page 7: Перспективы применения семантических технологий при построении виртуальных научных сообществ

Единая модель данных (RDF) Общее видение предметной области Компьютеру доступен смысл информации

Page 8: Перспективы применения семантических технологий при построении виртуальных научных сообществ

Новый уровень поиска Более сложные запросы Решение вопросов синонимии и мультиязычности Конкретизация/обобщение запроса

Интеграция информации Поддержка принятия решений Выявление скрытого знания

Page 9: Перспективы применения семантических технологий при построении виртуальных научных сообществ

9

Page 10: Перспективы применения семантических технологий при построении виртуальных научных сообществ

Какова космическая стратегия Китая в следующие 20 лет?

Как связаны стратегии Китая и США? Как решалась задача открытия экзопланет в

прошлом? Какие есть алгоритмы сейчас? Какова лучшая методика в данной ситуации? Какие новые алгоритмы были описаны в

публикациях за последний год в этой области?

Page 11: Перспективы применения семантических технологий при построении виртуальных научных сообществ

Управление информацией как активом (жизненный цикл информации)

Анализ трендов и изменений в индустрии Накопление и использование опыта

Перевести скрытое знание из отчетов и голов экспертов в единую систему

Возможность просмотра информации с различным уровнем детализации

Общий доступ к информации Взаимодействие с приложениями

11

Page 12: Перспективы применения семантических технологий при построении виртуальных научных сообществ

Оптимизация принятия похожих решений чтобы не повторять ошибок

Оценка решений выбор решения с наибольшей выгодой с учетом рисков

Моделирование последствий решений разные модели и общее видение разных моделей

12

Page 13: Перспективы применения семантических технологий при построении виртуальных научных сообществ

Готовые тройки: Файлы .rdf (Google: 2.5 млн документов)

созданные вручную сгенерированные сервисами (livejournal, facebook etc)

Структурированные данные: Конверторы *->rdf (таблицы, реляционные БД) Микроформаты RDFa

Неструктурированные данные: Конверторы HTML->RDF (“scrapers”)

Page 14: Перспективы применения семантических технологий при построении виртуальных научных сообществ

Переведем в RDF существующие базы данных в открытом доступе

Проставим ссылки из баз друг на друга Получим большую коллекцию связанных RDF-

троек

Page 15: Перспективы применения семантических технологий при построении виртуальных научных сообществ

Главная проблема: у каждой базы своя онтология

Page 16: Перспективы применения семантических технологий при построении виртуальных научных сообществ

Google: 186 тыс. онтологий Онтологии общей направленности: SKOS,

Dublin Core, YAGO, DBpedia, Umbel Специализированные онтологии, всевозможные

тематики: люди, сообщества, наука, проекты, веб-ресурсы, теги,

бизнес, языки, география, биология, музыка, еда,…

Page 17: Перспективы применения семантических технологий при построении виртуальных научных сообществ

Медицина и науки о человеке Активно используют онтологии

Нефтегазовая индустрия Semantic Web for Oil&Gas Workshop

Финансовые услуги Промышленность Социальные сети Правительство Медийный бизнес

Page 18: Перспективы применения семантических технологий при построении виртуальных научных сообществ

Перевод информации в RDF Автоматическое создание онтологий Разработка согласованных словарей Интеллектуальная собственность

18

Page 19: Перспективы применения семантических технологий при построении виртуальных научных сообществ

Интернет – семантически единое информационное пространство

Взаимодействие человека с Сетью осуществляется посредством интеллектуальных агентов, которые: Отвечают на сложные вопросы Взаимодействуют друг с другом

Page 20: Перспективы применения семантических технологий при построении виртуальных научных сообществ

Система анализа научного прогресса на основе информации из отчетов научных сотрудников

Цель: отвечать на запросы вида Какие направления активно исследуются в данной области

знаний? Какие публикации по данному направлению вышли за

прошедший период? В каких еще задачах используются методы данного

направления? Какие конференции посвящены данному направлению? Каков научный вклад данного ученого/подразделения за

прошедший период?

Page 21: Перспективы применения семантических технологий при построении виртуальных научных сообществ

4 февраля 2010 года

Денис Голомазов

[email protected]

Спасибо за внимание.