Download - オントロジー工学に基づく知識の体系化と利用

Transcript
Page 1: オントロジー工学に基づく知識の体系化と利用

オントロジー工学に基づく知識の体系化と利用

大阪大学産業科学研究所

古崎 晃司[email protected]

2014/5/30 JASPIC研究員合宿於:ホテルピアザびわ湖

Page 2: オントロジー工学に基づく知識の体系化と利用

自己紹介 略歴

1996.4~ 大阪大学工学部/工学研究科(B4~D3) 2002.4~ 化学工学会嘱託研究員 2002.12~ 大阪大学産業科学・助手(助教) 2008.8~ 大阪大学産業科学研究所・准教授

主な参加学会 人工知能学会

セマンティックウェブとオントロジー研究会幹事

主に参加している国際会議: ISWC:International Semantic Web Conference JIST: Joint International Semantic Technology conference EKAW: Inter… on Knowledge Engineering and Knowledge Management ICBO: International Conference on Biomedical Ontologies FOIS: International Conf… on Formal Ontology in Information Systems

コミュニティ Linked Open Dataとオントロジー勉強会 Linked Open Dataチャレンジ実行委員会 関西支部長

2014/05/30 2

指導教官:溝口理一郎教授

Page 3: オントロジー工学に基づく知識の体系化と利用

Linked Open Dataとオントロジー勉強会

2014/05/30 3

Page 4: オントロジー工学に基づく知識の体系化と利用

Linked Open Dataハッカソン関西

2014/05/30 4

大阪市都市計画局の共催で3回のイベントを開催

大阪市が正式に「オープンデータ」の取り組みを開始!

Page 5: オントロジー工学に基づく知識の体系化と利用

現在の研究内容 オントロジー工学の基礎理論に関する考察に基づいた,オントロ

ジー構築・利用ツール(「法造」)を開発し,その理論とツールを用いて各種オントロジーおよび応用システム開発する.

研究内容 オントロジー工学の基礎理論

基礎理論:ロール理論

構築方法論:オントロジー洗練支援

オントロジー構築・利用環境「法造」の開発

オントロジー構築ツール「法造」,オントロジー利用API(法造コア)

オントロジー探索ツール

Linked Open Data (LOD)関係ツール … etc. 各種オントロジーおよび応用システムの開発

臨床医学オントロジーの構築と利用

バイオミメティック(生物規範工学)オントロジー

情報リテラシーオントロジー,バイオインフォマティクスDB2014/05/30 5

Page 6: オントロジー工学に基づく知識の体系化と利用

研究・オントロジー構築歴 学生時代(1997- 継続中)

オントロジー工学の基礎理論に基づくオントロジー構築環境(「法造」)の開発

オントロジーの構築 2002-2007 ナノテクノロジーオントロジーの構築

NEDO「材料技術の知識の構造化」

2006-継続中 臨床医学オントロジーの構築 共同研究:東京大学医学研究科

2007-2009 サスティナビリティ・オントロジーの構築 共同研究:大阪 大学サスティナビリティ・サイエンス研究機構(RISS)

2007-2010 文科省:統合データベース整備事業・統合医科学データベースの構築 共同研究:東京医科歯科大学・大阪大学大学院医学系研究科

2008-2012 蛋白実験プロトコールオントロジーの構築 共同研究:大阪大学蛋白質研究所(文科省:ターゲットタンパクプロジェクト)

2008-2010 バイオ燃料オントロジーの構築 環境省:Hc-082「アジア太平洋地域における地球温暖化の持続可能な発展のためのバイオ燃

料利用戦略に関する研究」(研究代表者:東京大学・武内和彦教授)

2009-2011 災害リスクオントロジーの構築 共同研究:防災科学研究所

2012-継続中 生物規範工学オントロジーの構築 科研新学術領域

2013-継続中 情報リテラシーリスクオントロジーの構築 共同研究:山梨大学

2014/05/30 6

Page 7: オントロジー工学に基づく知識の体系化と利用

講演概要

講演のねらい

「オントロジー工学」の基本的な考え方,および,その利用方法(知識の体系化,応用システムの開発)の概要を紹介する.

講演内容

オントロジー工学入門

オントロジー利用方法の分類と研究動向

Linked Open Data(LOD)とオントロジー LOD技術の概要

国内におけるLODとOpen Dataの動向

応用事例の紹介 臨床医学オントロジーの構築と利用

バイオミメティック・オントロジーに基づくDB開発

まとめ

2014/05/30 7

Page 8: オントロジー工学に基づく知識の体系化と利用

オントロジー工学入門

オントロジーの定義

オントロジー構築・利用環境「法造」

オントロジー構築の基本的な考え方

概念の本質的な性質,分類観点の明確化

簡単なオントロジーの構築例

オントロジー工学の基礎理論

ロール理論

2014/05/30 8

Page 9: オントロジー工学に基づく知識の体系化と利用

2014/05/30 9

オントロジーの定義

哲学用語:「存在論」

人工知能分野

「概念化の明示的記述」

(An explicit specification of conceptualization)by T. Gruber

オントロジー工学

人間が対象世界をどのように見ているかという根源的な問題意識を持って物事をその成り立ちから解き明かし,それをコンピュータと人間が理解を共有できるように書き記したもの

(『オントロジー工学』:溝口理一郎)

Page 10: オントロジー工学に基づく知識の体系化と利用

知識記述とオントロジー 知識記述(モデル化)

知識処理には,対象世界のモデル化(知識記述)が必要. 知識の共有・有効活用には,一貫性をもったモデル化が重要.

オントロジーの役割 「対象世界をどのように捉えたか(概念化したか)を明示し,

一貫性を持って知識(インスタンスモデル)を記述するための共通概念や規約を提供するもの」

対象世界

<item rdf:about="http://www.kanzaki.com/bass/"><title>コントラバスの話</title><link>http://www.kanzaki.com/bass/</link> <description>コントラバスに関する基礎知識、エッセイなどを集めた 楽しくてためになるセクション

</description></item>

<channel rdf:about="http://www.kanzaki.com/info/rss.rdf">…省略…<items> <rdf:Seq>

<rdf:li rdf:resource="http://www.kanzaki.com/bass/"/>…省略…

</rdf:Seq></items> </channel>

オントロジー

知識(インスタンスモデル)

知識記述(モデル化)

概念化2014/05/30 10

Page 11: オントロジー工学に基づく知識の体系化と利用

2014/05/30 11

オントロジー構築・利用の意義

知識をオントロジーに基づいて記述すると... 知識の記述が容易になる

どのような観点から対象を捉えるかが規定されている

用いる概念・語彙が事前に用意されている

制約違反を自動的にチェックできる

記述された知識の「質」が向上する

概念の統一や観点の一貫性が保てる

他人が記述した知識を理解する際に役立つ

知識を変換することができる

知識を共有・知識を再利用できる

オントロジー

知識(インスタンスモデル)

あらゆる知識を扱う際に,その基盤として役立つものがオントロジー

Page 12: オントロジー工学に基づく知識の体系化と利用

オントロジーの構成 対象世界を説明するのに必要な「概念」

概念間の「関係」

概念定義の内容 ラベル(,コメント)

上位概念/下位概念

部分概念

属性

公理

2014/05/30 12

自転車

サドル

ハンドル

前輪

is-a関係

part-of関係

attribute-of関係

秋田犬 土佐犬

ほ乳類

動物

サイズ:26×2.3色: 赤変速:24段変速

・前輪とハンドルは連動している.

・前輪≠後輪

その他の関係

オントロジーの一般的な構成

Page 13: オントロジー工学に基づく知識の体系化と利用

オントロジー構築利用環境「法造」

オントロジー工学の基礎理論に基づいて開発された,オントロジー(=法)の構築(=造)および利用を支援するソフトウェア

1996年より開発

http://www.hozo.jpにてフリーソフトウェアとして公開

登録ユーザ数:約3,500(国内外,2013年1月時点)

医療,バイオ,ナノテク,モバイルサービス,教育などのオントロジー開発のプロジェクトで使用中

ほう【法】(『広辞苑』より引用)・物事の普遍的なあり方。物事をする仕方。

また、それがしきたりになったもの。・社会生活維持のための支配的な規範。・真理。道理。正しい理法。存在の法則性。・ものの性質。特性。属性。・存在するものの分類。カテゴリー

共同研究(開発協力)(株)エネゲート

2014/05/30 13

Page 14: オントロジー工学に基づく知識の体系化と利用

「法造」のオントロジー表現

ノード:概念を表す

is-aリンク:is-a関係を表す

p/oスロット:part-of関係

を表す

a/oスロット:attribute-of

関係を表す

関係リンク:スロット間の

関係を表す

ロール概念

クラス制約

個数制約

2014/05/30 14

Page 15: オントロジー工学に基づく知識の体系化と利用

オントロジー工学入門

オントロジーの定義

オントロジー構築・利用環境「法造」

オントロジー構築の基本的な考え方

概念の本質的な性質,分類観点の明確化

簡単なオントロジーの構築例

オントロジー工学の基礎理論

ロール理論

2014/05/30 15

Page 16: オントロジー工学に基づく知識の体系化と利用

オントロジー構築の基本的な考え方

オントロジー構築の基本姿勢

「何が本質か?」を追求する 例)人間 vs 教師(ロール),もの vs プロセス(川や滝はどちら?)

この基本姿勢が,データスキーマやシソーラスなどとの違い

「対象世界をどのように捉えたか(概念化したか)を明らかにすることにより,諸概念の共通性と相違点を明確にする」

具体的な構築指針

概念間の意味的相違点(分類視点)の明確化 概念の「違い」を理解する(分かる=分ける)

概念間の違いを明確にすることが,is-a階層構築の基本指針

概念の共通性・本質属性

対象とする概念群に共通する性質や本質的な性質(本質属性)を捉える

2014/05/30 16

Page 17: オントロジー工学に基づく知識の体系化と利用

2014/05/30 17

例1)概念(分類)階層のみ 例2)概念の定義を追加

車両-二輪車

-自動二輪-自転車

-三輪車-…

車両-二輪車

→車輪の数 =2-自動二輪

→動力源 =エンジン-自転車

→動力源 =人-三輪車

→車輪の数 =3-…

各概念の意味の違いは暗黙的

各概念の意味の違いが明示化される

分類視点の明確化の例:車両

Page 18: オントロジー工学に基づく知識の体系化と利用

分類視点の明確化の例:料理(揚げ物)

2014/05/30 18

「衣」の違い

「具」の違い

Page 19: オントロジー工学に基づく知識の体系化と利用

分類視点の明確化の例:光デバイス

協力:東工大・伊原学先生

発光機能整流機能・光電流発生機能← 機能による違い→

機能の入力による違い 機能の入力による違い

機能を実現する材料による違い

各概念の意味の違いが明示化される

192014/05/30

機能による違い

Page 20: オントロジー工学に基づく知識の体系化と利用

オントロジー構築のミニレッスン例)「料理を作る」という行為

「お好み焼き」を作る手順 キャベツ,ちくわなどの材料を「切る」

切った材料に水,小麦粉,卵などを「混ぜる」

混ぜた材料(お好み焼きのもと)を「焼く」

「切る」,「混ぜる」,「焼く」といった概念に共通する性質・本質的な捉え方は? 使う道具,手の動かし方などは,全て異なる

料理を作る際に必要な基本動作(行為)という意味では共通?...

対象物に「変化を与える」という点で共通

→行為の前後で「対象物がどのように変化するか」で捉える(概念化する)ことができる.

2014/05/30 20

Page 21: オントロジー工学に基づく知識の体系化と利用

「行為」の定義例

2014/05/30 21

対象物の行為前の状態

対象物の行為後の状態

切る固まり↓

断片化された状態

混ぜる複数の対象物

↓混合物の状態

焼く生↓

焼けた状態

この概念化は,料理に関わらず,あらゆる(他動詞)行為に適用可能

Page 22: オントロジー工学に基づく知識の体系化と利用

オントロジー工学入門

オントロジーの定義

オントロジー構築・利用環境「法造」

オントロジー構築の基本的な考え方

概念の本質的な性質,分類観点の明確化

簡単なオントロジーの構築例

オントロジー工学の基礎理論

ロール理論

2014/05/30 22

Page 23: オントロジー工学に基づく知識の体系化と利用

オントロジー工学の基礎理論

例)下記の概念のオントロジー的な違いは?

ほ乳類

人間

教師

歩行者

殺人者

母親

2014/05/30 23

基本概念(ロールでない普通の概念)=コンテキストに依存せずに単独に定義できる概念

ロール=コンテキスト(他者)に依存する概念

Page 24: オントロジー工学に基づく知識の体系化と利用

オントロジー工学の基礎理論

オントロジー基礎理論

ロール理論

コンテキスト(他者)に依存する概念の理論

identity理論

インスタンスの生成・消滅・同一性の理論

オントロジー構築方法論

視点に応じたIs-a階層の動的生成

p-is-a階層(部分性の着目したis-a階層)

4種類のpart-of オントロジーの洗練支援

2014/05/30 24

医療オントロジー構築過程で明らかになったニーズへの対応

Page 25: オントロジー工学に基づく知識の体系化と利用

ロール概念とは

夫婦関係 夫婦 に おける 夫(妻)の役割 は 人間 が担っている

学校 学校 に おける 教師の役割 は 人間が担っている

自動車 自動車 における前輪(後輪)の役割 は 車輪 が担っている

鳥の唐揚げ 鳥の唐揚げ における具の役割 は 鶏肉 が担っている

ロール概念:

ある“もの”や“人”が特定の状況で「果たす役割」を概念化したもの

夫婦関係

夫・妻ロール

教師ロール

前輪(後輪)ロール

具ロール

2014/05/30 25

コンテキスト ロール概念 プレイヤー

Page 26: オントロジー工学に基づく知識の体系化と利用

ロール概念の構成

26

ロール概念コンテキスト depend on プレイヤー

playing

教員ロール_1

木村さん大阪高校

ロールホルダー

教員-1

大阪高校において、木村さんが教員の役割(教員ロール_1)を担ったとき教員(教員_1)と呼ばれる

学校において、人間が教員ロールを担ったとき教員ロールホルダーと呼ばれる

ロール概念コンテキスト

depend onplayable

教員ロール

人間学校

ロールホルダー教員

クラスの世界

インスタンスの世界

プレイヤー(クラス制約)

2014/05/30 26

コンテキスト プレイヤー ロール概念 ロールホルダー

Page 27: オントロジー工学に基づく知識の体系化と利用

ロール概念・クラス制約・ロールホルダー

2014/05/30 27

ロール概念ある“もの”が特定のコンテクストのもとで果たす役割を捉えて概念化したもの

ロールホルダーロール概念で定義した役割を担っている概念

クラス制約(潜在的プレイヤー)

ロール概念で定義した役割を担うことができる概念

ロール概念が依存しているコンテキスト(概念や関係)

学校において、人間が教員ロールを担ったとき教員ロールホルダーと呼ばれる

コンテキスト プレイヤー ロール概念 ロールホルダー

Page 28: オントロジー工学に基づく知識の体系化と利用

人間

ロールホルダーロール概念 基本概念(クラス制約)

教師

R2-1)年齢(>22)

R2-2)担当教科B1 ,R1)名前

B1,R1) 年齢

教師role

R2-2)勤続年数

B2)身長

B2)体重

ロール概念定義の詳細

基本概念 :B1)ロール概念から参照される/ B2)ロール概念から参照されない

ロール概念:R1)基本概念の定義を参照

R2-1)参照している定義に制約追加/R2-2)ロール概念で新たに追加

ロールホルダー:上記を合わせたもの

2014/05/30 28

ロール概念のみが持つスロット(ロール概念で追加された)

クラス制約から継承されたスロット

ロール概念が参照しないスロット

Page 29: オントロジー工学に基づく知識の体系化と利用

例)ロール概念の定義・クラス制約からの継承

2014/05/30 29

ロール概念のみが持つスロットの追加

クラス制約から継承されたスロット「▼印」で示される

ロール概念が参照しないスロット

Page 30: オントロジー工学に基づく知識の体系化と利用

2014/05/30 30

千里高校

太郎

ロールホルダー

ロール概念「教師role」のインスタンス

基本概念「人間」のインスタンス

(千里高校の)

教師role

コンテクストを定める概念に依存

(千里高校の)

教師

ロールを担う

ロール概念の性質

ロール概念のコンテキスト依存性1)ロール概念のインスタンスは,特定のコンテキストに依存して具

体化される

例) 「教師role」のインスタンスは 「学校」のインスタンス によって定まるコンテクストに依存して具体化される.

2)コンテクストが無くなると,ロール概念のインスタンスも消滅する

例)「学校」が廃校になると,それに伴い

「教師role」のインスタンスも無くなる.

×

×

1)

2)

Page 31: オントロジー工学に基づく知識の体系化と利用

2014/05/30 31

太郎

ロールホルダー

ロール概念「教師role」のインスタンス

基本概念「人間」のインスタンス

(千里高校の)

教師role(千里高校の)

教師

ロールを担う

ロールホルダーの性質 ロールホルダーが消滅する3種類のパターン

1)「太郎」が死ぬと(=人間のインスタンスが消滅)

「教師」は消滅するが, 「教師role」は空きポストとして残る

2) 「太郎」が教師を辞めると(=ロールを担うことを止める)

「教師」は消滅するが, 「教師role」は空きポストとして残る

「人間」のインスタンス(太郎)はそのまま存続

3) 「教師role」が無くなると(=ロール概念のインスタンスの消滅)

「教師」は消滅するが,「人間」(太郎)はそのまま存続

2)×1)×3)×

Page 32: オントロジー工学に基づく知識の体系化と利用

ロール概念を用いる意義

概念のコンテキスト依存性を明確にする コンテキスト(他の概念)が無いと定義できない概念と,コ

ンテキストに独立して定義できる概念を区別する. 例)教師,学生,夫vs.人間 前輪,後輪,駆動輪vs.車輪

クラス制約が同じでも,コンテキスト(=どの概念のスロットか)によってロール概念の定義が追加される. コンテキストに独立して共通な性質は,基本概念の定義

コンテキストに依存して決まる性質は,ロール概念の定義)

と,適切に使い分けることが重要

2014/05/30 32

人間は,コンテキストによって,教師,学生,夫…など別のロール(役割)を果たす.

車輪は,コンテキストによって,前輪,後輪,駆動輪…など別のロール(役割)を果たす.

Page 33: オントロジー工学に基づく知識の体系化と利用

ロール概念の利用例クラス制約となるロールホルダー

ロールホルダーをクラス制約で参照し,別のロール概念を定義することができる.

例)学校の校長ロールを担うのは教師(ロールホルダー)

2014/05/30 33

教師ロールと教師(ロールホルダー)の定義

クラス制約として,教師(ロールホルダー)を参照※クラス制約に“教師”と入れると[RH]という記号は自動的に追加される

Page 34: オントロジー工学に基づく知識の体系化と利用

まとめ:オントロジー工学入門

オントロジー

対象世界を“どのように捉えた(概念化した)か?”を(コンピュータ可読な形で)体系化したもの

オントロジー構築の基本的な考え方

「何がその概念化にとって本質か?」を追求する

オントロジー工学基礎論

(主要な)概念の性質について議論する

「法造」の特徴

ロール理論をはじめとするオントロジー工学基礎理論に基づいたツールである

2014/05/30 34

Page 35: オントロジー工学に基づく知識の体系化と利用

講演概要

講演のねらい

「オントロジー工学」の基本的な考え方,および,その利用方法(知識の体系化,応用システムの開発)の概要を紹介する.

講演内容

オントロジー工学入門

オントロジー利用方法の分類と研究動向

Linked Open Data(LOD)とオントロジー LOD技術の概要

国内におけるLODとOpen Dataの動向

応用事例の紹介 臨床医学オントロジーの構築と利用

バイオミメティック・オントロジーに基づくDB開発

まとめ

2014/05/30 35

Page 36: オントロジー工学に基づく知識の体系化と利用

オントロジーの利用

2014/05/30 36

オントロジー利用研究の分析 Semantic Webの国際会議(ISWC,ESWC,ASWC)(229件)

国内の論文(88件)

分析の観点(方針)オントロジーの使われ方を中心に分析する. オントロジーの種類:どのようなオントロジーを利用するか?

オントロジーの利用タイプ:どのような目的でオントロジーを利用するか?

対象とするドメイン

分析結果資料の入手先(http://www.hozo.jp からもリンクあり)http://www.ei.sanken.osaka-u.ac.jp/hozo/onto_apps/

最新の情報については下記の書籍を参照『オントロジーの普及と応用』(人工知能学会:編集,來村 徳信:編著),オーム社,20125章 オントロジー利用研究の分類と傾向分析(古崎晃司)

Page 37: オントロジー工学に基づく知識の体系化と利用

オントロジーの種類

2014/05/30 37

意味的構成要素による分類 0)統一された語彙集合/簡単なスキーマ

1)概念間のis-a関係に基づく階層

2)is-a以外の関係を含む

3)意味制約の公理的記述を含む

4)その他の強い公理を含む

哲学的な考察の深さによる分類 情報論的な利用効率を重視

哲学的な考察に基づき対象世界を適切に捉えることを重視

その他の分類基準 オントロジーの規模

対象とする領域

オントロジーの構築手法

これら分類基準の組合せにより,「ライトウェイトオントロジー」

vs.「ヘビーウェイトオントロジー」と区別されることがある.

オントロジーの種類によって処理できる内容が異なる

Page 38: オントロジー工学に基づく知識の体系化と利用

オントロジーの種類意味的構成要素による分類

意味的構成要素による分類 0)統一された語彙集合/簡単なスキーマ

rdfs:Classやowl:Classによる概念定義の列挙

1)概念間のis-a関係に基づく階層 rdfs:subClassOf によるクラス階層の記述

2)is-a以外の関係を含む プロパティの記述

制約(Restriction)の記述

3)意味制約の公理的記述を含む transitiveProperty,inverseOfといった関係の性質に関

する制約

disjointWith,oneOfといった制約

4)その他の強い公理を含む ルール記述言語(KIF,SWRLなど)による強い公理(推

論規則など)をとして記述

RDF(S)

OW

LO

WL

+SWRL

382014/05/30

RSS,FOAF

Webディレクトリ

シソーラス+α(概念構造)

より詳細な制約を含むもの

厳密な推論規則を含むもの

Page 39: オントロジー工学に基づく知識の体系化と利用

オントロジー利用タイプの分類

9種の利用タイプで分類 (1)共通語彙 (2)検索 (3)インデックス (4)データスキーマ (5)知識共有の媒体 (6)分析 (7)抽出 (8)知識モデルの規約 (9)知識の体系化

分類の方針 1つのシステムを複数の利用タイプに分類してもよい そのシステムの主目的を中心に分類する

2014/05/30 39

浅い利用

高度な利用

Page 40: オントロジー工学に基づく知識の体系化と利用

(1) 共通語彙としての利用

知識の相互性を高めるために,知識を記述する際に用いる共通語彙としてオントロジーを利用する.

それらの共通語彙は,検索のキーワードや,統計的手法を用いた処理の対象など,様々な用途で用いられる.

オントロジーで定義された語彙を用いて知識を記述

用いられた語彙に対する検索・解析など (共通語彙としての利用)

オントロジー

ドキュメント・データなど

例)・ブログなどに用いられ

るキーワードの解析・メタデータを用いた検索

サービス…など

402014/05/30

Page 41: オントロジー工学に基づく知識の体系化と利用

(2)検索・(6)分析・(7)抽出

(2)検索

適切なメタデータを付与することで,単なるキーワードマッチによる全文検索などでは実現できない,意味処理を含む検索が可能となる.

(6)分析

オントロジーに基づく推論・意味処理の技術などを用いて,メタデータが指す内容を分析することができる.

(7)抽出

分析結果に基づいて利用者に取って意味のある情報を抽出する.(情報推薦なども含む)

2014/05/30 41

検索結果をそのまま提示する

検索結果に何らかの分析結果を併せて提示する

検索結果を絞り込んで意味のある情報を抽出する

Page 42: オントロジー工学に基づく知識の体系化と利用

(3)インデックスとしての利用

適切な情報へアクセスのためのインデックスとしてオントロジーを利用する.

体系の中における語彙の位置づけを明示的に利用する点が1)の共通語彙としての利用と異なる.

例)・Webディレクトリ・リファレンスサービス・コンテンツ管理システム・Webサービス検索

オントロジーで定義された語彙を用いて知識を記述

用いられた語彙に対する検索・解析など (共通語彙としての利用)

オントロジー

ドキュメント・データなど

語彙体系を インデックスとして利用

422014/05/30

Page 43: オントロジー工学に基づく知識の体系化と利用

(4)データスキーマとしての利用

DBなどに格納するデータの構造や値を規定する標準化されたデータスキーマとしてオントロジーを利用する.

オントロジーをデータスキーマとして利用するメリットは,その相互運用性や意味構造を用いた知的処理にある.

オントロジーに基づいてデータや識を記述

・同一オントロジーを用いることによる相互運用

・意味構造を用いた知的処理

オントロジー

データベース・知識モデルなど

データやインスタンスモデルに対する規約を与える

432014/05/30

Page 44: オントロジー工学に基づく知識の体系化と利用

(5)知識共有の媒体としての利用

システム間,人間とシステム,あるいは人間同士の間で知識の相互運用性を高め知識共有を実現する.

複数の知識を同一の参照オントロジーに対応付ける

複数のオントロジーを直接比較する

(1)参照オントロジーで定義された概念と対応付け

(2)参照オントロジーとの対応関係に基づく知識のマッピング・変換

参照オントロジー

知識A 知識B

(a) 参照オントロジーを利用した知識変換

オントロジーA

知識A

オントロジーB

知識B

(1)各オントロジー の概念間の対応付け

(2)各オントロジーの対応関係に基づく知識のマッピング・変換

(b)複数オントロジーを利用した知識変換 442014/05/30

Page 45: オントロジー工学に基づく知識の体系化と利用

(8)知識モデルの規約 オントロジーが提供する概念定義に基づいて構築されたイ

ンスタンスモデルは,対象世界のオブジェクトを表した知識モデルとして用いることができる.

オントロジーは知識モデルに対する規約を与えるメタモデルとして利用できる.

知識モデルには単なるデータに比べて柔軟な知識の意味記述が求められる.

例)・ソフトウェア開発支援・ゲノム分野におけるパスウェイの統一的記述

・eラーニングにおけるオーサリングシステム

オントロジーに基づいてデータや識を記述

・同一オントロジーを用いる ことによる相互運用

・意味構造を用いた知的処理

オントロジー

データベース・知識モデルなど

データやインスタンスモデルに対する規約を与える

452014/05/30

Page 46: オントロジー工学に基づく知識の体系化と利用

(9)知識の体系化への利用

オントロジーの意味的構成要素は,知識の体系化・組織化の核となる概念構造を提供する.

それらを用いることで,対象世界の知識を構成している概念をオントロジーとして体系化し,その規約に基づいて知識管理・運用を実現することができる.

(1)~(8)で述べてきたオントロジーの利用目的を総合的に用いたもの.

462014/05/30

トップレベル・オントロジー

デバイス・オントロジー

部品ライブラリ

物理原理・法則知識

機能概念オントロジー

各機能の達成方式知識

汎用機能分解木 方式特性木

対象の機能モデル対象固有層

一般知識層

基盤概念層

一般概念層

結合 視点依存構造化

選択・具体化

機能概念の具体化

装置中心の観点からの特殊化

達成関係の記述 参照

例)オントロジーに基づく機能的知識体系化[来村02]

Page 47: オントロジー工学に基づく知識の体系化と利用

オントロジーの種類と利用法の分布(Semantic Web研究)

オントロジーの利用法(A)語彙集合/簡易スキーマ

(B)概念階層(C)その他の 関係を含む

(D)意味制約 を含む

(E)強い公理 を含む

(1)共通語彙の提供 1 4 12 1 0 18

(2)意味検索 2 2 49 5 1 59(3)インデックス 1 3 28 5 0 37(4)データスキーマ 1 0 35 5 0 41(5)知識共有の媒体 3 0 39 4 0 46(6)情報分析 4 1 30 5 0 40(7)情報抽出 1 2 25 4 1 33(8)知識モデルの規約 0 1 51 12 10 74(9)知識の体系化 0 2 8 1 0 11

合計 13 15 277 42 12 359

オントロジーの種類合計

2014/05/30 47

Page 48: オントロジー工学に基づく知識の体系化と利用

オントロジーの種類と利用法の分布(国内研究)

2014/05/30 48

オントロジーの利用法(A)語彙集合/簡易スキーマ

(B)概念階層(C)その他の 関係を含む

(D)意味制約 を含む

(E)強い公理 を含む

(1)共通語彙の提供 2 2 11 1 3 19

(2)意味検索 2 1 14 0 0 17(3)インデックス 2 0 1 2 0 5(4)データスキーマ 4 0 4 0 0 8(5)知識共有の媒体 2 0 18 3 0 23(6)情報分析 5 1 14 1 1 22(7)情報抽出 1 1 25 4 3 34(8)知識モデルの規約 1 1 46 7 4 59(9)知識の体系化 0 0 1 2 0 3

合計 19 6 134 20 11 190

オントロジーの種類合計

Page 49: オントロジー工学に基づく知識の体系化と利用

オントロジー利用法の分布

5%

19%

10%

13%

13%

11%

9%

20%

3% (1)共通語彙(2)検索(3)インデックス(4)データスキーマ(5)知識共有の媒体(6)情報分析(7)情報抽出(8)知識モデルの規約(9)知識の体系化

2014/05/30 49

10%

19%

3%4%

12%

12%18%

31%

2%

(1)共通語彙(2)検索

(3)インデックス

(4)データスキーマ

(5)知識共有の媒体

(6)情報分析

(7)情報抽出

(8)知識モデルの規約

(9)知識の体系化

Semantic Web研究 国内のオントロジー利用研究

Page 50: オントロジー工学に基づく知識の体系化と利用

まとめ:オントロジーの利用

オントロジーの利用

検索から知識の体系化まで,様々な利用のされ方がある

どのようなオントロジーが必要になるかは,その利用目的,対象領域などに依存する

2014/05/30 50

Page 51: オントロジー工学に基づく知識の体系化と利用

講演概要

講演のねらい

「オントロジー工学」の基本的な考え方,および,その利用方法(知識の体系化,応用システムの開発)の概要を紹介する.

講演内容

オントロジー工学入門

オントロジー利用方法の分類と研究動向

Linked Open Data(LOD)とオントロジー LOD技術の概要

国内におけるLODとOpen Dataの動向

応用事例の紹介 臨床医学オントロジーの構築と利用

バイオミメティック・オントロジーに基づくDB開発

まとめ

2014/05/30 51

(2)検索(3)インデックス(4)データスキーマ(5)知識共有の媒体

Page 52: オントロジー工学に基づく知識の体系化と利用

Linked Open Data(LOD)とオントロジー

Semantic Web技術の概要

従来のWebからSemantic Webへ

オントロジーの位置づけ

Semantic WebからLODへ

国内におけるLODとOpen Dataの動向

LODに関わるコミュニティ

日本政府によるOpen Dataの取り組み

Open Dataに関するコンテスト

2014/05/30 52

Page 53: オントロジー工学に基づく知識の体系化と利用

(従来の)Webの基本的仕組み

Webを構成する基本的な技術

URL(Uniform Resource Locator) Web(インターネット)上の文書の置き場所を表す

HTML(HyperText Markup Language) Webページを記述するためのマークアップ言語.

ハイパーリンク(hyperlink)により,他のWebページとの関連(リンク)を記述することができる.

(従来の)Webの本質

URLで示された文書をハイパーリンクを用いて関連づけることにより,リンクを辿って,世界中の(インターネットに接続された)コンピュータで公開された文章を,自由に閲覧(ブラウジング)できる.

誰でも,自由に情報を発信できる.

2014/05/30 53

Page 54: オントロジー工学に基づく知識の体系化と利用

HTMLの例

2014/05/30 54

閲覧中のWebページのURL

<h3><a href=“http://headlines.yahoo.co.jp/hl?a=20130528-00000501-fsi-bus_all”>デジタル家電価格に底入れの兆し 「数から質へ」競争も変化</a></h3>

デジタル家電の価格下落に底入れの兆しが出てきた。「値段が張っても機能性を重視する消費者が増えてきた」(アナリスト)ことが要因だ。価格競争に苦しんできた電機メーカーにとっては吉報といえそうだ。夏商戦で各社はフルハイビジョンの約4倍の解像度の「4K」に対応した次世代テレビなどを投入予定で、需要の掘り起こしに躍起になっている。 (SankeiBiz) <br><a href="http://headlines.yahoo.co.jp/hl?a=20130528-00000501-fsi-bus_all">[記事全文]</a><br><br>◇価格低下から転換?<br>・ <a href="http://headlines.yahoo.co.jp/hl?a=20130429-00000005-san-bus_all">電機大手どうなる「通信簿」 脱デジタル家電で明暗</a> - 産経新聞(4月29日) <br>・ <a href="http://headlines.yahoo.co.jp/hl?a=20130416-00000004-rbb-sci">デジタル家電が値上がり傾向、背景に“アベノミクス”と“円安”あり? カカクコム調べ</a> - RBB TODAY(4月16日) <br>

ソースファイル(HTML)では,文書に「タグ」を付与することで様々な情報を付与

ハイパーリンクを表すタグ

文字サイズを表すタグ

改行を表すタグ

Page 55: オントロジー工学に基づく知識の体系化と利用

従来のWebからセマンティック(Semantic Web)へ

従来のWebの基本思想 文書を効率的に公開するための仕様.

文書の内容については「人が読んで理解する」ことが前提.

→HTMLに用いられるタグは,文書を読みやすく見せるための「レイアウト」を指定するためのもの(が中心).

Webに対するあらたなニーズ 膨大に公開されたWeb文書(=情報)を,コンピュータを用いて効果的に活

用したい.

Webページの「意味」を,コンピュータに理解させたい. 例)“藤沢”,“野田” →「人名」 or 「地名」 ?

(病院のページの)“土曜日”という記載 → 「休診日」 or 「開業日」?

※人が読めば,前後のコンテキストで理解できるが,コンピュータには

理解が難しい(自然言語処理などで理解しようという研究もある).

→Webページ上の「情報(データ)の意味」を表すメタデータをタグ付けすることで,「データのWeb」を実現する.

=セマンティックウェブ(Semantic Web)の基本思想2014/05/30 55

Page 56: オントロジー工学に基づく知識の体系化と利用

Semantic Webの概要

Semantic Webとは

従来の「人が読む(理解する)ためのWeb」から,

「コンピュータが理解(意味処理)可能なWeb」へ

技術的には,

Web上のドキュメントにコンピュータによる意味処理に用いる「メタデータ」を付与する(タグを付ける)」

その際に用いるフォーマットが「RDF」

メタデータに用いる語彙を定義するのが「オントロジー」(RDFSやOWLで書かれる)

RDFで書かれたメタデータを検索するためのクエリー言語が「SPARQL」

...

2014/05/30 56

Page 57: オントロジー工学に基づく知識の体系化と利用

Layer Cake

Semantic Webに必要な要素技術を階層状に表したもの

2014/05/30 57

http://www.w3.org/2001/09/06-ecdl/slide17-0.html http://www.dajobe.org/talks/200905-redland/

Page 58: オントロジー工学に基づく知識の体系化と利用

RDF(Resource Description Framework)

Web上の情報(リソースと呼ぶ)を記述するための統一的枠組み

RDFのデータモデル 主語(subject),述語(predicate),目的語(object)の3つ組み(トリプル)の組み

合わせで,リソースに関する情報を表現する.

計算機表現上はXML形式をはじめ,いくつかの表現が用意されている.

リソースはURI(Uniform Resource Identifier:Web上の情報資源(リソース)の場所を示すための記述方式.URLはURIの一種)を用いて表される.

2014/05/30 58

知識工学論

古崎担当教員

主語 述語 目的語

所属知識システム

研究分野

述語 目的語主語

來村担当教員 所属授業コード

280598

Page 59: オントロジー工学に基づく知識の体系化と利用

RDF(Resource Description Framework)

Web上の情報(リソースと呼ぶ)を記述するための統一的枠組み

RDFのデータモデル 主語(subject),述語(predicate),目的語(object)の3つ組み(トリプル)の組み

合わせで,リソースに関する情報を表現する.

計算機表現上はXML形式をはじめ,いくつかの表現が用意されている.

リソースはURI(Uniform Resource Identifier:Web上の情報資源(リソース)の場所を示すための記述方式.URLはURIの一種)を用いて表される.

目的語には「リテラル」(文字列)を用いることができる.

2014/05/30 59

https://koan.osaka-u.ac.jp/koan/lecture#280598

http://www.ei.sanken.osaka-u.ac.jp/~kozaki/

担当教員

主語 述語 目的語

所属http://www.ei.sanken.

osaka-u.ac.jp/main

述語 目的語主語

http://www.ei.sanken.osaka-u.ac.jp/~kita/

担当教員 所属授業コード

280598

リソース

リテラルプロパティ

:リソース間の関係

Page 60: オントロジー工学に基づく知識の体系化と利用

RDF(Resource Description Framework)

Web上の情報(リソースと呼ぶ)を記述するための統一的枠組み

RDFのデータモデル 主語(subject),述語(predicate),目的語(object)の3つ組み(トリプル)の組み

合わせで,リソースに関する情報を表現する.

計算機表現上はXML形式をはじめ,いくつかの表現が用意されている.

リソースはURI(Uniform Resource Identifier:Web上の情報資源(リソース)の場所を示すための記述方式.URLはURIの一種)を用いて表される.

2014/05/30 60

koan:lecture#280598 ei:kozaki/担当教員

主語 述語 目的語

所属ei:main

述語 目的語主語

ei:kita/担当教員 所属授業コード

280598ネームスペース(namespace)を用いると…koan:=https://koan.osaka-u.ac.jp/koan/ei:=http://www.ei.sanken.osaka-u.ac.jp/

Page 61: オントロジー工学に基づく知識の体系化と利用

セマンティックウェブにおけるオントロジー

RDFで表されたメタデータの意味を明確にし,Web上で共有するには,メタデータ記述に用いる「語彙」を統一する必要がある.

→用いる「語彙」をオントロジーとして定義する.

セマンティックウェブにおけるオントロジーの役割

メタデータを記述する際に用いることが出来る「語彙」(=リソースとプロパティの種類)を規定する.

2014/05/30 61

koan:lecture#280598 ei:kozaki/担当教員 所属

ei:main

ei:kita/担当教員 所属授業コード

280598koan:=https://koan.osaka-u.ac.jp/koan/ei:=http://www.ei.sanken.osaka-u.ac.jp/

講義

Class Property

教員

人間担当教員 所属

rdfs:subClassOf

rdfs:subClassOf

rdfs:subClassOf

rdfs:subPropertyOfrdfs:subPropertyOf

rdfs:type rdfs:type rdfs:typerdfs:type

rdfs:type rdfs:type rdfs:type

インスタンス

クラス

Page 62: オントロジー工学に基づく知識の体系化と利用

RDFSとOWL

セマンティックウェブにおいてオントロジー記述に用いられる言語

RDFS(RDF Schema) クラスおよびプロパティのis-a階層

プロパティの定義域(domain)/値域(range):主語/目的語となれるリソースの種類

OWL(Web Ontology Language) あるクラスの持つプロパティの値域に関する制約

→述語論理における全称記号(∀),存在記号(∃)に相当する表現

あるクラスが持つプロパティの数に関する制約

プロパティの推移律(例:「子孫の子孫」は「子孫」)

..など,より詳細なオントロジーの記述が可能

2014/05/30 62

Page 63: オントロジー工学に基づく知識の体系化と利用

SPARQL

SPARQL RDFデータに対するクエリ言語

「指定したグラフ構造」に一致するトリプルを検索する

select distinct * where { ?s ?p ?o . } LIMIT 100

select distinct * where { <http://ja.dbpedia.org/resource/東京都> ?p ?o . } LIMIT 100

select distinct ?s where {?s <http://www.w3.org/2000/01/rdf-schema#label> ?o FILTER(regex(str(?o), “Osaka", "m")) .}

2014/05/30 63

日本語DBPediaでのクエリ検索例 http://ja.dbpedia.org/で指定したパターンに一致するトリプルを検索する.

←取得する数

↑同じパターンは除外する

↓返す要素(*は全て)

全トリプルの組み合わせ

東京都を主語(Subject)に含むトリプル

ラベルに“Osaka”を含むトリプル

Page 64: オントロジー工学に基づく知識の体系化と利用

Semantic Webの研究動向の変遷

研究動向(流行トピック)の変遷 語彙(オントロジー)に基づいたメタデータによる意味処理の実現

誰がメタデータを?→Web2.0的共同構築

データ(インスタンス)のLinkの重視:Linked Data

2014/05/30

リッチな意味記述

スケーラビリティ(大量データ)

Semantic Web (の理想)

すぐに使えるタグを(RSS,FOAF)

SNS利用・Web2.0

DBPedia× Linked Data

2004-2006

2007

2008-

64

Page 65: オントロジー工学に基づく知識の体系化と利用

TED Talk by Tim Berrners Lee (1) 2009/2

~Raw Data Now!~

2014/05/30

http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html

データを抱え込むのでは無く,誰もが使えるように(オープンに)することを呼びかける=Raw Data Now!(生データをすぐに!)

65

Page 66: オントロジー工学に基づく知識の体系化と利用

TED Talk by Tim Berrners Lee (1) 2010/2

~LODの活用事例~

2014/05/30

http://www.ted.com/talks/tim_berners_lee_the_year_open_data_went_worldwide.html

オープンデータの活用事例を紹介・白人/黒人の住む家と水道管の整備状況

の相関を見える化→裁判で勝利へ・Where does my money go?

(税金はどこへ行った?)(英国) http://wheredoesmymoneygo.org/(横浜市) http://spending.jp/

66

Page 67: オントロジー工学に基づく知識の体系化と利用

Linked Dataが目指すこと

WWW(World Wide Web) 文書を公開し,相互に接続(ハイパーリンクでつなぐ)ための

革命的な仕組みを提供したことで,今日のWebの発展につながった.

Linked Data データを共有(公開)し,相互につなぐ仕組みを提供する.

Linked Dataの原理

データの構造化 構造化されたデータはより洗練された処理を可能にする

分散したデータをつなぐハイパーリンク 文書単位では無く,データ単位のリンクを可能にする.

データの島々から一つのグローバルデータ空間へ 分散されたデータ群を1つのグローバルなデータ空間へ統合する

参考:『Linked Data-Webをグローバルなデータ空間にする仕組み(Tom Heath, Christian Bizer(武田英明監訳),丸善,2013)』 1章.はじめに

2013/8/5 第2回LODとオントロジー勉強会 67

Page 68: オントロジー工学に基づく知識の体系化と利用

既に公開・リンクされているLOD~LODクラウド~

2014/05/30

2007/5/1

2007/10/82008/9/182009/7/14

2010/9/22http://lod-cloud.net/

2011/9/19時点

1つの丸が個別に公開されたDBを表す.

参考:「Linked Data-Webをグローバルなデータ空間にする仕組み」 3章.データのWeb

マスメディア

地理情報

図書館・教育

ユーザ作成データ

政府情報クロス・ドメイン

ライフサイエンス

DBPedia

open.govopen.gov.uk

68

Page 69: オントロジー工学に基づく知識の体系化と利用

DBPedia

2014/05/30

Wikipediaの各記事のインフォボックスの情報を抽出して自動生成されるLOD様々なデータをつなぐLODのハブ的な存在となっている.

http://dbpedia.org/

日本語版のDBPediaはhttp://jp.dbpedia.org/

インフォボックスの例

69

Page 70: オントロジー工学に基づく知識の体系化と利用

Linked Open Data(LOD)とオントロジー

Semantic Web技術の概要

従来のWebからSemantic Webへ

オントロジーの位置づけ

Semantic WebからLODへ

国内におけるLODとOpen Dataの動向

LODに関わるコミュニティ

日本政府によるOpen Dataの取り組み

Open Dataに関するコンテスト

2014/05/30 70

Page 71: オントロジー工学に基づく知識の体系化と利用

国内でのLODに関する活動 学術的な取り組み

国立情報学研究所(NII):博物館情報,文献DB,科研費DB,など

JSTバイオサイエンスデータベースセンター(NBDC):生命科学情報

理化学研究所:生命科学情報

オープンガバメント 電子行政オープンデータ戦略(2012/7/4) 経済産業省

オープンガバメントラボ,IT融合フォーラム 公共データワーキンググループ, Open Data METI(経産省のオープンデータ公開サイト)

総務省 オープンデータ流通推進コンソーシアム

地方自治体:地域情報のオープンデータ化 鯖江市,横浜市LOD,会津若松市,流山市,千葉市,...

世界先端IT国家宣言(案):2013/05/24 その他:オープンデータを推進している団体

Linked Open Data Initiative Open Knowledge Foundation Japan Linked Open Data チャレンジ Japan 2011-

2014/05/30

日本ではLODに関する学術的取り組みが先行

東日本大震災以降,政府のオープンデータへの取り組みが活発化

71

Page 72: オントロジー工学に基づく知識の体系化と利用

2014/05/30

http://www.kantei.go.jp/jp/singi/it2/pdf/120704_siryou2.pdf72

Page 73: オントロジー工学に基づく知識の体系化と利用

2014/05/30 73

Page 74: オントロジー工学に基づく知識の体系化と利用

2014/05/30

http://www.openlabs.go.jp/

74

Page 75: オントロジー工学に基づく知識の体系化と利用

2014/05/30

http://www.opendata.gr.jp/

オープンデータの流通を推進する環境を整備するために,産官学の共同で取り組む活動母体として設立されたコンソーシアム(2012年7月)

75

Page 76: オントロジー工学に基づく知識の体系化と利用

2014/05/30

http://datameti.go.jp/

経済産業省が保有するデータをオープンデータとして公開することを実践するための試験サイト

LODチャレンジJapan2012「オープンデータ推進賞」

76

Page 77: オントロジー工学に基づく知識の体系化と利用

2014/05/30 77

http://www.kantei.go.jp/jp/singi/it2/dai61/siryou2-1.pdf より

○公共データの民間開放(オープンデータ)の推進、ビッグデータの利活用促進(パーソナルデータの流通・促進等)

2013/05/24

Page 78: オントロジー工学に基づく知識の体系化と利用

2014/05/30 78

http://www3.nhk.or.jp/news/html/20130524/k10014805311000.html (現在は非公開)

2013/05/24

交通や地理などについての各府省の公共データを一括検索できるサイトを立ち上げて来年から運用を開始

Page 79: オントロジー工学に基づく知識の体系化と利用

統計情報の一括検索サイト

2014/05/30 79

http://statdb.nstac.go.jp/

Page 80: オントロジー工学に基づく知識の体系化と利用

G8サミット・首脳宣言で「オープンデータ憲章」に合意

2014/05/30 80

http://www.mofa.go.jp/mofaj/gaiko/page23_000044.html

2013/06/18

我々は,オープンデータが,イノベーションと繁栄を可能にし,また,市民のニーズに合致した,強固かつ相互に繋がった社会を構築していくための大きな可能性をもった未開発の資源であることに合意する。そのため,我々は,以下の原則に合意する。• 原則としてのオープンデータ• 質と量• すべての者が利用できる• 改善したガバナンスのためのデータの公表• イノベーションのためのデータの公表

G8各国が,「オープンデータを推進する」ことに合意

Page 81: オントロジー工学に基づく知識の体系化と利用

日本政府の「オープンデータポータル」サイト

2014/05/30 81

http://www.data.go.jp/

Page 82: オントロジー工学に基づく知識の体系化と利用

2011~Linked Open Dataチャレンジ

2014/05/30 82

http://lod.sfc.keio.ac.jp/2014年も開催します!

Page 83: オントロジー工学に基づく知識の体系化と利用

アーバンデータチャレンジ東京2013

2014/05/30 83

2014年も開催予定

Page 84: オントロジー工学に基づく知識の体系化と利用

経済産業省・総務省

オープンデータ・ユースケースコンテスト

2014/05/30 84

Page 85: オントロジー工学に基づく知識の体系化と利用

オープンデータ流通コンソーシアム,総務省

オープンデータ・アプリコンテスト

2014/05/30 85

Page 86: オントロジー工学に基づく知識の体系化と利用

講演概要

講演のねらい

「オントロジー工学」の基本的な考え方,および,その利用方法(知識の体系化,応用システムの開発)の概要を紹介する.

講演内容

オントロジー工学入門

オントロジー利用方法の分類と研究動向

Linked Open Data(LOD)とオントロジー LOD技術の概要

国内におけるLODとOpen Dataの動向

応用事例の紹介 臨床医学オントロジーの構築と利用

バイオミメティック・オントロジーに基づくDB開発

まとめ

2014/05/30 86

(2)検索(3)インデックス(7)抽出

(8)知識モデルの規約(9)知識の体系化

Page 87: オントロジー工学に基づく知識の体系化と利用

オントロジーを利用したアプリケーションの事例紹介

臨床医学オントロジーの構築と利用

医療オントロジーの開発疾患,人体,診療データ等に関するオントロジー(知識を計算機で意味処理可能な形で体系化したもの)を開発する.

医療行為支援システムの開発開発したオントロジーに基づいて医療行為支援(診断,検査・測定,看護など)等の応用システムを開発する.

開発済みの医療オントロジー(一部)疾患オントロジー: 12診療科約6000の疾患

を対象に主な病態や症状の連鎖を記述.解剖学(接続構造)オントロジー:主な血管,

神経,骨の接続関係(約1万)を記述.

平成19~21年度 医療情報システム開発普及等委託費(厚生労働省)

「医療情報システムのための医療知識基盤データベース研究開発事業」

(代表者:東京大学医学部・大江和彦分担者:大阪大学・溝口理一郎,他)

想定される応用システム‐医療知識の体系的なナビゲーション‐起こりうる病態・症状の連鎖の推論‐血流による物質伝搬のシミュレーター

オントロジー構築ツール「法造」

医療オントロジー医療オントロジー

医療オントロジーの想定応用範囲 医療知識ナビゲーター

病態/症状連鎖の推論システム

872014/05/30

Page 88: オントロジー工学に基づく知識の体系化と利用

疾患概念の捉え方 基本方針

疾患概念を「その原因と途中経過を含めた一連の状態変化の連鎖と,それにより引き起こされている結果状態との総体」として捉える.

疾患概念定義で扱うべき連鎖の種類 汎用連鎖:人体で起こりうると思われる全連鎖.すべての疾患から共通して参照される. 注目疾患連鎖:疾患定義に必要な連鎖.その疾患を発症した患者には共通して見られる. 派生疾患連鎖:ある注目疾患連鎖を含む連鎖.その疾患を発症した患者に起こりうる. 注目対象疾患連鎖:下位となる全疾患概念の注目疾患連鎖の総和. 派生対象疾患連鎖:下位となる全疾患概念の派生疾患連鎖の総和.

2014/05/30 88汎用連鎖

……

派生疾患連鎖

注目対象疾患連鎖

注目する連鎖の範囲を広げることで疾患の下位概念を定義

注目疾患連鎖

注目する病態(中心病態)

Page 89: オントロジー工学に基づく知識の体系化と利用

疾患定義の例(糖尿病とその下位疾患)

インスリン作用不足

受容体異常

失明

β細胞の破壊

高血糖

血中インスリン量

の絶対的低下

ステロイド投与

1型糖尿病

失明を伴った糖尿病

ステロイド糖尿病

糖尿病

注目する連鎖の範囲(疾患定義連鎖)の違いで各疾患を定義する

上流疾患連鎖 原因系となる異常状態の連鎖

結果系となる異常状態の連鎖

下流疾患連鎖

2014/05/30 89

Page 90: オントロジー工学に基づく知識の体系化と利用

アレルギーリウマチ内科:37眼科 :561血液内科 :415呼吸器内科 :788耳鼻科 :470循環器内科 :610小児科 :879神経内科 :418腎臓内分泌内科 :142整形外科 :139糖尿病代謝内科 :506皮膚科 :1086--------------------------

合計 :6051

90

疾患オントロジー

異常状態

因果関係

12診療科・6000疾患から抽出された

数万の異常状態間の因果連鎖の可視化・推論処理が可能に!

異常状態オントロジーに基づき,各疾患の異常状態・因果関係を一般化することで,診療科を横断した汎用的な因果連鎖を抽出

2014/05/30

12診療科の臨床医が疾患定義(異常状態間の因果連鎖)を記述

Page 91: オントロジー工学に基づく知識の体系化と利用

異常状態オントロジー

構造

形状 材質 位相

変形

線の変形 面の変形 立体の変形

縮小 拡大

狭窄

血管狭窄 xx狭窄 xxx狭窄

冠状動脈狭窄

xx動脈狭窄

xxxx狭窄 各診療科共通で,

再利用できる概念

各診療科毎に疾患定義(因果連鎖)において異常状態を記述

レベル1:人体非依存の異常状態

レベル2:複数疾患に汎用的に現れる異常状態

レベル3:各疾患に現れる異常状態

属性⇔特性変換

異常状態(知識)を定量表現(rawデータ)に変換

912014/05/30

Page 92: オントロジー工学に基づく知識の体系化と利用

92

異常状態オントロジーに基づく臨床データの統合利用

異常状態のis-a(上位-下位)階層

臨床医による疾患定義(因果連鎖)

垂直方向(異常状態のis-a階層)と水平方向(因果連鎖)を組み合

わせた柔軟な推論が可能

垂直方向(異常状態のis-a階層)と水平方向(因果連鎖)を組み合

わせた柔軟な推論が可能

知識

臨床データベース

定量データを定性化を介して特性(異常状態)に変換することで,臨床データベースをオントロジーベースの知識と統合利用が可能

定量データを定性化を介して特性(異常状態)に変換することで,臨床データベースをオントロジーベースの知識と統合利用が可能

データ

属性⇔特性変換

2014/05/30

Page 93: オントロジー工学に基づく知識の体系化と利用

疾患コンパス「疾患連鎖LOD」(LODチャレンジ2013「ライフサイエンス賞」)を,

他のデータセットと“つなげる”ことで,「疾患に関する様々な情報を統合的に閲覧」できるサービスです.

古崎 晃司,山縣友紀,加藤 敦丈(大阪大学)

今井 健,大江 和彦(東京大学)

溝口 理一郎(北陸先端科学技術大学院大学)

※本システムは「医療情報システムのための医療知識基盤データベース研究開発事業(2010‐2012,2013‐2015年度,厚生労働省委託事業)」の助成を受け開発されたものです.→詳細 http://www.med‐ontology.jp/

LODチャレンジJapan 2013:a105

DBpedia(日/英)

http://lifesciencedb.jp/bp3d/

疾患が「どのような原因/メカニズムで起こるか?」疾患が「どのような症状を引き起こすか?」といった疾患知識(オントロジー)をLOD化したもの.(※各診療科の臨床医が記述)

疾患連鎖LOD

BodyParts3D(DBCLSにて公開)

http://ja.dbpedia.org/ http://dbpedia.org/

他の関連情報へ

臓器,器官等の3D画像

疾患の概要

2014/05/30 93

Page 94: オントロジー工学に基づく知識の体系化と利用

「疾患コンパス」の利用方法公開ページ http://lodc.med‐ontology.jp/表示する疾患の「選択」or「検索」(疾患名or含まれる症状などで検索可能)

疾患連鎖(≒「原因」から「主な病態」「症状」に至る「因果連鎖」)を表示(疾患連鎖LODから生成)

疾患の主な影響範囲を3D画像で可視化(BodyParts3Dを利用)

疾患の概要を表示(DBpediaを利用)

疾患定義

異常状態(病態,症状など)

2014/05/30 94

Page 95: オントロジー工学に基づく知識の体系化と利用

「疾患コンパス」の利用方法公開ページ http://lodc.med‐ontology.jp/表示する疾患の「選択」or「検索」(疾患名or含まれる症状などで検索可能)

疾患連鎖(≒「原因」から「主な病態」「症状」に至る「因果連鎖」)を表示(疾患連鎖LODから生成)

疾患の主な影響範囲を3D画像で可視化(BodyParts3Dを利用)

疾患の概要を表示(DBpediaを利用)

疾患連鎖上で「選択」した異常状態(病態,症状など)に対象箇所がハイライトされる

関連するDBへのリンク

LODチャレンジ2013アプリケーション部門「優秀賞」2014/05/30 95

Page 96: オントロジー工学に基づく知識の体系化と利用

ドメイン俯瞰のためのオントロジー探索ツール

オントロジーを利用したアプリケーションの事例紹介

2014/05/30 96

環境省:Hc-082「アジzア太平洋地域における地球温暖化の持続可能な発展のためのバイオ燃料利用戦略に関する研究」(H20-22年度,研究代表者:東京大学・武内和彦教授)

サブテーマ(1)オントロジーを用いた問題の構造化と政策立案支援ツールの開発

共同研究大阪大学サステイナビリティ・サイエンス研究機構(RISS)

[熊澤輝一特任助教]

Page 97: オントロジー工学に基づく知識の体系化と利用

環境省:Hc-082「アジzア太平洋地域における地球温暖化の持続可能な発展のためのバイオ燃料利用戦略に関する研究」(H20-22年度,研究代表者:東京大学・武内和彦教授)

サブテーマ(1)オントロジーを用いた問題の構造化と政策立案支援ツールの開発

オントロジーによるドメイン俯瞰 研究背景

複雑化・巨大化された問題を適切に理解にするには,従来の個別ドメインからだけでは困難であり,様々な視点から領域を俯瞰し統合的に理解することが必要.

特にトレードオフ問題の理解には,領域を横断した俯瞰が重要.

研究目的 任意の視点からドメインを俯瞰できるオントロジー探索ツールの開発

規定できる効果-暗黙的であった利用者の知りたい知識の理解支援-思いがけない内容の掲示による利用者の発想刺激

2014/05/30 97

Page 98: オントロジー工学に基づく知識の体系化と利用

オントロジー探索ツールの概要

利用者の視点に応じてオントロジーを探索(Explore)し,その結果を「概念マップ」として可視化する.

1.オントロジーの探索着目する概念(Focal point)を法造上で指定した後,注目する関係性(aspect)を繰り返し選択

法造 – オントロジーエディタ

概念マップ

2.概念マップ表示探索の結果を利用者が把握しやすい

ように概念マップとして可視化

多視点概念鎖(Multi- perspective conceptual chains)

利用者の興味のある視点に応じてオントロジーから概念連鎖を抽出

他ツール

(コンテンツ管理システム)

連携

2014/05/30 98

Page 99: オントロジー工学に基づく知識の体系化と利用

オントロジーの探索・可視化

着目する概念(Focal point)

任意の関係性を指定した視点(aspect)にそって辿る

概念マップ

関係性を辿った結果(多視点概念鎖)を概念マップとして可視化

バイオ燃料生産からバイオエタノールを経て,トウモロコシ,サトウキビの関連概念やバイオマスと食料の競合問題,水を介して貧困国の女性問題や生態系破壊問題,作付けに関わる土地競合問題などが同時に浮き彫りにされ,問題を俯瞰的に見ることができる概念マップが生成された.

2014/05/30 99

Page 100: オントロジー工学に基づく知識の体系化と利用

バイオミメティク・オントロジー

バイオミメティクス(biomimetics)研究

「自然に学ぶものつくり」=bio+mimetic(模倣)

欧米を中心に注目されている

研究事例

蓮の葉の撥水性(ロータス効果)を模倣した,塗装やセルフクリーニングに関する研究

ヤモリの指の粘着性に着目した接着剤の開発

蝶や玉虫の「構造色」

流体抵抗の低いサメ肌

の構造を模した高速水着

2014/05/30 100

Page 101: オントロジー工学に基づく知識の体系化と利用

生物規範工学

2014/05/30 101

科学研究費補助金 新学術領域研究(研究領域提案型)

「生物多様性を規範とする革新的材料技術」H24~H29年度

(領域代表:東北大・下村政嗣,略称:生物規範工学)

Page 102: オントロジー工学に基づく知識の体系化と利用

2014/05/30 102

生物規範工学:A01 生物規範基盤

Page 103: オントロジー工学に基づく知識の体系化と利用

バイオミメティックDBに求められる特徴

多種多様なデータや知識の相互運用性 工学・化学~生物学という異分野連携

多数の異なる機関から提供されるデータの統合

テキスト(文献情報),画像,実験データ,…など異なるデータ形式の統合

発想支援・連想型の検索機構 機能,構造,プロセス,生態系など多様な観点

からの検索

“想定外の(思いがけない)”つながりの発見

オープンなプラットフォームとしての公開 誰もが自由に利用できる仕組みを作ることで,

プラットフォームを自己成長させる.

2014/05/30 103

オントロジーの利用

→Linked Open Data (LOD)の利用

Page 104: オントロジー工学に基づく知識の体系化と利用

バイオメティック・オントロジー

上位オントロジー

自然物 機能

共通語彙・データスキーマの提供

分野の境界を越えた自由な検索を実現

データの蓄積・共有

バイオミメティックDBの全体像

2014/05/30 104生物イベントリー 画像データ 文献情報...

LODとして公開

データをOpenに公開し,相互連携(Link)する仕組み

データベースの意味処理基盤を与える概念体系

Page 105: オントロジー工学に基づく知識の体系化と利用

バイオミメティックデータベースに求められる想定検索事例

「(材料としての)機能」からの検索

材料研究者が求める「機能」

その機能を実現している生物(の部位)

画像一覧

類似画像の検索(北大グループ)

標本所蔵先の一覧

関連文献

その機能が必要とされる状況

生物の生態環境

近い種の生物に検索範囲を拡大

機能オントロジー

生物種オントロジー

生態環境オントロジー

例)クリーニング機能→汚れやすい環境で必要

例)泥の中で生活

発想支援・連想型の検索機構• 機能,構造,プロセス,生態系など多様な観

点からの検索• “想定外の(思いがけない)”つながりの発見

1052014/05/30

Page 106: オントロジー工学に基づく知識の体系化と利用

バイオミメティック・オントロジーの探索例:ゴール→生物(SearcPath)

2014/05/30 106

ゴール

機能

生態環境生態環境

構造,行動構造,行動

探索が到達した生物種

・機能 → 生物種 → 構造・機能 → 生態環境 → 生物種 → 構造・機能 → 生物の行動 → 生物種 → 構造・機能 → 構造 → 生物種といった,様々な観点からのつながりが見える

Page 107: オントロジー工学に基づく知識の体系化と利用

オントロジーに基づくDB検索システム

公開ページ http://biomimetics.hozo.jp/ontology_db.html

①目標とするゴールを選択し,機能→構造/生態環境…→生物種などの関連をオントロジーから検索

②検索結果をマップとして可視化

③マップ上で選択した概念(用語)の概要を表示

(外部DB(Dbpedia)の情報を利用)

④外部DBと連携した検索※画像DBや他のDBとも同様

の連携を予定

⑤論文DB(CiNii)の検索結果例※連携するDBを増やすことも可能

2014/05/30 107

Page 108: オントロジー工学に基づく知識の体系化と利用

防汚,抗菌塗料からの探索例

2014/05/30 108

ゴール機能

生態環境生物

Page 109: オントロジー工学に基づく知識の体系化と利用

まとめ

研究方針:オントロジー構築・利用の理論・ツール・実践

オントロジー工学の「理論」・理論に基づいて実装された「ツール」・それらを各種領域のオントロジー構築・利用に適用するという「実践」を3本柱として研究を進めている.

3本柱のそれぞれが,オントロジーの「構築」と「利用」を対象とする.

覚えて頂きたいキーワード

オントロジー工学

対象世界を“どのように捉えたか?”を適切に計算機上で表すための技術を提供する

法造 オントロジー工学の基礎理論に基づいた構築・利用ツール

LOD(Linked Open Data) Web上に公開されたデータを相互につなぐ(リンクする)ことにより,新た

な価値をもつグローバルなデータとするための技術を提供する

2014/05/30 109

Page 110: オントロジー工学に基づく知識の体系化と利用

ご清聴有り難うございました

「法造」のWebサイト

http://www.hozo.jp/

LOD関係のツール公開サイト

http://sourceforge.jp/projects/easylod/

2014/05/30 110