LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築...

22
LOD (LinkedOpenData)

Transcript of LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築...

Page 1: LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築 •LODにおいて、ハブとして広く利用されている

LOD

(LinkedOpenData)

Page 2: LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築 •LODにおいて、ハブとして広く利用されている

Web上で公開され,相互に連結し合っているRDFデータ

これまで多く研究されてきた抽象的な概念構造が

現実的な有用性を生むには依然高いハードルがある

具体物であるインスタンスの記述をしたRDF(Linked Open Data)の

データベースを公開・共有し合うべきという風潮が高まっている

2007年5月

2008年5月

2011年9月

LODの普及

Page 3: LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築 •LODにおいて、ハブとして広く利用されている

Linked Data Cloud

メディア

地理

政府

生命科学 クロスドメイン

出版物

ユーザー生成

コンテンツ

295のデータセット、310億を超えるトリプル

Page 4: LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築 •LODにおいて、ハブとして広く利用されている

DBpedia •http://www.dbpedia.org

•WikipediaのInfoboxを利用し、大規模なDBを構築

•LODにおいて、ハブとして広く利用されている

Page 5: LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築 •LODにおいて、ハブとして広く利用されている

GeoNames •http://www.geonames.org

•世界中の地理情報に関する大規模DB

Page 6: LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築 •LODにおいて、ハブとして広く利用されている

NewYorkTimes •http://data.nytimes.com

•NewYorkTimes誌の人、組織、土地等の情報をRDF化

Page 7: LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築 •LODにおいて、ハブとして広く利用されている

DBpedia Japanese (by NII) http://ja.dbpedia.org/

• Dbpedia:Wikipedia英語版を対象

• DBpedia Japanese:Wikipedia日本語版を対象

Page 8: LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築 •LODにおいて、ハブとして広く利用されている

日本語Wikipediaオントロジー

http://www.wikipediaontology.org/

クラス数 162,407

インスタンス数 1,867,071

プロパティ数 25,266

クラスを持つインスタンス数 700,104

is-a関係数(rdfs:subClassOf) 58,954

タイプの数(rdf:type) 1,013,926

定義域関係数(rdfs:domain) 30,533

値域関係数(rdfs:range) 72,308

プロパティ上位下位関係数(rdfs:subPropertyOf) 303

上位下位関係数(jwo:hyper) 274,363

関連語・同義語(jwo:nearly) 258,853

動詞とプロパティの対応数(jwo:verb) 63,670

プロパティトリプル数 10,064,292

Infoboxトリプル数 3,006,812

外部への参照数(owl:sameAs) 1,048,957

Page 9: LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築 •LODにおいて、ハブとして広く利用されている

総務省のオープンデータ実証実験概要 http://btob.nikkeibp.co.jp/semi/opendata0626/

・精密ハザードマップ ・3D地下構造図 ・災害予測シミュレーション 等の新サービス

国のボーリングデータ

【現状】 【オープンデータ化】

公共交通情報サービス

自治体のボーリングデータ

トレーサビリティサービス

農場

流通業者

消費者

流通情報

栽培情報 品質情報

生産者

生産地

品目

取引時刻

流通場所

業者名

購入場所

購入日時

code

code

評価情報

共通API

共通API

共通API

公共交通関連情報 ボーリング(地盤)データ

災害関連情報 生鮮農産物・水産物の安全安心情報

農薬、肥料、放射線量等

鉄道・バスの運行情報 (走行位置、遅延情報、運休情報、 遅延・運休の原因情報等)

駅施設(券売機、窓口、売店、トイレ、ロッカー等) の情報(施設の名称、位置等)

・複数の公共交通機関の運行情報を リアルタイムに提供 ・駅施設の情報を一元的に提供

<雪害時の行動判断>

<避難準備の促進、避難勧告の判断>

通過時刻 ○時△分

除雪済み道路

浸水危険エリア

避難勧告エリア 気象庁

自治体

気象警報・注意報

指定河川洪水予報

土砂災害警戒情報 等

ハザードマップ

避難所

宿泊所

除雪関連データ 等

被害情報

(死者、家屋被害等) ライフライン情報

(電力、ガス等)

(防災)

内閣府

共通API

Page 10: LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築 •LODにおいて、ハブとして広く利用されている

日本における行政LOD実践

http://citydata.jp/

http://spending.jp/

神奈川県横浜市 http://yokohama.spending.jp/

千葉県千葉市 http://chiba.spending.jp/

宮城県仙台市 http://sendai-miyagi.spending.jp/

福岡県福岡市版 http://fukuoka.spending.jp/

愛知県北名古屋市 http://kitanagoya.spending.jp/

宮城県南三陸町 http://minamisanriku-cho.spending.jp/

北海道江別市 http://ebetsu.spending.jp/

北海道札幌市 http://sapporo.spending.jp/

京都府京都市 http://kyoto-city.spending.jp/

東京都小金井市 http://koganei.spending.jp/

東京都武蔵野市 http://musashino.spending.jp/

宮城県石巻市 http://ishinomaki.spending.jp/

北海道旭川市 http://asahikawa.spending.jp/

茨城県水戸市 http://mito.spending.jp/

東京都杉並区 http://suginami.spending.jp/

東京都中野区 http://nakano-ku.spending.jp/

東京都調布市 http://chofu.spending.jp/

東京都葛飾区 http://katsushika.spending.jp/

大阪府吹田市 http://suita.spending.jp/

福島県会津若松市 http://aizuwakamatsu.spending.jp/

新潟県新潟市 http://niigata.spending.jp/

Page 11: LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築 •LODにおいて、ハブとして広く利用されている

LODとオントロジーの利用例(1) レシピと食品標準成分表を連携させた

食事療法支援サービス

• 入力 – 飲食店のメニュー名(OCR認識結果を活用)

• 出力 – メニュー名と使用材料

– 類似するレシピの5大栄養素の計算結果

– 糖尿病の食事療法のための得点計算結果

何を食べていいのだろう?

飲食店メニュー

レシピ

Linked Data

食品成分Linked Data

疾病別

ルール

食事療法を踏まえた

情報提示

栄養計算 事前処理

検索時に処理

Page 12: LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築 •LODにおいて、ハブとして広く利用されている

Application

User

Http Request

レシピ Linked Data

食品成分表 Linked Data

疾病別 ルール 疾病別 ルール

マッピング

Http Response

Server

栄養計算 モジュール

レシピ推測 モジュール

得点計算 モジュール

単位変換 Mediator

Server

Http Request

Http Response

-システムアーキテクチャ-

Page 13: LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築 •LODにおいて、ハブとして広く利用されている

Http Response

Http Response

単位変換 Mediator

栄養計算 モジュール

得点計算 モジュール

食品成分表 Linked Data

疾病別 ルール 疾病別 ルール

マッピング

レシピ推測 モジュール

レシピ Linked Data

Application

User

Http Request

Server Server

Http Request

-システムアーキテクチャ-

・ユーザがレシピ名をサーバに問い合わせる ・送られたデータから最も近いレシピを推測 ・レシピインスタンスを生成

Page 14: LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築 •LODにおいて、ハブとして広く利用されている

得点計算 モジュール

疾病別 ルール 疾病別 ルール

Server

Http Request

Http Response

Application

User

Http Request

Http Response

Server

栄養計算 モジュール

レシピ推測 モジュール

レシピ Linked Data

食品成分表 Linked Data

マッピング

単位変換 Mediator

-システムアーキテクチャ-

レシピインスタンスを栄養計算モジュールに渡し 栄養計算を行う。

Page 15: LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築 •LODにおいて、ハブとして広く利用されている

レシピ推測 モジュール

レシピ Linked Data

マッピング

単位変換 Mediator

Server

Http Request

Http Response

Application

User

Http Request

Http Response

Server

栄養計算 モジュール

得点計算 モジュール

食品成分表 Linked Data

疾病別 ルール 疾病別 ルール

-システムアーキテクチャ-

疾病別ルールを参考に疾病ごとの得点を計算する 今回は糖尿病のための得点計算を行う

Page 16: LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築 •LODにおいて、ハブとして広く利用されている

栄養計算 モジュール

レシピ推測 モジュール

レシピ Linked Data

食品成分表 Linked Data

マッピング

単位変換 Mediator

Http Request

Http Request

Server

Http Response

Application

User

Http Response

Server

得点計算 モジュール

疾病別 ルール 疾病別 ルール

-システムアーキテクチャ-

計算結果をアプリケーションに返し 情報を提示する。

Page 17: LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築 •LODにおいて、ハブとして広く利用されている

Linked Data (1)

• レシピLinked Data

– 収集したレシピ情報から作成

•内容:レシピ名、材料、料理手順等

•トリプル数: 79423トリプル

• 食品成分表Linked Data

– 日本食品標準成分表2010(CSV) より作成

•内容:食材の分類、栄養素

•トリプル数: 107412トリプル

•食材数:1895種類

レシピサイト 取得レシピ数

クックパッド* 2644

ナスラックキッチン* 2740

レシピ大百科* 813

Page 18: LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築 •LODにおいて、ハブとして広く利用されている

rdf:type

Linked Data (2)

rclass:料理

rclass:コロッケ rclass:シチュー rclass:カレー

rclass: rclass: rclass: rclass:チキンカレー

料理クラス

rdfs:subClassOf

rclass:材料

rinst:ココナッツチキンカレー

レシピ Linked Data

ココナッツ チキンカレー

4人分 http://・・・

http://・・・

玉ねぎ

1個

rdf:type

rprop:hasIngredients

rdfs:label

rprop:accountablePerson

rprop:url

rprop:image rprop:ingredient

rdf:value

ジャガイモ

3個

rprop:ingredient

rdf:value

カレールウ

4皿分

rprop:ingredient

rdf:value

ココナッツミルク

200g

rprop:ingredient rdf:value

Page 19: LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築 •LODにおいて、ハブとして広く利用されている

LODとオントロジーの利用例(2) オントロジーを用いたサービス指向型

HRI・MRCアーキテクチャ

Knowledge

QA

Exercise

instruction

Gesture

detection Transport

Trash

disposal

Speech

recognition

Gesture

recognition

Ontology

processing

Tracking

behavior

Robot

selection

Question

analysis

Answer

generation

Behavior

execution

Behavior

judgment

Path

planning

planning Query

generation

Kinematic

calculation

Gesture

analysis

Obstacle detection

Japanese

Wikipedia Behavior

Robot

Kinematics

Trash Disposal

Rules

Environment

map

Ontology

descriptions

Ontology

relations

Gesture

recognition

Cause

analysis

Searching

ontology

Answer

generation

Speech

synthesis

Service

planning

Robot

navigation

Robot

action

Speech

recognition

Behavior

judgment

Service

Process

Module

Data

Ontology

Page 20: LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築 •LODにおいて、ハブとして広く利用されている

HRIサービス連携

JWO知識

QA

ゴミ捨て

体操教示 しぐさ

原因推定

具体物運搬

サービス プランニング

Page 21: LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築 •LODにおいて、ハブとして広く利用されている

AI+IT 技術統合

21

対話レベル

Julius・Google Speech APIによる音声認識

CaboChaによる構文解析

GalateaTalkによる日本語音声合成

動作レベル

Kinect for Xbox 360® センサーによる、時系列3次元座標の取得

KinectセンサーとSDKによる、人間しぐさ抽出

Mapper3による簡易環境地図の構築

知識レベル

日本語Wikiipediaオントロジー(JWO)の利用

JWO APIによるJWOのクラス・インスタンス・プロパティの探索

要素機能

モジュール生成

音声認識

モジュール

質問解析

モジュール

音声合成

モジュール

しぐさ認識

モジュール

経路探索

モジュール

骨格追跡

モジュール

Page 22: LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築 •LODにおいて、ハブとして広く利用されている

オントロジーに基づくサービス構築