LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築...
Transcript of LOD (LinkedOpenData)...DBpedia • •WikipediaのInfoboxを利用し、大規模なDBを構築...
LOD
(LinkedOpenData)
Web上で公開され,相互に連結し合っているRDFデータ
これまで多く研究されてきた抽象的な概念構造が
現実的な有用性を生むには依然高いハードルがある
具体物であるインスタンスの記述をしたRDF(Linked Open Data)の
データベースを公開・共有し合うべきという風潮が高まっている
2007年5月
2008年5月
2011年9月
LODの普及
Linked Data Cloud
メディア
地理
政府
生命科学 クロスドメイン
出版物
ユーザー生成
コンテンツ
295のデータセット、310億を超えるトリプル
DBpedia •http://www.dbpedia.org
•WikipediaのInfoboxを利用し、大規模なDBを構築
•LODにおいて、ハブとして広く利用されている
GeoNames •http://www.geonames.org
•世界中の地理情報に関する大規模DB
NewYorkTimes •http://data.nytimes.com
•NewYorkTimes誌の人、組織、土地等の情報をRDF化
DBpedia Japanese (by NII) http://ja.dbpedia.org/
• Dbpedia:Wikipedia英語版を対象
• DBpedia Japanese:Wikipedia日本語版を対象
日本語Wikipediaオントロジー
http://www.wikipediaontology.org/
クラス数 162,407
インスタンス数 1,867,071
プロパティ数 25,266
クラスを持つインスタンス数 700,104
is-a関係数(rdfs:subClassOf) 58,954
タイプの数(rdf:type) 1,013,926
定義域関係数(rdfs:domain) 30,533
値域関係数(rdfs:range) 72,308
プロパティ上位下位関係数(rdfs:subPropertyOf) 303
上位下位関係数(jwo:hyper) 274,363
関連語・同義語(jwo:nearly) 258,853
動詞とプロパティの対応数(jwo:verb) 63,670
プロパティトリプル数 10,064,292
Infoboxトリプル数 3,006,812
外部への参照数(owl:sameAs) 1,048,957
総務省のオープンデータ実証実験概要 http://btob.nikkeibp.co.jp/semi/opendata0626/
・精密ハザードマップ ・3D地下構造図 ・災害予測シミュレーション 等の新サービス
国のボーリングデータ
【現状】 【オープンデータ化】
公共交通情報サービス
自治体のボーリングデータ
トレーサビリティサービス
農場
流通業者
消費者
流通情報
栽培情報 品質情報
生産者
生産地
品目
取引時刻
流通場所
業者名
購入場所
購入日時
code
code
評価情報
共通API
共通API
共通API
公共交通関連情報 ボーリング(地盤)データ
災害関連情報 生鮮農産物・水産物の安全安心情報
農薬、肥料、放射線量等
鉄道・バスの運行情報 (走行位置、遅延情報、運休情報、 遅延・運休の原因情報等)
駅施設(券売機、窓口、売店、トイレ、ロッカー等) の情報(施設の名称、位置等)
・複数の公共交通機関の運行情報を リアルタイムに提供 ・駅施設の情報を一元的に提供
<雪害時の行動判断>
<避難準備の促進、避難勧告の判断>
通過時刻 ○時△分
除雪済み道路
浸水危険エリア
避難勧告エリア 気象庁
自治体
気象警報・注意報
指定河川洪水予報
土砂災害警戒情報 等
ハザードマップ
避難所
宿泊所
除雪関連データ 等
被害情報
(死者、家屋被害等) ライフライン情報
(電力、ガス等)
(防災)
内閣府
共通API
日本における行政LOD実践
http://citydata.jp/
http://spending.jp/
神奈川県横浜市 http://yokohama.spending.jp/
千葉県千葉市 http://chiba.spending.jp/
宮城県仙台市 http://sendai-miyagi.spending.jp/
福岡県福岡市版 http://fukuoka.spending.jp/
愛知県北名古屋市 http://kitanagoya.spending.jp/
宮城県南三陸町 http://minamisanriku-cho.spending.jp/
北海道江別市 http://ebetsu.spending.jp/
北海道札幌市 http://sapporo.spending.jp/
京都府京都市 http://kyoto-city.spending.jp/
東京都小金井市 http://koganei.spending.jp/
東京都武蔵野市 http://musashino.spending.jp/
宮城県石巻市 http://ishinomaki.spending.jp/
北海道旭川市 http://asahikawa.spending.jp/
茨城県水戸市 http://mito.spending.jp/
東京都杉並区 http://suginami.spending.jp/
東京都中野区 http://nakano-ku.spending.jp/
東京都調布市 http://chofu.spending.jp/
東京都葛飾区 http://katsushika.spending.jp/
大阪府吹田市 http://suita.spending.jp/
福島県会津若松市 http://aizuwakamatsu.spending.jp/
新潟県新潟市 http://niigata.spending.jp/
LODとオントロジーの利用例(1) レシピと食品標準成分表を連携させた
食事療法支援サービス
• 入力 – 飲食店のメニュー名(OCR認識結果を活用)
• 出力 – メニュー名と使用材料
– 類似するレシピの5大栄養素の計算結果
– 糖尿病の食事療法のための得点計算結果
何を食べていいのだろう?
飲食店メニュー
レシピ
Linked Data
食品成分Linked Data
疾病別
ルール
食事療法を踏まえた
情報提示
栄養計算 事前処理
検索時に処理
Application
User
Http Request
レシピ Linked Data
食品成分表 Linked Data
疾病別 ルール 疾病別 ルール
マッピング
Http Response
Server
栄養計算 モジュール
レシピ推測 モジュール
得点計算 モジュール
単位変換 Mediator
Server
Http Request
Http Response
-システムアーキテクチャ-
Http Response
Http Response
単位変換 Mediator
栄養計算 モジュール
得点計算 モジュール
食品成分表 Linked Data
疾病別 ルール 疾病別 ルール
マッピング
レシピ推測 モジュール
レシピ Linked Data
Application
User
Http Request
Server Server
Http Request
-システムアーキテクチャ-
・ユーザがレシピ名をサーバに問い合わせる ・送られたデータから最も近いレシピを推測 ・レシピインスタンスを生成
得点計算 モジュール
疾病別 ルール 疾病別 ルール
Server
Http Request
Http Response
Application
User
Http Request
Http Response
Server
栄養計算 モジュール
レシピ推測 モジュール
レシピ Linked Data
食品成分表 Linked Data
マッピング
単位変換 Mediator
-システムアーキテクチャ-
レシピインスタンスを栄養計算モジュールに渡し 栄養計算を行う。
レシピ推測 モジュール
レシピ Linked Data
マッピング
単位変換 Mediator
Server
Http Request
Http Response
Application
User
Http Request
Http Response
Server
栄養計算 モジュール
得点計算 モジュール
食品成分表 Linked Data
疾病別 ルール 疾病別 ルール
-システムアーキテクチャ-
疾病別ルールを参考に疾病ごとの得点を計算する 今回は糖尿病のための得点計算を行う
栄養計算 モジュール
レシピ推測 モジュール
レシピ Linked Data
食品成分表 Linked Data
マッピング
単位変換 Mediator
Http Request
Http Request
Server
Http Response
Application
User
Http Response
Server
得点計算 モジュール
疾病別 ルール 疾病別 ルール
-システムアーキテクチャ-
計算結果をアプリケーションに返し 情報を提示する。
Linked Data (1)
• レシピLinked Data
– 収集したレシピ情報から作成
•内容:レシピ名、材料、料理手順等
•トリプル数: 79423トリプル
• 食品成分表Linked Data
– 日本食品標準成分表2010(CSV) より作成
•内容:食材の分類、栄養素
•トリプル数: 107412トリプル
•食材数:1895種類
レシピサイト 取得レシピ数
クックパッド* 2644
ナスラックキッチン* 2740
レシピ大百科* 813
rdf:type
Linked Data (2)
rclass:料理
rclass:コロッケ rclass:シチュー rclass:カレー
rclass: rclass: rclass: rclass:チキンカレー
料理クラス
rdfs:subClassOf
rclass:材料
rinst:ココナッツチキンカレー
レシピ Linked Data
ココナッツ チキンカレー
4人分 http://・・・
http://・・・
玉ねぎ
1個
rdf:type
rprop:hasIngredients
rdfs:label
rprop:accountablePerson
rprop:url
rprop:image rprop:ingredient
rdf:value
ジャガイモ
3個
rprop:ingredient
rdf:value
カレールウ
4皿分
rprop:ingredient
rdf:value
ココナッツミルク
200g
rprop:ingredient rdf:value
LODとオントロジーの利用例(2) オントロジーを用いたサービス指向型
HRI・MRCアーキテクチャ
Knowledge
QA
Exercise
instruction
Gesture
detection Transport
Trash
disposal
Speech
recognition
Gesture
recognition
Ontology
processing
Tracking
behavior
Robot
selection
Question
analysis
Answer
generation
Behavior
execution
Behavior
judgment
Path
planning
planning Query
generation
Kinematic
calculation
Gesture
analysis
Obstacle detection
Japanese
Wikipedia Behavior
Robot
Kinematics
Trash Disposal
Rules
Environment
map
Ontology
descriptions
Ontology
relations
Gesture
recognition
Cause
analysis
Searching
ontology
Answer
generation
Speech
synthesis
Service
planning
Robot
navigation
Robot
action
Speech
recognition
Behavior
judgment
Service
Process
Module
Data
Ontology
HRIサービス連携
JWO知識
QA
ゴミ捨て
体操教示 しぐさ
原因推定
具体物運搬
サービス プランニング
AI+IT 技術統合
21
対話レベル
Julius・Google Speech APIによる音声認識
CaboChaによる構文解析
GalateaTalkによる日本語音声合成
動作レベル
Kinect for Xbox 360® センサーによる、時系列3次元座標の取得
KinectセンサーとSDKによる、人間しぐさ抽出
Mapper3による簡易環境地図の構築
知識レベル
日本語Wikiipediaオントロジー(JWO)の利用
JWO APIによるJWOのクラス・インスタンス・プロパティの探索
要素機能
モジュール生成
音声認識
モジュール
質問解析
モジュール
音声合成
モジュール
しぐさ認識
モジュール
経路探索
モジュール
骨格追跡
モジュール
:
オントロジーに基づくサービス構築