Linked Open Dataとは
-
Upload
linked-open-data -
Category
Documents
-
view
8.407 -
download
1
Transcript of Linked Open Dataとは
Linked Open Dataとは
LODチャレンジ実行委員会
Linked Open Data ?
Linked Webの仕組みで
相互にリンクされた
Open (一定のルールのもとで) 二次利用可能な
Data RDF形式のデータ
ボルト?
CC-BY 2.0 http://en.wikipedia.org/wiki/File:Usain_Bolt_2012_Olympics_1.jpg CC-BY-SA 3.0 http://commons.wikimedia.org/wiki/File:P_Mickey.png CC-BY-SA 3.0 http://en.wikipedia.org/wiki/File:DCA_06_2012_Chevy_Volt_4035.JPG CC-BY-SA 2.5 http://ja.wikipedia.org/wiki/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB:Bolt-with-nut.jpg
ボルト
陸上選手 自動車
アニメ映画 部品
CC-BY-SA 3.0 http://ja.wikipedia.org/wiki/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB:Berlino_Leichtathletik-WM.jpg CC-By-SA 3.0 http://ja.wikipedia.org/wiki/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB:Olympicstadium2.jpg
100m 9秒58 (WR)
Web空間上でのデータ共有
100m 9秒58 (WR)
文書のWeb • 文書ファイル(HTML)+リンク
• 各文書の所在をURIで表す
• 人間が読むことを想定
• 文書群に対してキーワード検索し,必要な情報を取得する
HTML HTML
HTML
HTML
リンク
リンク
LODによるデータのWeb • データ(RDF)+リンク
• 各データの所在をURIで表す
• 計算機が読むことを想定
• データ群に対してSQLライクな条件式で検索し,必要な情報を得る
RDFデータ
RDFデータ
RDFデータ
LODの基本的な仕組み 1. 情報とリンクに名前をつける
2. 情報の所在とリンクをURIで表現 – 同じURIは同じモノを表現
3. 名前空間の接頭辞を利用
Japan Tokyo Capital
http://dbpedia.org/resource/Japan
http://dbpedia.org/resource/Tokyo
http://dbpedia.org/ontology/capital
dbpedia:Japan dbpedia:Tokyo
dbpedia-owl:capital
LODの基本的な仕組み
dbpedia:Japan dbpedia:Tokyo
dbpedia-owl:capital
dbpedia:Tokyo dbpedia:Shintarō_Ishihara
dbpedia-owl:leaderName
dbpedia:Japan dbpedia:Tokyo
dbpedia-owl:capital
dbpedia:Shintarō_Ishihara
dbpedia-owl:leaderName
URIが同じノードで2つのグラフを結合
LODの基本的な仕組み 分野,ドメインを越えてデータどうしをリンクすることで,つながりが広がっていく
dbpedia:Japan dbpedia:Tokyo
dbpedia-owl:capital
dbpedia-owl:leaderName
dbpedia:Shintarō_Ishihara owl:sameAs
http://data.nytimes.com/59436095099277148161
DBpedia
NYTimes
LODクラウド
分野,ドメインを越えてデータどうしをリンクすることで,データセットどうしがつながったLODクラウドが形成されている
RDFデータ
RDFデータ
RDFデータ
DBpedia NYTimes
BBC
LODクラウド
2007/5/1 2007/11/7 2008/3/31
http://richard.cyganiak.de/2007/10/lod/
LODとして利用可能なデータセット間のリンク関係を図示
2009/3/27 2010/9/22
LODクラウド
政府・自治体
地理情報 ライフサイエンス
図書館・出版
ユーザ生成コンテンツ
メディア
http://richard.cyganiak.de/2007/10/lod/
クロスドメイン
2011/9/22
Linking Open Data
Linking Open Data運動
• 多くの人々がオープンにしたデータ(Open Data)を,皆でつなげて(Linkして),大きな価値を生み出していく
• Webを発明したTim Berners-Lee氏が提唱し,世界で広まっている
• データの「囲い込み」から「共有」へ
Tim Berners-Lee
http://www.zdnet.com/uk/web-inventor-tim-berners-lee-stars-in-olympics-opening-ceremony-7000001744/
改めて,LODとは
• Web技術を利用して,オープンなデータ(Open Data)を公開し,つなげる(Linkする)仕組み
• Web空間を巨大なデータベースとして,問い合わせや利用が可能
データ
データ
データ
公開 問い合わせ
利用 Web空間
データベース データベース データベース データベース
出版社 書店 図書館 クチコミ
・各Webサイトが持っている
データベースどうしはつながっていない ・同じ書籍に関するデータであるかどうかを計算機に判定させるには,ひと手間必要
HTML HTML HTML HTML
文書のWeb
データベース データベース データベース データベース
出版社 書店 図書館 クチコミ
萩野達也 斎藤 信男
2,940円
オーム社 author author
publisher
price
セマンティックWeb入門
・データ自体をWeb上に公開し,共有する. ・個々のデータの所在を表すURIで一意に識別できる
RDF RDF RDF
RDF
データのWeb Web空間
LODの利用と公開
RDFストア 既存データ (RDB,CSVなど)
LOD公開ツール
SPARQL エンドボイント RDFダンプ
LODクラウド (Web空間)
LOD公開 LOD利用 アプリケーション
検索エンジン
RDFストア
ユーザインタフェース などへの出力 RDF
ファイル
C. Bizer, et. al(著), 萩野(訳), Linked Dataの仕組み, 情報処理,vol.52,no.3, 2011
LODとしてのデータ公開
• LODをWeb上で公開する – 既存データ・新規データをRDF形式で作成する – SPARQLエンドポイントまたはRDFダンプを公開する
• LODを閲覧・検索する – ノードのURIに関してHTTPで問い合わせする – SPARQLエンドポイントを利用してデータを検索する
• 他のLODへRDFでリンクする – LODクラウドとつながって,たどることが可能に – sameAsにより同一のモノを指すURIを結びつける
• 公開情報をリポジトリサイトに登録する – CKANに登録すると,LODクラウドにデータ公開者ノードが作成される
LODの到達度
★ 形式に関係なく,オープンライセンスで公開する 例:表データの画像
★★ コンピュータで処理可能な構造化データで公開する 例:Excelデータ
★★★ オープンなデータ形式で公開する 例:CSVデータ
★★★★ URIを利用してモノに名前を付ける 例:RDFデータ
★★★★★ 他のデータへリンクする
http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/
“Raw data now!” by Tim Berners-Lee
まとめ:LODの特徴
• だれでもWeb上でデータを公開できる
• 語彙を自由に選んでデータを表現できる
• だれでもデータに情報を付加できる
• データの選択や加工の自由度が高い
• お互いにデータを公開し,共有することで,これらの利便性が高まる
参考文献
• TED2009 Tim Berners-Lee on the next Web http://www.ted.com/talks/lang/jpn/tim_berners_lee_on_the_next_web.html
• TED2010 Tim Berners-Lee:The year open data went worldwide http://www.ted.com/talks/lang/jpn/tim_berners_lee_the_year_open_data_went_worldwide.html
参考文献 • Linked Data: Evolving the Web into a Global Data Space,
Chrisitian Bizer and Tom Heath, 2011 http://linkeddatabook.com/editions/1.0/
• リンクするデータ(Linked Data)~広がり始めたデータのクラウド~,長野,萩野(編),情報処理学会誌,vol.52,no.3,2011年. http://www.bookpark.ne.jp/cm/ipsj/mokuji.asp?category1=Magazine&vol=52&no=3
• Linked Dataとオントロジー,長野,山口(編),人工知能学会誌,vol.27,no.2,2012年. http://ci.nii.ac.jp/vol_issue/nels/AN10067140/ISS0000478803_ja.html
• セマンティックHTML/XHTML,神崎正英,毎日コミュニケーションズ,2009年.