オープンデータとLinked Open Data - meti.go.jp · オープンデータとLinked Open Data...

25
オープンデータとLinked Open Data 武田英明 [email protected] 国立情報学研究所 NPO法人 リンクト・オープン・データ・イニシアティブ

Transcript of オープンデータとLinked Open Data - meti.go.jp · オープンデータとLinked Open Data...

オープンデータとLinked Open Data

武田英明 [email protected]

国立情報学研究所 NPO法人 リンクト・オープン・データ・イニシアティブ

オープンデータへの5つのステップ

オープンデータへの5つのステップ

★ ★

★ ★ ★

★ ★ ★ ★

★ ★ ★ ★ ★

どんなフォーマットでよいからオープンラインセスでデータ公開

例:PDF, jpg コンピュータが処理可能なフォーマットで公開

例:xls, doc オープンに利用できるフォーマットで公開

例:csv RDF(とSPARQL)でデータ公開

例:RDFa, RDFストア 他へのリンクを入れたデータを公開

LOD Cloudへの参加

オープンデータへの5つのステップ

★ ★

★ ★ ★

★ ★ ★ ★

★ ★ ★ ★ ★

どんなフォーマットでよいからオープンラインセスでデータ公開

例:PDF, jpg コンピュータが処理可能なフォーマットで公開

例:xls, doc オープンに利用できるフォーマットで公開

例:csv RDF(とSPARQL)でデータ公開

例:RDFa, RDFストア 他へのリンクを入れたデータを公開

LOD Cloudへの参加

データカタログ・サイト

Linked Data/ Linked Open Data (LOD)

ライセンス

データ共有のアーキテクチャ

• データカタログの公開、共有 – データセット(データベース)のカタログ

– データセットに関する情報 • 名称、公開者、ライセンス、形式、アクセス方法、利活用例…

• データ(データセット)の公開、共有 – データの形式

• 固有の形式、オープンな形式(XML, RDF …)

– データベースの公開 • (個別)HTML, 、URI dereference

• (インタラクティブ)Webフォーム、API、SPARQL

• (ダウンロード)個別ファイル、ダンプファイル

データがどうやって手に入るかを知る

データを実際に 手に入れる

CKAN

• データ・ハブ、あるいはデータのカタログ化、公開、共有及び検索のための"データ管理システム“

• オープンソース・ソフトウエア • 機能

– データ(リソース)のカタログ編集、公開 • 名称、公開者、ライセンス、形式、アクセス方法、利活用例…

– データの保存と管理 – ユーザインタフェース – REST API – Linked Data

• データカタログの標準語彙DCAT

データの公開、共有

Linked Data

Linked Open Data (LOD)

http://www.data.gov/

文書のWeb

データのWeb

このデータに対応する別のデータ

このデータに別のデータと同じ

この属性の意味は?

異なるデータ源のデータが相互に結びつく

Linked Open Data (LOD)

• オープンでリンクできるデータ – 今のWebが“文書のWeb” 、LODは“データのWeb”

• Linked Dataの5原則 – 事柄の名前にURIを使うこと

– 名前の参照がHTTP URIでできること

– URIを参照したときに関連情報が手に入るように理解可能なデータを提供

– 外部へのリンクも含めよう

(必ずしもオープンとは限らない⇒Linked Data)

Linked Dataの記述のしかた

• RDF(+RDFS, OWL)の利用 – 簡便な記述方法:<主語> <述語> <目的語> .

<http://www-kasm.nii.ac.jp/~takeda#me> <rdfs:type> <foaf:Person> . <http://www-kasm.nii.ac.jp/~takeda#me> <foaf:name> “武田英明” . <http://www-kasm.nii.ac.jp/~takeda#me> <foaf:gender> “male” . <http://www-kasm.nii.ac.jp/~takeda#me> <foaf:knows> <http://foaf.me/danbri#me> .

<http://www-kasm.nii.ac.jp/ ~takeda#me>

<http://foaf.me/danbri#me>

foaf:knows

<foaf:Person>

rdfs:type

“武田英明” “male”

foaf:name foaf:gender

LOD Cloud (Linking Open Data)

200以上のデータセット

が公開され、相互にリンクづけられている

DBpedia Mobile

Yokohama Art Spot

SPARQLによる連携

LOD Cloudとオープンガバメント (Linking Open Data)

例:センサや地域情報の統合

http://lsm.deri.ie/

様々な機関からの公開データを第3者が集めて表示

Linked Open Data普及への道筋

• 技術の展開 Open Dataに向けて – データ・カタログ – 持続的URI

• Digital Object Identifier (DOI) – 例)OPOCE (Office des publications EU)、DataCite、(JaLC)

Linked Dataに向けて – スキーマの共有、再利用

• Linked Open Vocabulary (LOV), MetaBridge

– 識別子の共有、再利用 • 持続的かつ再利用性の高い識別子の設計、公開

公的機関が得意

コミュニティでの活動

Linked Open Data普及への道筋

• データキュレーション – 適切なデータ公開ができるように、データを加工・選択・変換などを行うこと

– データ設計:相互運用性、持続可能性 • スキーマ設計

• 識別子設計

– データキュレータの養成 • 技術と内容のわかる人

まとめ

• オープンデータの5つのステップ – ライセンス – データカタログ – LOD

• LOD – “データのWeb”、つながるデータ – データの再利用性を高める

• オープンデータ、LODの普及の道筋 – 技術の展開:持続性のあるURI,スキーマの共有 – データ・キュレーション