Web標準: LODによるオープンデータ・オーブンガバメント

26
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/ Web標準: LODによる オープンデータ・オーブンガバメント の効果と始めかた (updated) 2012517W3C/Keio 慶應義塾大学大学院 政策・メディア研究科 特任助教 深見嘉明 @rhys_no1

Transcript of Web標準: LODによるオープンデータ・オーブンガバメント

Page 1: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

Web標準: LODによるオープンデータ・オーブンガバメント

の効果と始めかた(updated)

2012年5月17日 W3C/Keio

慶應義塾大学大学院 政策・メディア研究科

特任助教 深見嘉明

@rhys_no1

Page 2: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

W3Cの概要 •  世界中の企業・研究機関・団体によって構成される、ウェブ標準規格を策定する団体

•  加入企業・研究機関・団体の数は300以上。 – http://www.w3.org/Consortium/

Member/List •  加入企業・団体から参加するエンジニアによって議論が進められ、標準規格が策定される。

•  今この瞬間も、電話会議で、メールで、 仕様に関する議論が進められています。

1

Page 3: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

「オープンガバメント」  「オープンデータ」  という用語を  よく耳にするように  なりました

2

Page 4: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

はじめに考えるべきこと

• 何のためのオープン?

• 誰のためのオープン?

3

Page 5: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

これまでの「オープン」 •  議会や審議会、研究会といった政策形成プロセスの公開 – 動画配信や議事録のウェブ公開等

•  施策立案担当者や議員、首長との、直接的な意見交換 – TwitterやFacebookといったソーシャル メディアを介した交流

4

Page 6: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

「オープン」に期待されていること

• 行政執行や施策立案に透明性が確保できる

• 公開されたデータを民間が活用することによる効率性の向上と経済の活性化

5

Page 7: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

今までの「オープン」はどこまで有効だったのか?

•  平日昼間やっている議会や審議会、誰が見るの?

•  長時間の審議、議論を全部聞くの? •  議事録などの全文採録を読んで、価値のある情報を容易に取り出せるのか?

•  特定の個人間のやりとりを一般化して、政策形成や施策立案に落としこむことは、本当に効率的なのか?

6

Page 8: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

今までの「オープン」はどこまで有効だったのか?

•  似たようなデータが各省庁・部局・外郭団体・自治体等からバラバラに開示されていて、活用したいデータがすぐに見つからない。

•  PDFにデータが記載されていると、それを入力し直さなければ分析・活用できない。

7

Page 9: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

必要とされる「オープン」のかたち •  議論の中身だけではなく、議論の前提となるデータが開示されること。

•  データの活用が効率的に進むよう、 – 探しやすく、重複がないような体制でデータが開示されること。

– 最初から分析プログラムやアプリケーションで活用可能なデータ形式・粒度で開示されること。

8

Page 10: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

具体的にどうするか • 分析・加工する前の生データ

(raw data)、もしくはそれに近いデータを公開する。

• コンピュータ/プログラムで扱いやすい形式・フォーマットで公開する。

• 適切な著作権・情報保護の設定の元、公開する。

9

Page 11: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

回答:Linked Data •  データ公開時のルール

–  IDはURI – RDF (Resource Description Framework)に従った要素を含む

– データフォーマットは標準的な計算機可読なものであればよい。具体的には、RDF/XML、JSONなど。

– 分類項目や項目の定義=データ構造は、既存の標準があればそれを用いる。無ければ、自由に定義してよいが、その定義も公開し、標準化に向けて提案することが理想。

10

Page 12: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

ID=URI •  URI

– Uniform Resource Identifier – URLとほぼ同義。「http://」ではじまるアドレス(注)。

•  なぜURI? – ウェブ上の公開に適している – どこからでも、誰でもアクセス可能 –  IDのつけ方に自由度が高い – 固有性を維持するのが容易

11

注:厳密には、ウェブサイトのアドレスはURIの一種

Page 13: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

RDF: Resource Description Framework • 主語・述語・目的語という単純な組み合わせ=triple/三つ組

• 他のURI(データリソース)とリンクする

http://www.w3.org

World Wide Web

Consortium

主語 目的語

述語:名前

12

Page 14: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

Linked Dataの記述のしかた • 例:Turtleでの記述 <http://d.hatena.ne.jp/yofukami/about> rdf:type foaf:Person . <http://d.hatena.ne.jp/yofukami/about> foaf:name "深見嘉明" . <http://d.hatena.ne.jp/yofukami/about> foaf:gender "mail" . <http://d.hatena.ne.jp/yofukami/about> foaf:knows <http://www-kasm.nii.ac.jp/~takeda#me>

<http://d.hatena.ne.jp/

yofukami/about> <http://www-kasm.nii.ac.jp/~takeda#me>

foaf:knows

<foaf:Person> rdfs:type

“深見嘉明” “male”

foaf:name foaf:gender

13

Page 15: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

データフォーマットと構造 •  コンピュータが処理できれば(machine

readable)、何でも良い、が、RDF/XMLやJSONが推奨される。

•  構造を示すのは前スライドの “foaf:Person” などの部分。

•  foaf、dc (Dublin Core)等、既存の標準的なフォーマットがあれば、それに従う。

•  Google、Yahoo!、Microsoftが提唱するschema.orgなど、大手企業も積極的に標準を提唱・実装。

14

Page 16: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

Linked DataとLOD •  LOD= Linked Open Data •  標準に従って生成・公開されたデータであれば、マッシュアップして活用することが可能

•  だから、フォーマットも、データ構造も、標準ベースで

•  多様な形態での利用が前提なので、適切な著作権処理(例えば、CC-BY)がなされることが望ましい。

15

Page 17: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

データ共有プラットフォームとしてのLOD •  既に各分野でリンクされたデータセットが多数生成されています –  203のデータセット –  2500万の RDF triples –  3億9500万の RDF links

16

(http://www4.wiwiss.fu-berlin.de/lodcloud/state/)

Page 18: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

Linked Dataの本質 •  世界共通の識別子(Identifier) •  世界共通の標準フォーマット・構造の採用

Web全体を データリソースとして アプリケーションが

作れる

17

Page 19: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

1) データを提供する

2) アプリケーションを創る

3) サービスを創る

エコシステムの構造

標準仕様に則っていることにより、より広い層からの利用を見込むことができる  

18

Page 20: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

情報開示とオープンデータの差 •  既存の「情報開示」

– 開示までにかかるコストが大きい

– 特定の分析視点に基づいてデータが提示される

– 「データそのもの」が必要な場合、それを取り出すコストがかかる

加工  された  データ

データ収集

分析

プレゼンテーション

19

Page 21: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

情報開示とオープンデータの差 •  LODによるオープンデータ

データ

ニーズ  

データ

ニーズ  

データ

ニーズ  

データ

ニーズ  

20

Page 22: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

情報開示とオープンデータの差 •  LODによるオープンデータ

– データ生成・公開/利用の分離 – データ利用に伴う負担の分散化 – 必要なデータを各所から収集して用いる(マッシュアップ)が容易

– ニーズがある場所で、効率的にアプリケーションやサービスが開発される

21

Page 23: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

LODによるオープンガバメントの意義

•  負荷分散効果による、データ提供側・利用者側の負荷低減

•  アプリケーションやサービスのDIY・地産地消を実現

•  スケーラビリティ効果 – 効率的な情報発信、サービス提供範囲拡大 – 他所の成功事例を簡単に導入

22

Page 24: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

標準という観点から見たLOD •  W3CはRDFという基本コンセプトと、RDF/XMLなどのデータ フォーマットの一部のみを標準として策定

•  データ構造はユーザや企業からの提案がデファクトスタンダードになるのが普通。

23

データ構造

データ  フォーマット

RDF W3C (&others)

ユーザ からの 提案

Page 25: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

標準という観点から見たLOD

• 車輪の再発明は避けるべし • 自身の使い勝手のよいデータ構造を、どんどん世界標準にするための提案をすべき

24

Page 26: Web標準: LODによるオープンデータ・オーブンガバメント

These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/

ありがとうございました。 [email protected] http://www.w3.org

@rhys_no1