オープンデータとWordPress

60
オープンデータと WordPress LODチャレンジ実行委員会 関西支部長 /大阪大学 産業科学研究所 古崎 晃司 [email protected] WordCampKansai2015 2015/07/25

Transcript of オープンデータとWordPress

オープンデータとWordPress

LODチャレンジ実行委員会 関西支部長

/大阪大学 産業科学研究所

古崎 晃司

[email protected]

WordCampKansai20152015/07/25

はじめに,質問

「オープンデータ」という言葉を聞いたことがある方?

「LOD(Linked Open Data)」という言葉を聞いたことがある方?

2015/7/25 WordCampKansai2015 2

自己紹介

コミュニティ活動 LODチャレンジ実行委員会(2011~) 関西支部長

→LOD(Linked Open Data)を技術普及させたい

「LODチャレンジ」(コンテスト)への応募作品を増やしたい

特に,地元「大阪(関西)」でのコミュニティを大きくしたい

2015/7/25 3

研究成果として公開中のソフト

WordCampKansai2015

古崎(こざき)晃司@koujikozaki 本職: 大阪大学の研究者

専門: 情報科学(オントロジー工学)=“かしこい”コンピュータ(ソフトウェア)を作る→学問にとどまらず,世の中で使われる技術を作りたい

開催年度\応募部門 データセット アイデアアプリケー

ションビジュアライゼーション

基盤技術

2014年度(245作品)2013年度(321作品)2012年度(205作品)2011年度( 73作品)

871018721

51675034

691224418

201824

1813

Linked Open Data(LOD)チャレンジ

LODの技術普及を目的として開催している日本初のオープンデータに関するコンテスト(2011年度より毎年開催)

これまでの応募状況 http://lod.sfc.keio.ac.jp/

42015/7/25

LODチャレンジ2015も開催されます!

年々,応募作品数の増加/質の向上が見られる=LOD利用の広がり2013年度以降には,オープンデータのコンテストが多数開催される

WordCampKansai2015

大阪イノベーションハブ(OIH)

大阪イノベーションハブ(OIH)大阪市のグローバルイノベーション支援拠点

The Open Data Institute (ODI)オープンデータを推進する国際機関(本部はイギリス)

2015/7/25 WordCampKansai2015 5

http://www.innovation-osaka.jp/ja/ http://theodi.org/

ODIのCity Node(各地での推進拠点)へ

2014年度にOIHで開催されたオープンデータ関連イベント

Mozilla x HTML5 x LOD Webイノベーションハッカソン

第1回:6月28日, 29日 第2回:7月19日 第3回:9月14日、15日Civic Hack Osakaハッカソン :8月24日、31日第1回自治体オープンデータ推進協議会 :11月25日、31日(一般社団法人オープンコーポレイツジャパン主催)

第4回 Linked Open Dataハッカソン関西 with LODC2014×UDC2014 :12月7日インターナショナルオープンデータディプレプレイベント :12月21日関西オープンデータEXPO’15‐インターナショナルオープンデータディプレイベント‐ :2月11日

関西23団体以上が集結!

第5回LODハッカソン関西inインターナショナルオープンデータディ大阪:2月21日オープンデータ×ゲームハッカソン :2015年2月22日, 28日、3月1日

2015/7/25 6

計10回,16日間のオープンデータ関連イベントを開催!

うち,LODを冠するイベント5回(7日間)

台風で延期

台風で延期

台風で延期2回!

WordCampKansai2015

関西オープンデータEXPO’15

2015/7/25 7

関西23団体以上が集結!(約130人)

http://expo15.theodi.jp/

WordCampKansai2015

LODハッカソン関西

2015/7/25 WordCampKansai2015 8

• 過去,6回開催• 公式サイトにWordPressを利用

http://wp.lodosaka.jp

Kansai Mash App! VOL.02

2015/7/25 WordCampKansai2015 9

http://www.innovation-osaka.jp/ja/events/5146

• 開催日:8/2(日),8/9(日)• テーマ:関西で“遊ぶ・過ごす・暮らす”

外国人の課題を解決• 参加者,まだまだ募集中!

講演の概要

本講演のメイントピック

「オープンデータ」とは何か?

日本国内におけるオープンデータの動向

LOD (Linked Open Data)とは?

オープンデータとWordPress

覚えていただきたいキーワード

オープンデータ

LOD(Linked Open Data)2015/7/25 WordCampKansai2015 10

オープンデータとは?

2015/7/25 11WordCampKansai2015

オープンデータとは オープンデータとは

誰でも自由に使える形で公開されているデータ

オープンデータの定義(Open Definition) “Open data and content can be freely used, modified,

and shared by anyone for any purpose”(http://opendefinition.org/)

オープンデータでない例 改変や再配布が禁止されている

利用者を限定 例)学術機関のみ,個人利用不可

利用目的を限定 例)商用利用不可,コンテスト応募目的のみ

2015/7/25 WordCampKansai2015 12

オープンデータの2つの観点

ライセンス(cf.クリエイティブコモンズ) 使用目的を限定せず(例:商用も可),再配布,改変も可

「作成者のクレジットの表示」の義務付け程度の制限はOK→“まじめな人”(※)が,安心して使える

=より多くの人の利用が見込まれる

(※悪いことをする人は,ライセンスを気にせず勝手に使う)

機械可読な形式 プログラムで処理しやすいフォーマットが望まれる

→“使いたい人”が,簡単に使える=低コストで多くのアプリ(活用事例)が作れる

LOD(Linked Open Data)は,「オープンデータの5つの段階」で「5つ星」と言われている公開方法

2015/7/25 WordCampKansai2015 13

国内におけるオープンデータの動向

2015/7/25 14WordCampKansai2015

http://www.kantei.go.jp/jp/singi/it2/pdf/120704_siryou2.pdf152015/7/25

2012/7/4

WordCampKansai2015

162015/7/25 WordCampKansai2015

http://www.kantei.go.jp/jp/singi/it2/dai61/siryou2-1.pdf より

○公共データの民間開放(オープンデータ)の推進、ビッグデータの利活用促進(パーソナルデータの流通・促進等)

2013/05/24

172015/7/25 WordCampKansai2015

G8サミット・首脳宣言で「オープンデータ憲章」に合意

http://www.mofa.go.jp/mofaj/gaiko/page23_000044.html

2013/06/18

我々は,オープンデータが,イノベーションと繁栄を可能にし,また,市民のニーズに合致した,強固かつ相互に繋がった社会を構築していくための大きな可能性をもった未開発の資源であることに合意する。そのため,我々は,以下の原則に合意する。• 原則としてのオープンデータ• 質と量• すべての者が利用できる• 改善したガバナンスのためのデータの公表• イノベーションのためのデータの公表

G8各国が,「オープンデータを推進する」ことに合意

182015/7/25 WordCampKansai2015

Data.go.jp:日本政府のオープンデータカタログサイト

http://data.go.jp/

本格運用を開始2014年10月1日

2013年12月↓

2014年4月休止※コミュニティがミラーサイト作成

192015/7/25 WordCampKansai2015

次世代統計利用システム

http://statdb.nstac.go.jp/

API機能の本格運用を開始2014年10月31日

202015/7/25 WordCampKansai2015

http://datameti.go.jp/

経済産業省が保有するデータをオープンデータとして公開することを実践するための試験サイト→一部,LODとしてデータを公開

http://datameti.go.jp/sparql

LODチャレンジJapan2012「オープンデータ推進賞」

212015/7/25 WordCampKansai2015

Open DATA METIのLODを活用したデータの可視化ワークショップも開催

2015/7/25 22

http://datameti.go.jp/活用事例2014/3/8

WordCampKansai2015

http://www.opendata.gr.jp/

オープンデータの流通を推進する環境を整備するために,産官学の共同で取り組む活動母体として設立されたコンソーシアム(2012年7月)

2014年10月14日一般社団法人オープン&ビッグデータ活用・地方創生推進機構(略称:VLED)に移行

232015/7/25 WordCampKansai2015

オープン&ビッグデータ活用・地方創生推進機構

242015/7/25 WordCampKansai2015

総務省:オープンデータ戦略の推進

2015/7/25 25

http://www.soumu.go.jp/menu_seisaku/ictseisaku/ictriyou/opendata/

WordCampKansai2015

日本のオープンデータ都市マップ

2015/7/25 26

http://fukuno.jig.jp/2013/opendatamap

• 早期からオープンデータに取り組んでいた鯖江市でオープンデータの推進をされている福野さん(jig.jp)がまとめられている「オープンデータに取り組んでいる日本の都市の一覧」

• この一覧自体がLODとして公開されている

• 2015/06/17時点で152都市

WordCampKansai2015

まとめ①国内におけるオープンデータの動向

ここ数年,「オープンデータ」の取り組みが,国内/海外ともに,はやっています!

皆さんのお住まいの地域でも,取り組まれているかも…

WordCampKansai2015の属性シール「オープンデータ」を付けてる人は8人(のはず)

2015/7/25 WordCampKansai2015 27

Linked Open Data (LOD)

2015/7/25 28WordCampKansai2015

Linked Data Linked Data:Web上のデータを,つなぐ(linkする)ことで,新し

い価値を生み出そうとする取り組み.

Webの創始者Tim Berners-Lee氏が提唱

http://linkeddata.org/

292015/7/25 WordCampKansai2015

Linked Dataが目指すこと WWW(World Wide Web)

文書を公開し,相互に接続(ハイパーリンクでつなぐ)ための革命的な仕組みを提供したことで,今日のWebの発展につながった.

Linked Data データを共有(公開)し,相互につなぐ仕組みを提供する.

Linked Dataの原理 データの構造化

構造化されたデータはより洗練された処理を可能にする

分散したデータをつなぐハイパーリンク 文書単位では無く,データ単位のリンクを可能にする.

データの島々から一つのグローバルデータ空間へ 分散されたデータ群を1つのグローバルなデータ空間へ統合する

参考:『Linked Data-Webをグローバルなデータ空間にする仕組み(Tom Heath, Christian Bizer(武田英明監訳),丸善,2013)』 1章.

302015/6/18

TED Talk by Tim Berrners Lee (1) 2009/2

~Raw Data Now!~

http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html

データを抱え込むのでは無く,誰もが使えるように(オープンに)することを呼びかける=Raw Data Now!(生データをすぐに!)

312015/7/25 WordCampKansai2015

TED Talk by Tim Berrners Lee (2) 2010/2

~Open Dataの活用事例~

http://www.ted.com/talks/tim_berners_lee_the_year_open_data_went_worldwide.html

オープンデータの活用事例を紹介・白人/黒人の住む家と水道管の整備状況の相関を見える化→裁判で勝利へ

・Where does my money go?(税金はどこへ行った?)

(英国) http://wheredoesmymoneygo.org/(横浜市) http://spending.jp/

322015/7/25 WordCampKansai2015

5 ★ オープンデータ★ (どんな形式でも良いので) あなたのデータをオープンライセンスでWeb上に公

開しましょう★★ データを構造化データとして公開しましょう★★★ 非独占の形式を使いましょう★★★★ 物事を示すのにURIを使いましょう,そうすることで他の人々があなたのデータ

にリンクすることができます★★★★★ あなたのデータのコンテキストを提供するために他のデータへリンクしましょう

http://5stardata.info/ja/より引用

ライセンスについて

フォーマットについて

Webの発明者でありLinked Dataの創始者でもあるティム・バーナーズ=リーがオープンデータのために提案したスキーム※注:図中のPDF,エクセル,CSVのアイコンは,あくまでも例示であって,そのフォーマットを推奨している訳ではない.

332015/7/25

LOD

WordCampKansai2015

Linked Dataの基本原則

1. Use URIs as names for things全てのモノやコトにURIをつけましょう

2. Use HTTP URIs so that people can lookup those names.それらのURIをhttp(Webブラウザと同じ方法)で参照(アクセス)できるようにしましょう

3. When someone looks up a URI, provide useful information, using the standards (RDF, SPARQL)そのURIを参照したら,標準の技術(RDFやSPARQL)を使用して,役に立つ情報を提供するように

4. Include links to other URIs. so that they can discover more things.多くのモノ・コトを発見できるように,外部へのリンクを含めよう.

原文引用元 http://www.w3.org/DesignIssues/LinkedData.html日本語訳参考 http://www.slideshare.net/takeda/lod-5163454

5★オープンデータで言及

5★オープンデータで言及

342015/7/25 WordCampKansai2015

Linked Data (RDF)の例

大阪府

大阪市

都道府県 223㎢

2,687,287人面積

人口

吹田市

豊中市

…バラ科

市の木

隣接自治体

隣接自治体

http://ja.dbpedia.org/resource/大阪市 というURIから得られる情報

サクラ

Cherry blossom英名

リソース:URIで表されるモノ・コト

プロパティ:

リソース間の関係を表す

リテラル:文字列

主語 述語 目的語

トリプル※RDF(Linked Dataのデータモデル)は,「トリプルの組み合わせ」で表される

(DBpedia Japaneseより)

目的語が他のリソースのとき,トリプルを辿って更なる情報が得られる

※実際のリソースとプロパティは,すべてURIで表される. 352015/7/25 WordCampKansai2015

Linked Data (RDF)の例

http://ja.dbpedia.org/resource/大阪府

http://ja.dbpedia.org/resource/大阪市

http://ja.dbpedia.org/resource/都道府県 223㎢

2,687,287人http://ja.dbpedia.org/resource/面積

http://ja.dbpedia.org/resource/人口

http://ja.dbpedia.org/resource/吹田市

http://ja.dbpedia.org/resource/豊中市

… http://ja.dbpedia.org/resource/バラ科

http://ja.dbpedia.org/resource/市の木

http://ja.dbpedia.org/resource/隣接自治体

http://ja.dbpedia.org/resource/隣接自治体

http://ja.dbpedia.org/resource/大阪市 というURIから得られる情報

http://ja.dbpedia.org/resource/サクラ

http://ja.dbpedia.org/resource/科

Cherry blossomhttp://ja.dbpedia.org/resource/英名

(DBpedia Japaneseより)

※実際のリソースとプロパティは,すべてURIで表される.362015/7/25 WordCampKansai2015

データを「つなげる」仕組み 「3つ組(トリプル)」により様々な構造のデータの

“つながりを柔軟に表現”できる Webサイトのリンクを辿るのと同様に,プロパティ(リンク)を辿る

ことで関連するデータの情報を辿ることが出来る.

RDFのプロパティは,“関係の意味”を定義できる. cf. Webのハイパーリンクは単に“つながり”を表すのみ

データ(リソース)をURIで表すことで,“外部のデータとつなげる”ことができる. URIは,グローバルに一意のIDを表す.

WebサイトのURLと同じ仕組み.

cf.単なる数字をIDとすると,異なるDBが同じIDを使っている可能性がある

Linked Data = 外部のデータとつながったデータ≠ RDFフォーマットのデータ

372015/7/25 WordCampKansai2015

既に公開・リンクされているLOD~LODクラウド~

2007/5/12007/10/82008/9/182009/7/14

2010/9/222011/9/19時点

382015/7/25

Linking Open Data cloud diagram 2014, by Max Schmachtenberg, Christian Bizer, Anja Jentzschand Richard Cyganiak. http://lod-cloud.net/

1つの丸が個別に公開されたDBを表す.

2014/08/30時点

公開したオープンデータが他のオープンデータと「つながる」ことで「新たな価値」が生まれる

DBpedia

WordCampKansai2015

既に公開・リンクされているLOD~LODクラウド~

Linking Open Data cloud diagram 2014, by Max Schmachtenberg, Christian Bizer, Anja Jentzschand Richard Cyganiak. http://lod-cloud.net/

2014/08/30

392015 July 15 Seminar@NIBIO

既に公開・リンクされているLOD~LODクラウド~

2015 July 15 40

Domains # of dataset % Government 183 18.05

Publications 96 9.47

Life sciences 83 8.19

User-generated content 48 4.73

Cross-domain 41 4.04

Media 22 2.17

Geographic 21 2.07

Social web 520 51.28

Total 1014

Seminar@NIBIO

DBPediaWikipediaの各記事のインフォボックスの情報を抽出して自動生成されるLOD様々なデータをつなぐLODのハブ的な存在となっている.

http://dbpedia.org/

日本語版のDBPediaはhttp://jp.dbpedia.org/ インフォボックスの例

412015/7/25 WordCampKansai2015

データの例(大阪府)

2015/7/25 WordCampKansai2015 42

すべてのWikipediaの記事がhttp://ja.dbpedia.org/page/大阪府のようなURIでデータ化されている

DBpedia Japanese

2015/7/25 WordCampKansai2015 43

http://jp.dbpedia.org/

SPARQL Endpoint※ここから,検索可能

SPARQLによるRDFの検索

SPARQL RDFデータに対するクエリ言語

「指定したグラフ構造」に一致するトリプルを検索する

最も基本的な検索

select ?s ?p ?owhere {

?s ?p ?o . }LIMIT 100 ←取得する数の制限

←検索するグラフのパターン

←返す要素(*は全て)

この例では「任意のトリプルの組み合わせ」

このパターンを変えることで,欲しいデータを取得する

442015/6/18

SPARQL Endpointの例

2015/7/25 WordCampKansai2015 45

サンプルクエリ集https://t.co/6eQIPel5Vh

http://ja.dbpedia.org/sparql

ここに,クエリを入れる※プログラムからのクエリ+結果取得も可能

DBpedia Japaneseの検索例

「各都道府県で生まれた政治家の数」を調べる

PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>PREFIX dcterms: <http://purl.org/dc/terms/>PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>PREFIX dbpedia-ja: <http://ja.dbpedia.org/resource/>PREFIX category-ja: <http://ja.dbpedia.org/resource/Category:>

select distinct ?pref (count(?s) AS ?c) where {?pref rdf:type dbpedia-owl:Place.?pref dcterms:subject category-ja:日本の都道府県.?s rdf:type dbpedia-owl:Politician;

dbpedia-owl:birthPlace ?pref.}GROUP BY ?prefORDER BY ?c

2015/7/25 WordCampKansai2015 46

DBpedia Japaneseの検索例

「各都道府県で生まれた芸人の数」を調べるPREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>PREFIX dcterms: <http://purl.org/dc/terms/>PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>PREFIX dbpedia-ja: <http://ja.dbpedia.org/resource/>PREFIX category-ja: <http://ja.dbpedia.org/resource/Category:>

select distinct ?pref (count(?s) AS ?c) where {?pref rdf:type dbpedia-owl:Place.?pref dcterms:subject category-ja:日本の都道府県.?s rdf:type dbpedia-owl:Comedian;

dbpedia-owl:birthPlace ?pref.}GROUP BY ?prefORDER BY ?c

2015/7/25 WordCampKansai2015 47

ここを,Politician→Comedianに変えるだけ!

SPARQL検索が可能な日本語LOD

2015/6/18 48

http://wp.lodosaka.jp/tool/searchdata/

LODハッカソン関西のWebサイトで(関西で開催しているLODのイベント)• SPARQL検索が可能な日本語LOD• SPARQLの使い方の解説を掲載していますので,詳しく知りたい方はこちらをご覧下さい.その他にも,• LODの作成・公開の方法• LODの活用事例などの情報も掲載しています.

LODチャレンジ応募作品にみる様々なオープンデータ

LSJ: Location Site of Japanimation http://cheese-factory.info/ アニメ・ライトノベルの「聖地情報」

ねじLOD http://monodzukurilod.org/neji/

オープンデータで通勤問題解決プロジェクト http://idea.linkdata.org/idea/idea1s35i

京都が出てくる本のデータ http://linkdata.org/work/rdf1s1294i

プラネタリウムLOD http://lod.sfc.keio.ac.jp/challenge2014/show_status.php?id=d017

2015/7/25 WordCampKansai2015 49

Linked Open Data (LOD)の活用事例

2015/7/25 50WordCampKansai2015

SPARQL Timeliner

2015/6/18 51

例)水都大阪の橋大阪市HPの橋の情報をRDF化し, SPARQL Timelinerで可視化.

http://uedayou.net/osakabridge/

LODチャレンジ2013基盤技術部門優秀賞

http://uedayou.net/SPARQLTimeliner/

大阪市の施設情報・防災情報のLOD+簡易検索システム

2015/6/18 52

大阪市の施設(9,238件)・防災設備(4,694件),標高(18,780地点)の情報のLODです.約3万地点の緯度・経度情報がLOD化され,検索用API(SPAQRLエンドポイント)・簡易検索システムと共に公開.

SPARQL(RDF用検索言語)を使わずに,簡単なキーワードによる検索が可能

http://lodosaka.hozo.jp/OsakaCityMapLOD.htm

他のアプリを開発するときに,直接,利用できる仕組み

LODチャレンジ2013チャレンジデー賞

大阪もよりなび

施設情報+標高情報により,洪水時の避難場所をナビゲーションhttp://moyori.lodosaka.jp/

これまでのイベントの成果「施設・防災情報のLOD+SPARQLエンドポイント(API)」を活用することで,1日のハッカソンで開発!

2015/6/18 53

大阪から考えるCivic Techアプリコンテスト(2015年3月)準優勝(優秀賞)

大阪市の警察署・交番と犯罪発生地点の重ね合わせ

2015/6/18 54

LODチャレンジ2014ビジュアライゼーション部門 優秀賞

http://uedayou.net/osakacrimemap/

大阪から考えるCivic Techアプリコンテスト(2015年3月)特別賞(オープンデータ活用賞)

「ソウルフード」を選んで「地元率」を調べるWebサービスです.

選んだ料理の「材料」と「産地」のデータから,その料理に占める各食材の産地毎の比率(=地元率)を表示します.

「地元率」の計算

「地元」(都道府県)と「ソウルフード」を選択して,ボタンを押すと,「地元率」を計算し,結果を表示します.

選択した料理の「地元率」と合わせて,• 「元としたデータの詳細(材料の地元率)」

• その地域(「地元」)で「地元率が高い料理のランキング」

• 「地元率」を高めるための参考情報が提示されます.

http://mij.hozo.jp/メイド・イン「地元」

LODチャレンジ2013アイデア部⾨「最優秀賞」

まとめ②Linked Open Data(LOD)

Linked Dataは,Web上で公開されたオープンデータを「つなぐ」仕組みです.

いろんなデータをつなぐことで,「おもろい」組み合わせが見つかるかも!?

興味を持たれた方は,明日の“オープンデータ”のハンズオンへ!

2015/7/25 WordCampKansai2015 56

オープンデータとWordPress

2015/7/25 57WordCampKansai2015

オープンデータとWordPress

LOD作成・公開プラットフォームとして

オープンデータを公開する人は,非エンジニアも多数

オープンデータを簡単にLODとして公開できるCMSとして,WordPressを活用できないか?

例)Make JSON-LD for WordPress With Custom Fields(by Okamoto Hidetakaさん)

https://ja.wordpress.org/plugins/make-json-ld-for-custom-fields/

LOD利用プラットフォームとして

公開されているLODを,WordPress上で簡単に可視化できるプラグインがあれば,活用が進む?

JavaScriptのものは多数あるので,移植すればOK? 一緒に開発して下さる方は,明日のハンズオンへ!

2015/7/25 WordCampKansai2015 58

おわりに

オープンデータとWordPressに,共通するものは,「オープンな精神」

LOD×WordPressで新たな展開に期待!

質問:LODは何の略でしょう?

答え:Linked Open Data

2015/7/25 WordCampKansai2015 59

ご静聴,有難うございました

参考URL LODハッカソン関西(★お勧め)

:関西を中心としたLODイベントの紹介に加え,LODの技術情報をまとめています.http://wp.lodosaka.jp/

LODチャレンジhttp://lod.sfc.keio.ac.jp/

総務省:オープンデータ戦略の推進http://www.soumu.go.jp/menu_seisaku/ictseisaku/ictriyou/opendata/

古崎のSlideSharehttp://www.slideshare.net/KoujiKozaki

2015/6/18 60