「LODの概要」と 「LODとオープンデータに関する最新情報」

20
Linked Open Dataと オントロジー勉強会(第2回) LODの概要(前回の復習) LODとオープンデータに関する最新情報」 大阪大学産業科学研究所 古崎晃司 201385日(月) 於:大阪大学中之島センター 2013/8/5 2LODとオントロジー勉強会 1

Transcript of 「LODの概要」と 「LODとオープンデータに関する最新情報」

Page 1: 「LODの概要」と 「LODとオープンデータに関する最新情報」

Linked Open Dataとオントロジー勉強会(第2回)

LODの概要(前回の復習)

「LODとオープンデータに関する最新情報」

大阪大学産業科学研究所

古崎晃司

2013年8月5日(月)於:大阪大学中之島センター

2013/8/5 第2回LODとオントロジー勉強会 1

Page 2: 「LODの概要」と 「LODとオープンデータに関する最新情報」

開催概要 背景

国内外ともに,(Linked)Open Dataの活用が注目されている.

国内でも,Linked Open DataチャレンジJapanを初め,関連イベントが多数開催されている.

開催の趣旨 関西でのLODに関心のある人のコ

ミュニティ作り これからLODを利用してみたいという

人が集まって,情報共有を行う場を提供する

開催概要 2~3ヶ月に1回開催予定 「Linked Data」(書籍)に沿った勉強

会を中心に行う. 関連する技術情報やLODに関する

動向の紹介も合わせて行う

2013/8/5 第2回LODとオントロジー勉強会 2

Page 3: 「LODの概要」と 「LODとオープンデータに関する最新情報」

本日の予定 18:30~18:45

「LODの概要(前回の復習)」 「LODとオープンデータに関する最新情報」の紹介

(担当:大阪大学産業科学研究所 古崎晃司)

18:45~20:00 「Linked Data-Webをグローバルなデータ空間にする仕組み」を教科書とした勉強会

『第4章 つながるデータをデザインしよう』(担当:総合地球環境学研究所 南 佳孝)

20:00~20:30 「LODを利用するための技術・ツール」の紹介

(担当:大阪大学産業科学研究所 古崎晃司)

2013/8/5 第2回LODとオントロジー勉強会 3

Page 4: 「LODの概要」と 「LODとオープンデータに関する最新情報」

本発表

「LODの概要(前回の復習)」

LOD(Linked Open Data)とは

LODの技術的要素~RDFのデータモデル~

RDFのシリアル化形式

「LODとオープンデータに関する最新情報」の紹介

2013/8/5 第2回LODとオントロジー勉強会 4

Page 5: 「LODの概要」と 「LODとオープンデータに関する最新情報」

Linked Open Data(LOD) Linked Data:Web上のデータを,つなぐ(linkする)ことで,新しい価値

を生み出そうとする取り組み.Webの創始者Tim Berners-Lee氏が提唱

※ Linked Open Data(LOD):オープンな形で公開されたLinked Data

2013/8/5 第2回LODとオントロジー勉強会

http://linkeddata.org/

• 誰もが同じ方法で,「データをつなぐことができる仕組み」を提供している.• 技術的には,

-データ公開の共通フォーマット(URIによる名前付け,RDFによるグラフ表現-コンピュータが,データにアクセスする共通の仕組みが提供されている.

→Web上に公開された膨大なデータを統合した1つのデータベースとして利用できる.

5

Page 6: 「LODの概要」と 「LODとオープンデータに関する最新情報」

Linked Dataが目指すこと

WWW(World Wide Web) 文書を公開し,相互に接続(ハイパーリンクでつなぐ)ための革命的な仕組みを提供したことで,今日のWebの発展につながった.

Linked Data データを共有(公開)し,相互につなぐ仕組みを提供する.

Linked Dataの原理

データの構造化 構造化されたデータはより洗練された処理を可能にする

分散したデータをつなぐハイパーリンク 文書単位では無く,データ単位のリンクを可能にする.

データの島々から一つのグローバルデータ空間へ 分散されたデータ群を1つのグローバルなデータ空間へ統合する

参考:『Linked Data-Webをグローバルなデータ空間にする仕組み(Tom Heath, Christian Bizer(武田英明監訳),丸善,2013)』 1章.はじめに

2013/8/5 第2回LODとオントロジー勉強会 6

Page 7: 「LODの概要」と 「LODとオープンデータに関する最新情報」

既に公開・リンクされているLOD~LODクラウド~

2013/8/5 第2回LODとオントロジー勉強会

2007/5/1

2007/10/82008/9/182009/7/14

2010/9/22http://lod-cloud.net/

2011/9/19時点

1つの丸が個別に公開されたDBを表す.

マスメディア

地理情報

図書館・教育

ユーザ作成データ

政府情報クロス・ドメイン

ライフサイエンス

DBPedia

open.govopen.gov.uk

7

Page 8: 「LODの概要」と 「LODとオープンデータに関する最新情報」

Semantic Webの概要

Semantic Webとは

従来の「人が読む(理解する)ためのWeb」から,

「コンピュータが理解(意味処理)可能なWeb」へ 技術的には,

Web上のドキュメントにコンピュータによる意味処理に用いる「メタデータ」を付与する(タグを付ける)」

その際に用いるフォーマットが「RDF」 メタデータに用いる語彙を定義するのが「オントロジー」(RDFSやOWLで書かれる)

RDFで書かれたメタデータを検索するためのクエリー言語が「SPARQL」

...

2013/8/5 第2回LODとオントロジー勉強会 8

Page 9: 「LODの概要」と 「LODとオープンデータに関する最新情報」

RDF(Resource Description Framework)

Web上の情報(リソースと呼ぶ)を記述するための統一的枠組み

RDFのデータモデル 主語(subject),述語(predicate),目的語(object)の3つ組み(トリプル)の組み

合わせで,リソースに関する情報を表現する.

計算機表現上はXML形式をはじめ,いくつかの表現が用意されている.

リソースはURI(Uniform Resource Identifier:Web上の情報資源(リソース)の場所を示すための記述方式.URLはURIの一種)を用いて表される.

2013/8/5 第2回LODとオントロジー勉強会 9

知識工学論

古崎担当教員

主語 述語 目的語

所属知識システム研究分野

述語 目的語主語

來村担当教員 所属授業コード

280598

Page 10: 「LODの概要」と 「LODとオープンデータに関する最新情報」

RDF(Resource Description Framework)

Web上の情報(リソースと呼ぶ)を記述するための統一的枠組み

RDFのデータモデル 主語(subject),述語(predicate),目的語(object)の3つ組み(トリプル)の組み

合わせで,リソースに関する情報を表現する.

計算機表現上はXML形式をはじめ,いくつかの表現が用意されている.

リソースはURI(Uniform Resource Identifier:Web上の情報資源(リソース)の場所を示すための記述方式.URLはURIの一種)を用いて表される.

目的語には「リテラル」(文字列)を用いることができる.

2013/8/5 第2回LODとオントロジー勉強会 10

https://koan.osaka-u.ac.jp/koan/lecture#280598

http://www.ei.sanken.osaka-u.ac.jp/~kozaki/

担当教員

主語 述語 目的語

所属http://www.ei.sanken.

osaka-u.ac.jp/main

述語 目的語主語

http://www.ei.sanken.osaka-u.ac.jp/~kita/

担当教員 所属授業コード

280598

リソース

リテラルプロパティ

:リソース間の関係

Page 11: 「LODの概要」と 「LODとオープンデータに関する最新情報」

RDF(Resource Description Framework)

Web上の情報(リソースと呼ぶ)を記述するための統一的枠組み

RDFのデータモデル 主語(subject),述語(predicate),目的語(object)の3つ組み(トリプル)の組み

合わせで,リソースに関する情報を表現する.

計算機表現上はXML形式をはじめ,いくつかの表現が用意されている.

リソースはURI(Uniform Resource Identifier:Web上の情報資源(リソース)の場所を示すための記述方式.URLはURIの一種)を用いて表される.

2013/8/5 第2回LODとオントロジー勉強会 11

koan:lecture#280598 ei:kozaki/担当教員

主語 述語 目的語

所属ei:main

述語 目的語主語

ei:kita/担当教員 所属授業コード

280598ネームスペース(namespace)を用いると…koan:=https://koan.osaka-u.ac.jp/koan/ei:=http://www.ei.sanken.osaka-u.ac.jp/

Page 12: 「LODの概要」と 「LODとオープンデータに関する最新情報」

RDFのシリアル化形式

RDFのシリアル化(serialize) RDFは,リソースを主語,目的語,述語の形式で記述するデータモデルであって,データ形式ではない.

RDFの形式に沿ってトリプルを特定の文法に従ってファイルに書き出す(シリアル化する)必要がある.

代表的なシリアル化形式

RDF/XML:計算機向け

RDFa:HTMLにRDFを埋め込む

Turtle:プレーンテキストで人間向けに読みやすい

N-Triples:1行単位で処理できるので処理しやすい

RDF/JSON:Web開発向け

参考:『Linked Data』2.4.2 RDFのシリアル化形式

2013/8/5 第2回LODとオントロジー勉強会 12

Page 13: 「LODの概要」と 「LODとオープンデータに関する最新情報」

Turtle・N-Triplesの表現例

Turtle@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>@prefix foaf: <http://xmlns.com/foaf/0.1/>

<http://www.ei.sanken.osaka-u.ac.jp/~kozaki/> rdf:type foaf:Person ;foaf:name “Kouji Kozaki” .

N-Triples<http://www.ei.sanken.osaka-u.ac.jp/~kozaki/>

<http://www.w3.org/1999/02/22-rdf-syntax-ns#type><http://xmlns.com/foaf/0.1/Person>.

<http://www.ei.sanken.osaka-u.ac.jp/~kozaki/> <http://xmlns.com/foaf/0.1/name> “Kouji Kozaki”.

2013/8/5 第2回LODとオントロジー勉強会 13

http://www.ei.sanken.osaka-u.ac.jp/~kozaki/ foaf:Person

rdf:type

foaf:name Kouji Kozaki

1行

1行

ヘッダ

Page 14: 「LODの概要」と 「LODとオープンデータに関する最新情報」

本発表

「LODの概要(前回の復習)」

LOD(Linked Open Data)とは

LODの技術的要素~RDFのデータモデル~

RDFのシリアル化形式

「LODとオープンデータに関する最新情報」の紹介

第1回勉強会(4/25)以降の大きなニュース

2013/8/5 第2回LODとオントロジー勉強会 14

Page 15: 「LODの概要」と 「LODとオープンデータに関する最新情報」

2013/8/5 第2回LODとオントロジー勉強会 15

http://www.kantei.go.jp/jp/singi/it2/dai61/siryou2-1.pdf より

○公共データの民間開放(オープンデータ)の推進、ビッグデータの利活用促進(パーソナルデータの流通・促進等)

2013/05/24

Page 16: 「LODの概要」と 「LODとオープンデータに関する最新情報」

2013/8/5 第2回LODとオントロジー勉強会 16http://www3.nhk.or.jp/news/html/20130524/k10014805311000.html より

2013/05/24

交通や地理などについての各府省の公共データを一括検索できるサイトを立ち上げて来年から運用を開始

Page 17: 「LODの概要」と 「LODとオープンデータに関する最新情報」

IT総合戦略室の設置

2013/8/5 第2回LODとオントロジー勉強会 17

http://www3.nhk.or.jp/news/html/20130604/k10015065321000.html より

Page 18: 「LODの概要」と 「LODとオープンデータに関する最新情報」

統計情報の一括検索サイト

2013/8/5 第2回LODとオントロジー勉強会 18

http://statdb.nstac.go.jp/

Page 19: 「LODの概要」と 「LODとオープンデータに関する最新情報」

G8サミット・首脳宣言で「オープンデータ憲章」に合意

2013/8/5 第2回LODとオントロジー勉強会 19http://www.mofa.go.jp/mofaj/gaiko/page23_000044.html

2013/06/18

我々は,オープンデータが,イノベーションと繁栄を可能にし,また,市民のニーズに合致した,強固かつ相互に繋がった社会を構築していくための大きな可能性をもった未開発の資源であることに合意する。そのため,我々は,以下の原則に合意する。• 原則としてのオープンデータ• 質と量• すべての者が利用できる• 改善したガバナンスのためのデータの公表• イノベーションのためのデータの公表

G8各国が,「オープンデータを推進する」ことに合意

Page 20: 「LODの概要」と 「LODとオープンデータに関する最新情報」

まとめ

「LODの概要(前回の復習)」

LOD(Linked Open Data)とは

LODの技術的要素~RDFのデータモデル~

RDFのシリアル化形式

「LODとオープンデータに関する最新情報」の紹介

第1回勉強会(4/25)以降の大きなニュース 世界最先端IT国家創造宣言(2013/05/24) IT総合戦略室の設置(2013/6/4) 次世代統計利用システム(2013/6/7) G8サミット・首脳宣言で「オープンデータ憲章」に合意(2013/6/18)

2013/8/5 第2回LODとオントロジー勉強会 20