LODとオープンデータ(DBpediaとIMIの周辺を中心に)

38
LODとオープンデータ (DBpediaIMIの周辺を中心に) 武田英明 国立情報学研究所 [email protected] @takechan2000 一般社団法人オープン&ビッグデータ活用・地方創生推進機構 第2回テストベッド検討分科会, 2017712日、東京

Transcript of LODとオープンデータ(DBpediaとIMIの周辺を中心に)

Page 1: LODとオープンデータ(DBpediaとIMIの周辺を中心に)

LODとオープンデータ(DBpediaとIMIの周辺を中心に)

武田英明国立情報学研究所

[email protected]@takechan2000

一般社団法人オープン&ビッグデータ活用・地方創生推進機構第2回テストベッド検討分科会, 2017年7月12日、東京

Page 2: LODとオープンデータ(DBpediaとIMIの周辺を中心に)

"Linking Open Data cloud diagram 2017, by Andrejs Abele, John P. McCrae, Paul Buitelaar, Anja Jentzsch and Richard Cyganiak. http://lod-cloud.net/"

Last updated: 2017-02-20

Page 3: LODとオープンデータ(DBpediaとIMIの周辺を中心に)

DBpedia Japanese

• http://ja.dbpedia.org

• since 2012

• To promote LOD to Japanese communities

• To provide a hub of Japanese resources

3

Page 4: LODとオープンデータ(DBpediaとIMIの周辺を中心に)

Japanese Linked Data Cloud

Page 5: LODとオープンデータ(DBpediaとIMIの周辺を中心に)

アプリ: 分野別

総数: 26外部: 22 (84.6%)

Page 6: LODとオープンデータ(DBpediaとIMIの周辺を中心に)

アプリ: プラットフォーム別

Page 7: LODとオープンデータ(DBpediaとIMIの周辺を中心に)
Page 8: LODとオープンデータ(DBpediaとIMIの周辺を中心に)
Page 9: LODとオープンデータ(DBpediaとIMIの周辺を中心に)
Page 10: LODとオープンデータ(DBpediaとIMIの周辺を中心に)

10http://fukushima.archive-disasters.jp

Page 11: LODとオープンデータ(DBpediaとIMIの周辺を中心に)

11http://fukushima.archive-disasters.jp/id/resource/M2013011819361283671

Page 12: LODとオープンデータ(DBpediaとIMIの周辺を中心に)

12

Page 13: LODとオープンデータ(DBpediaとIMIの周辺を中心に)

13http://lodc.med-ontology.jp/

Page 14: LODとオープンデータ(DBpediaとIMIの周辺を中心に)
Page 15: LODとオープンデータ(DBpediaとIMIの周辺を中心に)

データセット: 分野別

総数: 28外部: 24 (85.7%)

Page 16: LODとオープンデータ(DBpediaとIMIの周辺を中心に)

データセット: ライセンス別

オープン

クローズド

Page 17: LODとオープンデータ(DBpediaとIMIの周辺を中心に)

LODチャレンジ

• DBpedia JapaneseはLODACがデータ提供パートナーとして参加しているという体をとっていた

• しかしDBpedia Japanese利用者の誰も”LODAC”とは書いていない

• 参加の仕方の再考が必要

Page 18: LODとオープンデータ(DBpediaとIMIの周辺を中心に)

LODチャレンジ:Dbepdiaを使った作品の応募数

• データセットとアプリケーションで関連する応募が存在する場合もあるが、それぞれ別にカウントしている

• 2011年からなのは応募時点で

はなく調査時点で実装されているかで判断したため

Page 19: LODとオープンデータ(DBpediaとIMIの周辺を中心に)

受賞作品10中7作品が部門賞

Page 20: LODとオープンデータ(DBpediaとIMIの周辺を中心に)

受賞作品11中8作品が部門賞

Page 21: LODとオープンデータ(DBpediaとIMIの周辺を中心に)

共通語彙基盤の推進

• 情報を正しく効率的に交換、活用していくためには、人名、住所、物

等、データを体系的、かつ、構造的に定義して行く必要がある。

21

検索

オープンデータ

システム連携

三鷹市立第四小学校ic:建物_所在

ic:場所_地名ic:場所_地理識別子ic:場所_住所

ic:住所_住所東京都三鷹市下連雀1丁目25−1

ic:住所_構造化住所ic:構造化住所_国ic:構造化住所_都道府県 東京都ic:構造化住所_市区町村 三鷹市ic:構造化住所_町名 下連雀ic:構造化住所_街区符号 1ic:構造化住所_住居番号 25ic:構造化住所_地番 1ic:構造化住所_方書

ic:方書_方書ic:方書_ビル名ic:方書_部屋番号

ic:構造化住所_郵便番号 181-0013ic:構造化住所_住所IDic:構造化住所_住所コード

ic:場所_経緯度座標ic:経緯度座標系_測地系コードic:経緯度座標系_緯度

ic:緯度_度ic:緯度_分ic:緯度_秒

ic:経緯度座標系_経度ic:経度_度ic:経度_分ic:経度_秒

ic:場所_UTM座標ic:UTM座標系_UTM座標ic:UTM座標系_UTM測地系IDic:UTM座標系_東距ic:UTM座標系_グリッドゾーンIDic:UTM座標系_グリッドゾーン格子 IDic:UTM座標系_北距

ic:場所_MGRS座標ic:MGRS座標系_MGRS座標ic:MGRS座標系_MGRS座標格子ID

ic:建物_施設情報ic:施設_ID

ic:証明_識別IDic:証明_証明種類ic:証明_発行日ic:証明_失効日ic:証明_発行者

ic:施設_名称 三鷹市立第四小学校ic:施設_種別 小学校ic:施設_商用区分

ic:施設_概要小・中一貫教育校「連雀学園」に属する小学校。

項目名(Type/Sub-properties) 項目名(エントリー名) 英語名 データタイプ データタイプ(英語) cardinality 項目説明 項目説明(英語) サンプル値 Mapping to NIEM Mapping to ISA Joinup人型 ic:人型 PersonType 人の情報を表現するためのデータ型。 nc:PersonType Person

氏名 ic:人_氏名 PersonName ic:氏名型 ic:PersonNameType 0..1 氏名 Name of a Person - nc:PersonName性別 ic:人_性別 PersonSex <抽象要素> <abstract element, no type> 0..1 性別 Gender of a Person 1 nc:PersonSex gender

Substitutable Elements: Substitutable Elements:性別コード ic:人_性別コード + PersonSexCode codes:性別コード型 codes:GenderCodeType 性別コード Gender of a Person 1 nc:PersonSexCode性別名 ic:人_性別名 + PersonSexText ic:テキスト型 ic:TextType 性別の名称。 Gender of a Person 男 nc:PersonSexText

生年月日 ic:人_生年月日 BirthDate ic:日付型 ic:DateType 0..1 生年月日 Date of Birth of a Person - nc:PersonBirthDate dateOfBirth死亡年月日 ic:人_死亡年月日 DeathDate ic:日付型 ic:DateType 0..1 死亡年月日 Date of Death of a Person - nc:PersonDeathDate dateOfDeath現住所 ic:人_現住所 PresentAddress ic:住所型 ic:AddressType 0..1 現住所 - nc:PersonResidenceAssociationTyperesidency本籍 ic:人_本籍 LegalResidence ic:住所型 ic:AddressType 0..1 本籍 -

国籍 ic:人_国籍 Citizenship <抽象要素> <abstract element, no type> 0..n 国籍A county that assigns rights, duties, and privileges to a person because ofthe birth or naturalization of the person in that country.

- nc:PersonCitizenship citizenship

Substitutable Elements: Substitutable Elements:

国籍名 ic:人_国籍名 + CitizenshipText ic:テキスト型 ic:TextType 国籍の名称。A county that assigns rights, duties, and privileges to a person because ofthe birth or naturalization of the person in that country.

日本国 nc:PersonCitizenshipText

国籍コード ic:人_国籍コード + CitizenshipCode codes:国籍コード型 codes:CitizenshipCodeType 住民基本台帳で利用されている国籍コード。A county that assigns rights, duties, and privileges to a person because ofthe birth or naturalization of the person in that country.

392 nc:PersonCitizenshipFIPS10-4Code

ISO3166Alpha2 ic:人_ISO3166Alpha2 + ISO3166Alpha2 iso_3166:ISO3166Alpha2CodeTypeiso_3166:ISO3166Alpha2CodeType 国名コード。ISO3166Alpha2。2文字コード。A county that assigns rights, duties, and privileges to a person because ofthe birth or naturalization of the person in that country.

nc:PersonCitizenshipISO3166Alpha2Code

ISO3166Alpha3 ic:人_ISO3166Alpha3 + ISO3166Alpha3 iso_3166:ISO3166Alpha3CodeTypeiso_3166:ISO3166Alpha3CodeType 国名コード。ISO3166Alpha3。3文字コード。A county that assigns rights, duties, and privileges to a person because ofthe birth or naturalization of the person in that country.

nc:PersonCitizenshipISO3166Alpha3Code

ISO3166Numeric ic:人_ISO3166Numeric + ISO3166Numeric iso_3166:ISO3166NumericCodeTypeiso_3166:ISO3166NumericCodeType 国名コード。ISO3166Numeric。数字3桁コード。A county that assigns rights, duties, and privileges to a person because ofthe birth or naturalization of the person in that country.

nc:PersonCitizenshipISO3166NumericCode

出生国 ic:人_出生国 BirthCountry ic:場所型 ic:LocationType 0..1 生まれた国。 A location where a person was born. nc:PersonBirthLocation countryOfBirth出生地 ic:人_出生地 BirthPlace ic:場所型 ic:LocationType 0..1 生まれた場所。 A location where a person was born. nc:PersonBirthLocation placeOfBirth

氏名型 ic:氏名型 PersonNameType 氏名を表現するためのデータ型。 nc:PersonNameType姓名 ic:氏名_姓名 FullName ic:テキスト型 ic:TextType 0..1 氏名(姓、名)。 Full name of a Person 経済  太郎 nc:PersonFullName fullNameカナ姓名 ic:氏名_カナ姓名 KanaFullName ic:カタカナテキスト型 ic:TextType 0..1 氏名(姓、名)のカナ表記。 Full name in Katakana. ケイザイタロウローマ字姓名 ic:氏名_ローマ字姓名 RomanFullName ic:テキスト型 ic:TextType 0..1 氏名(姓、名)のローマ字表記。 Full name in Roman alphabet. Keizai Taro姓 ic:氏名_姓 FamilyName ic:テキスト型 ic:TextType 0..1 姓。 Family name of a Person 経済 nc:PersonSurName familyNameカナ姓 ic:氏名_カナ姓 KanaFamilyName ic:カタカナテキスト型 ic:TextType 0..1 姓のカナ表記。 Family name in Katakana. ケイザイローマ字姓 ic:氏名_ローマ字姓 RomanFamilyName ic:テキスト型 ic:TextType 0..1 姓のローマ表記。 Family name in Roman alphabet.名 ic:氏名_名 GivenName ic:テキスト型 ic:TextType 0..1 名。 Given name of a Person 太郎 nc:PersonGivenName given nameカナ名 ic:氏名_カナ名 KanaGivenName ic:カタカナテキスト型 ic:TextType 0..1 名のカナ表記。 Given name in Katakana. タロウローマ字名 ic:氏名_ローマ字名 RomanGivenName ic:テキスト型 ic:TextType 0..1 名のローマ字表記。 Given name in Roman alphabet.ミドルネーム ic:氏名_ミドルネーム MiddleName ic:テキスト型 ic:TextType 0..1 ミドルネーム。 Middle name of a person nc:PersonMiddleName alternativeNameカナミドルネーム ic:氏名_カナミドルネーム KanaMiddleName ic:カタカナテキスト型 ic:TextType 0..1 ミドルネームのカナ表記。 Middle name in Katakana.ローマ字ミドルネーム ic:氏名_ローマ字ミドルネーム RomanMiddleName ic:テキスト型 ic:TextType 0..1 ミドルネームのローマ字表記。 Middle name in Roman alphabet.旧姓 ic:氏名_旧姓 MaidenName ic:テキスト型 ic:TextType 0..1 旧姓。 Maiden name. nc:PersonMaidenName birthNameカナ旧姓 ic:氏名_カナ旧姓 KanaMaidenName ic:カタカナテキスト型 ic:TextType 0..1 旧姓のカナ表記。 Maiden name in Katakana.ローマ字旧姓 ic:氏名_ローマ字旧姓 RomanMaidenName ic:テキスト型 ic:TextType 0..1 旧姓のローマ字表記。 Maiden name in Roman alphabet.

語彙(ボキャブラリ)、情報交換パッケージ(IEP)

Schema.org検索エンジン大手が整備する構造化データマークアップの共通仕様

情報交換パッケージにより、システム間を連携・高速な情報連携・設計の効率化

語彙で意味を確認し、情報交換パッケージから、情報を抽出・サービス設計の効率化・安定した情報連携

語彙間の整理をしておくことで、検索を効果的に実施・検索の利便性の向上・効果的な広報の実施

共通語彙基盤は、用語の参照辞書を整備することで、各種データの同一性の確認を容易にし、その結果として、システム間の連携やオープンデータの活用を容易にできるようにする仕組み。

http://goikiban.ipa.go.jp/

(IMI: Infrastructure for Multi-layer Interoperability)

Page 22: LODとオープンデータ(DBpediaとIMIの周辺を中心に)

IMI共通語彙とは• 構造化概念辞書

– 概念辞書• 概念の表記としての用語

– 各項目は概念であって用語でない。

– 構造化辞書• 概念は相互につながっていて、その組み合わせ(構造で意味を表現する

人型氏名性別性別コード生年月日住所…

氏名型種別姓名姓名…

住所型種別表記郵便番号都道府県市区町村

文字列

文字列

文字列

コード型

文字列文字列

文字列

文字列

文字列

文字列

コード型種別値

氏名型

住所型

コードリスト型

文字列

事象型 クラス概念

プロパティ(関係概念)

クラス概念の構造

クラス概念の表記

プロパティの値の範囲

Page 23: LODとオープンデータ(DBpediaとIMIの周辺を中心に)

シリアライズ

IMI語彙

JSON-LDコンテキスト

RDFスキーマ

XMLスキーマ

構造化項目名マッピング仕様(近日公開予定)

JSON(JSON-LD)

RDF

XML

CSVなどの表形式

Page 24: LODとオープンデータ(DBpediaとIMIの周辺を中心に)

ひな形群• DMD(Data Model Description)

– 法人基本情報 DMD@ja– 法人活動情報 DMD@ja– 施設 DMD@ja– 避難施設 DMD@ja– 設備 DMD@ja– 医療機関 DMD@ja– 氏名 DMD@ja– イベント DMD@ja– 住所 DMD@ja– 組織 DMD@ja– 地物 DMD@ja

• PD– PD5474(観光施設に関する語彙の検討)– PD7706(イベントに関する語彙の検討)– PD2342(法人情報に関する語彙)– PD1462(子育て関連施設に関する語彙の検討)

• ドキュメント化待ち– 調達– 制度(サービス)

Page 25: LODとオープンデータ(DBpediaとIMIの周辺を中心に)

現在どこまでできているのか

準備・検証

•動向調査と試行版の作成

開発・検証

•コア語彙の整備

普及

•法人やイベントなどの事例を軸に展開

•官民データ

2013.2 一次プロジェクト開始2013.6 IMI1.01

2013.9 二次プロジェクト開始2014.6 IMI2.02014.9 IMI2.12015.2 IMI2.22015.12 IMI2.32017.3 IMI2.4

2017.1 法人インフォーメーション2017.1 埼玉県オープンデータポータル2017.6 こども霞が関見学デー

Page 26: LODとオープンデータ(DBpediaとIMIの周辺を中心に)

動き始めたIMI• 法人インフォメーション

– 法人番号をキーに、政府内の法人関連情報(基本情報、契約情報、表彰情報、届出情報、処分情報等)を一元的に公開• 法人情報データを、共通語彙基盤で整備

• 今後、法人マスターデータや申請書の設計に活用→民間に展開

• こども霞が関見学デー– 8月に行われる子供向け体験イベントの情報を集約して提供• イベントデータを、共通語彙基盤で整備

• 今後、イベントデータ構造を広く公開(現在もPDで公開)

• 埼玉県オープンデータカタログ

– 埼玉県下58自治体のオープンデータのデータ項目や構造を共通化• 10分野を共通語彙基盤で整備

• 他自治体でも類似の取り組みが広がる26

Page 27: LODとオープンデータ(DBpediaとIMIの周辺を中心に)
Page 28: LODとオープンデータ(DBpediaとIMIの周辺を中心に)
Page 29: LODとオープンデータ(DBpediaとIMIの周辺を中心に)
Page 30: LODとオープンデータ(DBpediaとIMIの周辺を中心に)
Page 31: LODとオープンデータ(DBpediaとIMIの周辺を中心に)
Page 32: LODとオープンデータ(DBpediaとIMIの周辺を中心に)
Page 33: LODとオープンデータ(DBpediaとIMIの周辺を中心に)
Page 34: LODとオープンデータ(DBpediaとIMIの周辺を中心に)
Page 35: LODとオープンデータ(DBpediaとIMIの周辺を中心に)
Page 36: LODとオープンデータ(DBpediaとIMIの周辺を中心に)

@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .@prefix xsd:<http://www.w3.org/2001/XMLSchema#> .@prefix dct: <http://purl.org/dc/terms/> .@preix dsv] <http://datashelf.jp/ns/dsv#> .@prefix schema: <http://schema.org/> .@prefix ic: <http://imi.go.jp/ns/core/rdf#> .

:6hsggmrzUs3zsLeZ a ic:イベント型 ;rdfs:label "オリックス神戸開幕戦特別無料招待" ;ic:参加方法 “【応募方法】往復はがき…" ;dsv:募集人数 "内野自由席(4人以内)1,500組" ;schema:inLanguage "日本語" ;schema:url "https://www.kobe-park.or.jp/" ;geo:lat "34.68088444710041" ;geo:long "135.073511041217" ;ic:名称 [ic:表記 "オリックス神戸開幕戦特別無料招待"

] ;ic:説明 "4月7日(金)18時より開催されるオリックス vs日本ハム戦

(2017神戸開幕戦・花火ナイト)に神戸市民の皆さま、1500家族をご招待します!! (抽選、往復はがき1枚につき4人までご招待)" ;

ic:料金 [ic:種別 "無料"ic:表記 ""

] ;ic:種別 "スポーツ" ;ic:種別 "全般" ;ic:種別 "その他" ;ic:連絡先 [ic:種別 "イベント内容問い合わせ先" ;ic:電話番号 "078-795-5533" ;ic:FAX番号 "078-795-5544" ;ic:名称 [ic:表記 "(公財)神戸市公園緑化協会"

]] ;

ic:期間 [ic:開始日 [ic:標準型日付 "2017-04-07"

] ;ic:終了日 [ic:標準型日付 "2017-04-07"

] ;ic:開始時間 "18:00" ;ic:終了時間 "21:30"

] ;ic:開催場所 [ic:名称 [ic:表記 "ほっともっとフィールド神戸"

] ;ic:住所 [ic:表記 "神戸市須磨区緑台(神戸総合運動公

園内)"] ;ic:アクセス [ic:備考 "神戸市営地下鉄・総合運動公園駅 下

車 徒歩1分"]ic:地理座標 [ic:緯度 "34.68088444710041" ;ic:経度 "135.073511041217"

] ;ic:備考: ""

] ;dsv:対象地域 "須磨" ;ic:画像 "https://mb.api.cloud.nifty.com/2013-09-

01/applications/08eBRsgoGmYUZHRN/publicFiles/q26moYqhdhPy6vjY_kf1482911714575_img_mascot01.gif" .

Page 37: LODとオープンデータ(DBpediaとIMIの周辺を中心に)
Page 38: LODとオープンデータ(DBpediaとIMIの周辺を中心に)