サイバー演習の有効性 レジリエントな組織づくりに …ICS-CERT 研究機関 大学 講師 専属講師・研究者 研究者 +招待講演者 (ベンダー・セキュリ
なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~
-
Upload
kei-kurakawa -
Category
Documents
-
view
4.602 -
download
1
description
Transcript of なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~
http://www.nii.ac.jp/cscenter/
なぜ研究者の名寄せが必要か ~世界の動向と研究者リゾルバー~
CSI委託事業ワークショップ「名寄せのこれから~研究者IDサミット~」
2011年2月17日,学術総合センター,主催:金沢大学
蔵川 圭
国立情報学研究所
学術コンテンツサービス研究開発センター
http://www.nii.ac.jp/cscenter/
学術研究における貢献
• 学術研究成果の多くは論文として出版され公表される
• すでに存在する論文を引用しながらそれが表す知識の体系を位置づける
• 誰が貢献したか、どのような組織が貢献したかがわかるように内容とともに著者名や所属組織名が明記される。助成機関に対して謝辞を加えることも多い
• ある研究者がどのくらい知識の体系化に貢献したかを測ってみたいとき、研究者の論文を並べてみればよい
2
http://www.nii.ac.jp/cscenter/
名前の曖昧性の問題
(Name Ambiguity Problem)
• 同姓同名
• 旧姓
• ペンネーム
• 漢字異体字
• ジャーナルごとに異なる姓名表記フォーマット
–姓名の順
– イニシャル表記
–大文字・小文字
3
http://www.nii.ac.jp/cscenter/
名前の翻字(transliterate)
• ラテン文字への翻字によって、同姓同名が増える
4
“Which Wei Wang?”,Phys. Rev. Lett. 99, 230001 (2007)
DOI:10.1103/PhysRevLett.99.230001
王伟,王薇,王维,王蔚,汪卫,汪玮,汪威,汪巍
Wei Wang
http://www.nii.ac.jp/cscenter/
名寄せ(Name Disambiguation)
• 名前の問題を解決して、同一性を判定することを「名寄せ」という
• 研究者の名寄せによって、
– 研究者ごとに正確に論文やその他研究成果をリスト化でき、リストは知識体系への貢献度を正確に測る情報源となる
– 研究者が正確に過去の業績によってプロファイルされることで、そのプロファイルは新たな研究チームを構成する際の正確な情報源として活用できる
– 学術コミュニケーションにおける様々な場面において、研究者を特定した情報交換が可能となる
5
http://www.nii.ac.jp/cscenter/
日本の図書館目録
• NACSIS-CAT – 国立情報学研究所の運営
– 日本の大学図書館の所蔵する図書・雑誌の総合目録
– 洋書が多く含まれる
– USMARC準拠
– 日本目録規則,およびAACR2
• JAPAN/MARC – 国立国会図書館の運営
– 国会図書館の所蔵する,日本で刊行された出版物および外国で刊行された日本語出版物の目録
– UNIMARC準拠
– 日本目録規則
• TRC/MARC – 図書館流通センターの運営
– 日本で刊行される出版物の目録
– UNIMARC準拠
– 日本目録規則 6
書誌 典拠
著者名 (統一)書名
参照する
目録
参照する
http://www.nii.ac.jp/cscenter/
図書館目録の著者名典拠
• NACSIS-CAT著者名典拠ファイル – 個人名,団体名の典拠
– 個人名1,263,685件(西洋人著者名含む, 2008年12月18日)
• JAPAN/MARC典拠ファイル – 個人名,家名,団体名,および統一書名の典拠
– 個人名681,924件(西洋人著者名含む, 2008年7月5日)
• TRC/MARC著者名典拠ファイル – 個人名,機関名の典拠
– 個人名566,249件(西洋人著者名含む, 2009年3月29日)
7
人名データベース 登録件数 (漢字圏の東洋人の統一形標目
を抜粋)
同一姓名が複数存在する登録件数
同一姓名が複数存在する異なり姓
名数
同一姓名に対する最大登録件数
同一姓名が複数存在する登録件数の割合
NACSIS-CAT 著者名典拠ファイル
(2008年12月18日) 329,864 32,034 13,344 20 9.71%
JAPAN/MARC 典拠ファイル
(2008年7月5日) 572,638 73,138 28,067 29 12.77%
TRC/MARC 著者名典拠ファイル
(2009年3月29日) 464,962 58,979 22,969 27 12.68%
http://www.nii.ac.jp/cscenter/
著者名典拠における
異なり姓名ごとの登録件数の分布
8
0
5
10
15
20
25
30
150
110
01
15
01
20
01
25
01
30
01
35
01
40
01
45
01
50
01
55
01
60
01
65
01
70
01
75
01
80
01
85
01
90
01
95
01
10
001
10
501
11
001
11
501
12
001
12
50
113
001
NACSIS-CAT
527,567
13,344 20
0
5
10
15
20
25
30
150
110
01
15
01
20
01
25
01
30
01
35
01
40
01
45
01
50
01
55
01
60
01
65
01
70
01
75
01
80
01
85
01
90
01
95
01
10
001
10
501
11
001
11
501
12
001
12
501
13
001
13
501
14
001
14
501
15
001
15
501
16
001
16
501
17
001
17
501
18
001
18
501
19
001
19
501
20
001
20
501
21
001
21
501
22
001
22
501
23
001
23
501
24
001
24
501
25
001
25
501
26
001
26
501
27
001
27
501
28
001
0
5
10
15
20
25
30
150
110
01
15
01
20
01
25
01
30
01
35
01
40
01
45
01
50
01
55
01
60
01
65
01
70
01
75
01
80
01
85
01
90
01
95
01
10
001
10
501
11
001
11
501
12
001
12
501
13
001
13
501
14
001
14
501
15
001
15
501
16
001
16
501
17
001
17
501
18
001
18
501
19
001
19
501
20
001
20
501
21
001
21
501
22
001
22
501
JAPAN/MARC
TRC/MARC
29
27
28,067
22,969 428,952
311,174
件
件
件
異なり姓名順位
異なり姓名順位
異なり姓名順位
登録件数
登録件数
登録件数
http://www.nii.ac.jp/cscenter/
著者名典拠における
異なり姓名順位トップ20 NACSIS--CAT JAPAN/MARC TRC/MARC
順位 姓名 登録件数 姓名 登録件数 姓名 登録件数
1 高橋徹 20 鈴木博 29 鈴木博 27
2 鈴木博 17 田中実 29 田中実 26
3 佐藤進 17 伊藤博 28 小林茂 24
4 田中実 16 小林茂 26 高橋徹 23
5 伊藤博 16 鈴木一郎 24 鈴木実 22
6 高橋進 13 高橋一郎 22 佐藤進 21
7 高橋清 13 佐藤正 22 渡辺誠 19
8 鈴木一郎 13 高橋徹 21 佐藤正 19
9 小林茂 13 鈴木実 21 伊藤博 19
10 吉田豊 13 田中豊 21 田中稔 18
11 高橋誠 12 (李〓) 21 小林一郎 18
12 田中宏 12 鈴木茂 20 鈴木隆 17
13 渡辺誠 12 吉田稔 20 鈴木茂 17
14 渡辺茂 12 田中宏 19 田中宏 17
15 小林哲夫 12 佐藤進 19 吉田豊 17
16 田中明 11 高橋和子 18 佐藤博 17
17 佐藤正 11 渡辺誠 18 高橋進 16
18 中村宏 11 渡辺宏 18 田中豊 16
19 高橋豊 10 高橋清 17 田中茂 16
20 高橋正明 10 (陳〓) 17 田中一郎 16
9
http://www.nii.ac.jp/cscenter/
母集団の大きさに依存する
同姓同名の割合 • 文献によると
–田中康仁,同姓同名の発生頻度,計算言語学10-1,1977
–昭和51年当時の日本人の漢字姓名107万人の名簿を用いて機械的に数え上げ
10
0
10
20
30
40
0 50 100 150
同姓同名がいる人の割合(%)
万人
%
母集団
http://www.nii.ac.jp/cscenter/
研究者の名寄せの方法
• 図書館の目録のように、閉じたデータベースの中では人手で著者に英数字記号の識別子(Identity: ID)を付けて区別した
• 学術論文のデータベースでは、2つの方法がとられてきた – 計算機による名寄せ
– 手動で登録
• 新たな名寄せの潮流 – ORCID (Open Researcher and Contributor ID)
– 学術コミュニケーションに関与するすべてのステークホルダーを包含した、研究者にIDを付与するコミュニティを形成する
11
http://www.nii.ac.jp/cscenter/
学術論文データベースにおける
これまでの2つのアプローチ • 計算機による名寄せ
– 論文書誌を対象に著者でまとめる
– 論文情報システムの著者名検索結果として機能
– プロダクションシステムとして必要な99%以上の精度を求めるには程遠い
– 例 • Scopus Author Identifier
(Elsevier社のScopusに実装)
• Distinct Author Identification System (Thomson Reuters社のWeb of Scienceに実装)
• 手動で登録 – 著者を対象に論文書誌を集める
– 研究者業績ショーケースとして機能
– 簡単に著者と論文書誌を網羅できない
– 例 • ResearcherID (Thomson Reuters社) 12
http://www.nii.ac.jp/cscenter/
研究者ID付与コミュニティORCID
• Open Researcher and Contributor ID – Open : 公開された
– Researcher : 研究者
– Contributor : 貢献者
– ID : 本人証明
• 設立趣旨(Mission Statement) – ORCIDは、学術コミュニケーションにおける著者/貢献者の名前の曖昧性の問題を解決することを目的とし、個々の研究者に対する固有の識別子の中央レジストリと、ORCIDと現存する他の著者IDスキームとの間のオープンで透過的なリンクメカニズムを構築することによって実現する。これらの識別子及び識別子間の関係は研究者のアウトプットにリンクすることが可能であり、科学的発見プロセスを拡大させ、研究コミュニティにおける研究助成や協働の効率性を改善する。
• http://www.orcid.org/ 13
http://www.nii.ac.jp/cscenter/
ORCIDの参加組織
• 2010年11月では144機関。
–学術機関47、出版者28、企業19、学会15、政府11、NPO17、その他7
–米国70、英国30、ドイツ8、オーストラリア6、日本
3、イタリア3、インド3、スペイン2、中国2、カナダ2、トルコ1、スイス1 、スウェーデン1 、韓国1 、シンガポール1 、セルビア1 、オランダ1 、イスラエル1 、ギリシャ1 、フランス1 、エジプト1 、コロンビア1 、ブラジル1 、ベルギー1 、オーストリア1
14
http://www.nii.ac.jp/cscenter/
ORCID IDシステム
• アイデンティティとして扱う基本的な情報
–著者/貢献者自身の記述
–著者/貢献者とその出版物間の関係の記述
• ハイブリッド型による登録
–著者/貢献者による登録
–組織による登録
15
ORCID ID
プロファイル
出版物申告
http://www.nii.ac.jp/cscenter/
ORCID IDシステムのシナリオ
16
コアシステム (ORCID identity system)
パートナー システム
エンド ユーザー
だれが文書Xを書いたか?
ID Yの人が書いた、
または査読した文書はどれか?
たとえば、原稿追跡システム(MTS : Manuscript Tracking
System)にシングルサインオン(SSO)して、編集事務局、マーケ
ティング部門、ロイヤルティ支払いシステムなどと連絡先情報を共有
http://www.nii.ac.jp/cscenter/
プロファイルの交換とマッチング
ORCID
F67572010
17
可能なマッチングアルゴリズム • VIAF(OCLC) • Author Resolver (ProQuest) • OKKAM
(By Howard Ratner, ORCID Update, Slides at CrossRef Annual Meeting, in London, 16 Nov. 2010)
http://www.nii.ac.jp/cscenter/
著作者にIDを付ける活動
• バーチャル国際典拠ファイル VIAF (Virtual International Authority File), – 米国OCLC
– LC
– ドイツDNB
– フランスBnF
• 国際標準名前識別子 ISNI (International Standard Name Identifier), ISO27729 – International Confederation of Societies of Authors and
Composers (CISAC) www.cisac.org
– International Federation of Reproduction Rights Organisations (IFRRO)www.ifrro.org
– International Performers’ Database Association (ipda.sami.se)
– Bowker (www.bowker.com )
– Online Computer Library Center (OCLC) (www.oclc.org)
– Bibliotheque Nationale de France
– The British Library 18
http://www.nii.ac.jp/cscenter/
VIAF
• 各国の名前典拠ファイルをリンク
• 今は個人名のみ
19
• 1050万件(2010-03)の名前レコード
• 抽出元
– 1300万件名前レコード
– 8000万件の引用レコード
http://www.nii.ac.jp/cscenter/
ISNI
20
ブリッジ識別子
・16ケタの数字
・クリエーター一般
・少なくとも2000万件のIDを想定
http://www.nii.ac.jp/cscenter/
機関リポジトリを対象とした
著者にIDを付ける活動
• DAI (Digital Author Identifier), オランダSURF財団
• Names Project, 英国 Mimas, JISC funded
• arXiv.org Author Identifiers, 米国コーネル大学
• Networking Names, 米国OCLC
• 研究者リゾルバー,NII
21
http://www.nii.ac.jp/cscenter/
JAIRO著者同定
22
研究者リゾルバー JAIRO
IR著者名典拠
(研究者ディレクトリ) IR
機関 (機関レベル)
NII (国レベル)
書誌メタデータ
[ローカル研究者IDが組み込まれている]
日本の機関リポジトリからJAIROがハーベストした
書誌メタデータに書かれた著者を同定するために
研究者リゾルバーIDと機関のローカル研究者IDとの
マッピングテーブル
双方のシステムで同一のローカル研究者
IDスキームが使われるべきである
メタデータをハーベストする間、
ローカル研究者IDを解決する
書誌レコード 著者名典拠
http://www.nii.ac.jp/cscenter/
IRにおける研究者典拠IDの付与
23
DSpace 1.6
Authority Control
http://www.nii.ac.jp/cscenter/
研究者リゾルバーの目的
• 日本の研究者を対象としたWeb上の名前典拠 – Web上にアーカイブされたリソースをターゲット
• 例1) 機関リポジトリ
• 例2) 論文アーカイブ
– さらに、日本の研究組織を対象とした名称典拠
• 2種類のエンティティ、すなわち論文と研究者をベースとした情報マネージメント
• 情報の質に応じた研究者情報マネージメント – 研究者情報の品質レベル
• 機関担当者による
• 研究者自身による
• 機械の自動処理による
• Web上のリソースのリンキングハブ – 研究者データベースへ直接リンク
• 大学研究者ディレクトリ, KAKEN, ReaD
– 学術関連データベースへ 検索問い合わせURLリンク
• Google (Scholar), CiNii, WebcatPlus, ReaD
• Linked Data Webのための、 日本の研究者と組織のURI表現
• 名前解決するWebサービス
• NIIの学術関連サービスへの 密接なデータ連携 24
研究者のカバー率
\論文
\
\
研究者
機関担当者によるとりまとめ
研究者自身によるとりまとめ
機械による自動処理
機関担当者による登録
研究者ディレクトリReaD
IR
KAKEN
機関にあるホームページ
研究者自身による登録
ResearcherID
Researchmap
機械による自動処理
CiNii 著者検索 Google
scholar
研究者 リゾルバー
情報の品質レベル
高
高
http://www.nii.ac.jp/cscenter/
研究者リゾルバーのアプローチ
• 日本の研究者を対象としたURIベースのIDスキーム – 研究者リゾルバーID
– http://rns.nii.ac.jp/nr/xxxxxxxxxxxxx (xxxxxxxxxxxxxはID)
• KAKENから研究者を初期登録 (2010年3月19日現在、 177,558人) • 機関担当者による、IDに紐づいた研究者プロファイルのアップロード
– 研究者リゾルバーIDと、他のIDスキームによるIDリスト • 機関による完全に永続的なID (例、職員番号、同姓同名を区別する) • ・・・・・ • 科研費研究者番号
• ReaD研究者コード
• ResearcherID (Thomson Reuters)
• 研究者リゾルバーID
– 名前
– 所属履歴
– 業績リスト
• 大学研究者ディレクトリへの自動リンキング – 大学研究者ディレクトリをWebクローリング
– 自動研究者同定 25
http://www.nii.ac.jp/cscenter/
研究者同定スキーム
• 研究者が同じ人物であることを示すこと
• 研究者/著者を同定しマネージメントするひとつの方法
– 番号IDスキーム • 13ケタの番号によって研究者を表す
• 研究者リゾルバーIDと呼ぶ
26
研究者同定
ID (13ケタの番号) 説明
10000xxxxxxxx 科研費登録者のID割り当て
xxxxxxxx は、科研費研究者番号 (8 桁)
200xxxxxxxxxx ReaD登録者のID割り当て(科研費登録者は除く)xxxxxxxxxx は、ReaD研究者コード (10桁)
3xxxxxxxxxxxx それ以外のID割り当て
http://www.nii.ac.jp/cscenter/
IDの特徴
• KAKEN ID (科研費研究者番号) – 科学研究費補助金における研究者番号
– 文部省(現・文部科学省)が1939年に開始した,多様な研究分野・研究組織・研究段階を対象とした,日本で最大唯一の研究費配分制度
– 約18万人が登録
• ReaD ID
– JST(科学技術振興機構)が運営する,研究者・研究機関ディレクトリの研究者ID
– 約22万人が登録
– 大学教員,研究スタッフのほか,大学院生含む 27
http://www.nii.ac.jp/cscenter/
機関担当者による
データアップローディング
28
研究者リゾルバー
IR研究者典拠
(研究者ディレクトリ) 機関
NII
研究者リゾルバーIDと機関のローカル研究者IDとのマッピングテーブルを構築し、
研究者名を解決する
機関は何をすべきか?
1. 機関自身を表明する
2. 機関のローカル研究者IDを登録するために、
a) ローカル研究者IDとそれに紐づいた国内で広く使われている研究者IDを知らせる
A: KAKEN ID
B:ReaD ID
→ KAKEN ID または ReaD ID ベースの研究者リゾルバーIDが
登録される
a’) ローカル研究者IDを新規登録者として知らせる
→ 新しい研究者リゾルバーIDが割り当てられる
3. 機関のローカル研究者ID同士のマッピングのために、
a) ローカル研究者IDに紐づいた、別の外部スキーマによる研究者IDを知らせる
A: KAKEN ID
B: ReaD ID
C: ResearcherID
D: その他サービスのIDs….
4. 研究者のプロファイルをステートするために、
a) 研究者名、所属履歴、研究業績を知らせる
5. 研究者リゾルバーから研究者ディレクトリへ逆リンクをはるために、
a) それぞれのローカル研究者IDに割り当てられた研究者ディレクトリのURLを教える
日本人の名前とデータに適用し、IDマップを構築できるよう
ResearcherIDのフォーマットを拡張したXMLファイルをアップロードする
http://www.nii.ac.jp/cscenter/
機関担当者の視点
• IR – 機関固有のローカルな研究者IDが埋め込まれた書誌メタデータが様々なOAIサービスプロバイダーにハーベスト
• IR研究者典拠(研究者ディレクトリ) – 機関がローカルな研究者IDに紐づいた研究者プロファイルを研究者を指向したサービスプロバイダにアップロード
– 研究者リゾルバーの研究者プロファイルには以下の項目が含まれる
• ローカルな研究者ID
• 名前
• 外部サービスのID,たとえば – 科研費研究者番号
– ReaD研究者コード
– ResearcherID
– 研究者リゾルバーID
• 個々の研究者の研究者ディレクトリ URL
• 所属履歴
• 業績リスト
29
研究者リゾルバー
(ResearcherID)
IR研究者典拠
(研究者ディレクトリ)
(ReaD)
IR JAIRO
OAIster
NDLTD (Networked Digital Library of Theses and Dissertations)
http://www.nii.ac.jp/cscenter/
異なる研究者リソース間のリンキング
• 異なる研究者ID集合間のIDマッチング
30
研究者ID集合A 研究者ID集合B
http://www.nii.ac.jp/cscenter/
研究者Webリソースリンキング
• Web上の研究者ID集合 – 大学研究者ディレクトリ
– J-Global (ReaD)
– KAKEN
• 集合間のIDマッチング
31
研究者リゾルバー 大学研究者ディレクトリ A
J-Global KAKEN
大学研究者ディレクトリ B
http://www.nii.ac.jp/cscenter/
大学研究者ディレクトリへのリンク
• Web上の大学研究者ディレクトリへのクローリング
–研究者ページのURLを特定
–それぞれのURLに対して研究者名を特定
• 研究者リゾルバーIDと大学研究者ディレクトリのローカルIDを同定する方法を適用
• 研究者リゾルバーの研究者ページから大学研究者ディレクトリの研究者ページURLへリンク
32
http://www.nii.ac.jp/cscenter/
研究者同定のひとつの方法
• KAKENと研究者ディレクトリのそれぞれのID
に対して以下のとき、同一人物と判定する
–漢字氏名の一致
–所属の一致
–所属内でユニーク名(同姓同名がいない)
• IDが以下のとき、同一人物である
– KAKEN IDが同一
– ReaD IDが同一
33
http://www.nii.ac.jp/cscenter/
システム間連携の概略
2010年度
34
Web of
Knowledge
(Thomson
Reuters)
ResearcherID
(Thomson Reuters)
研究者リゾルバー
(NII)
Researchmap
(NII)
機関研究者ディレクトリ
および
機関リポジトリ
J-Global
(Including ReaD)
(JST)
KAKEN
(NII)
CiNii
(NII)
機関リポジトリ
JAIRO
日本の機関リポジトリ
横断検索サービス
(NII)
機関研究者ディレクトリ
CLS
ALS
機関の永続固定IDごとの
研究者プロファイルと
業績リスト
KAKEN IDとReaD IDの
マッピングテーブル KAKEN ID、
研究者姓名、所属、
分野、キーワード
機関の永続固定IDと研究者リゾルバーIDを
変換するための質問と応答
論文著者フィールドに
機関の永続固定IDを組み込む
機関の永続固定IDごとの
研究者プロファイルと
業績リスト
研究者サービス
論文サービス
研究者と論文のサービス
データ連携
リンク
http://www.nii.ac.jp/cscenter/
研究者リゾルバー β1.0
現在の実装 • 研究者ごとのページ
– 現在はKAKENに登録された研究者に対しページを提供
– 約18万研究者
– 同姓同名解決された研究者
• Web上の研究者リソースとのリンク – 直接リンク
• KAKEN
• 機関の研究者DB(現在33大学を対象) • J-Global (JST 旧ReaD)
– 検索問い合わせリンク • Google, Google Scholar, CiNii, Webcat Plus, ReaDへの日本語・英語の氏名,所属による問い合わせ
• 機関担当者による研究者プロファイルと業績リストのアップロード
• SemanticWebのための質問応答 – OpenSearch
– RDF/XML
• 研究者IDリダイレクトWebサービス
• http://rns.nii.ac.jp/ 35
Webクローリングと
KAKEN IDマッチング
http://www.nii.ac.jp/cscenter/
研究者リゾルバー β1.0
研究者ページ(概略)
36
研究者姓名 (漢字,カタカナ,ローマ字)
研究者基本情報
直接リンク
検索質問フォーマットURLリンク
科研費研究課題のキーワード
科研費研究課題の研究分野
このページのURI
http://www.nii.ac.jp/cscenter/
研究者リゾルバー β1.0
研究者ページ(上側)
37
研究者姓名 (漢字,カタカナ,ローマ字)
研究者リゾルバーID
科研費研究者番号
所属
研究者
基本情報
http://www.nii.ac.jp/cscenter/
研究者リゾルバー β1.0
研究者ページ(上側)
38
直接リンク
•KAKEN(NII)
•大学研究者ディレクトリ
•J-Global(ReaD)
http://www.nii.ac.jp/cscenter/
研究者リゾルバー β1.0
研究者ページ(上側)
39
検索質問フォーマットURLリンク
(漢字姓名と所属)
http://www.nii.ac.jp/cscenter/
研究者リゾルバー β1.0
研究者ページ(上側)
40
検索質問フォーマットURLリンク
(漢字姓名)
•CiNii
•Webcat Plus
•ReaD
•Google Scholar
http://www.nii.ac.jp/cscenter/
研究者リゾルバー β1.0
研究者ページ(上側)
41
検索質問フォーマットURLリンク
(英語姓名)
•CiNii
•Webcat Plus
•ReaD
•Google Scholar
http://www.nii.ac.jp/cscenter/
研究者リゾルバー β1.0
研究者ページ(下側)
42
科研費研究課題の
キーワード
科研費研究課題の
研究分野
このページの
URI
http://www.nii.ac.jp/cscenter/
Webの波
• Web技術のパラダイムシフト
– Web of Documentsから
– Web of Dataへ
• Linking Open Dataの潮流
– RDFによって事実を記述して、データとして公開
– RDFでは、事実は2つのリソース(URI)と語彙で記述される
• 抽象的な概念を含めてすべてのモノをURIで表現
• モノの関係を表す語彙を定義して、2つのURIの関係を語彙でつないで表す
43
Linked Data Web of Open Repositories in 2010 - 2015
Open Repositories by Institutions
Open Repositories in the Cloud
URI based Identification of All Resources Fact Descriptions in RDF (Resource Description Framework)
2010-07-28, Kei Kurakawa, NII
Scholarly Communications Vocabulary Open Repositories by Institutions Open Repositories
by Institutions
rdfs:Resource
dcterms:Agent
dcterms:creator
http://www.nii.ac.jp/cscenter/
Linked Data Webのための
検索質問応答API • OpenSearch1.1
• RDF/XML
45
http://www.nii.ac.jp/cscenter/
研究者IDリダイレクトWebサービス
• 研究者IDとターゲットサービスをURLで指定して,研究者ページへリダイレクトするWebサービス
46
http://rns.nii.ac.jp/services/redire
ct?source=resolver&id=1000010
295694&target=kaken
機関の研究者ディレクトリ
sourceに指定できるID 研究者リゾルバーID
KAKEN(NII)
ReaD(JST)
ResearcherID(Thomson Reuters)
アップロードした機関のローカル研究者ID
研究者ID解決して
目的のサービスへ
リダイレクト
http://www.nii.ac.jp/cscenter/
サービス連携の例
• 京都大学リポジトリ(KURENAI) – dc.contributor.author
• 静岡大学リポジトリ(SURE) – dc.contributor.author
– dc.contributor.alternative
– dc.contributor.transcription
47
http://www.nii.ac.jp/cscenter/
国際連携・協力
48
• 研究者・著者名システム間連携
http://www.nii.ac.jp/cscenter/
まとめ
• 研究者の学術研究の貢献度を正確に測るためには,名前の曖昧性の問題を解決して,研究成果に記述された著者の名寄せを行う必要がある.
• 日本人姓名に関しては,図書館典拠ファイルを調査したところ,同姓同名が50万人規模で10パーセント以上存在する.
• 著者に識別子を付与して名寄せを行う活動は,世界で行われている
• 研究者リゾルバーは,日本の研究者の識別子を与える
49