なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

49
http://www.nii.ac.jp/cscenter/ なぜ研究者の名寄せが必要か ~世界の動向と研究者リゾルバー~ CSI委託事業ワークショップ「名寄せのこれから~研究者IDサミット~」 2011217日,学術総合センター,主催:金沢大学 蔵川 国立情報学研究所 学術コンテンツサービス研究開発センター

description

CSI委託事業ワークショップ「名寄せのこれから~研究者IDサミット~」 2011年2月17日,学術総合センター,主催:金沢大学

Transcript of なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

Page 1: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

なぜ研究者の名寄せが必要か ~世界の動向と研究者リゾルバー~

CSI委託事業ワークショップ「名寄せのこれから~研究者IDサミット~」

2011年2月17日,学術総合センター,主催:金沢大学

蔵川 圭

国立情報学研究所

学術コンテンツサービス研究開発センター

Page 2: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

学術研究における貢献

• 学術研究成果の多くは論文として出版され公表される

• すでに存在する論文を引用しながらそれが表す知識の体系を位置づける

• 誰が貢献したか、どのような組織が貢献したかがわかるように内容とともに著者名や所属組織名が明記される。助成機関に対して謝辞を加えることも多い

• ある研究者がどのくらい知識の体系化に貢献したかを測ってみたいとき、研究者の論文を並べてみればよい

2

Page 3: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

名前の曖昧性の問題

(Name Ambiguity Problem)

• 同姓同名

• 旧姓

• ペンネーム

• 漢字異体字

• ジャーナルごとに異なる姓名表記フォーマット

–姓名の順

– イニシャル表記

–大文字・小文字

3

Page 4: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

名前の翻字(transliterate)

• ラテン文字への翻字によって、同姓同名が増える

4

“Which Wei Wang?”,Phys. Rev. Lett. 99, 230001 (2007)

DOI:10.1103/PhysRevLett.99.230001

王伟,王薇,王维,王蔚,汪卫,汪玮,汪威,汪巍

Wei Wang

Page 5: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

名寄せ(Name Disambiguation)

• 名前の問題を解決して、同一性を判定することを「名寄せ」という

• 研究者の名寄せによって、

– 研究者ごとに正確に論文やその他研究成果をリスト化でき、リストは知識体系への貢献度を正確に測る情報源となる

– 研究者が正確に過去の業績によってプロファイルされることで、そのプロファイルは新たな研究チームを構成する際の正確な情報源として活用できる

– 学術コミュニケーションにおける様々な場面において、研究者を特定した情報交換が可能となる

5

Page 6: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

日本の図書館目録

• NACSIS-CAT – 国立情報学研究所の運営

– 日本の大学図書館の所蔵する図書・雑誌の総合目録

– 洋書が多く含まれる

– USMARC準拠

– 日本目録規則,およびAACR2

• JAPAN/MARC – 国立国会図書館の運営

– 国会図書館の所蔵する,日本で刊行された出版物および外国で刊行された日本語出版物の目録

– UNIMARC準拠

– 日本目録規則

• TRC/MARC – 図書館流通センターの運営

– 日本で刊行される出版物の目録

– UNIMARC準拠

– 日本目録規則 6

書誌 典拠

著者名 (統一)書名

参照する

目録

参照する

Page 7: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

図書館目録の著者名典拠

• NACSIS-CAT著者名典拠ファイル – 個人名,団体名の典拠

– 個人名1,263,685件(西洋人著者名含む, 2008年12月18日)

• JAPAN/MARC典拠ファイル – 個人名,家名,団体名,および統一書名の典拠

– 個人名681,924件(西洋人著者名含む, 2008年7月5日)

• TRC/MARC著者名典拠ファイル – 個人名,機関名の典拠

– 個人名566,249件(西洋人著者名含む, 2009年3月29日)

7

人名データベース 登録件数 (漢字圏の東洋人の統一形標目

を抜粋)

同一姓名が複数存在する登録件数

同一姓名が複数存在する異なり姓

名数

同一姓名に対する最大登録件数

同一姓名が複数存在する登録件数の割合

NACSIS-CAT 著者名典拠ファイル

(2008年12月18日) 329,864 32,034 13,344 20 9.71%

JAPAN/MARC 典拠ファイル

(2008年7月5日) 572,638 73,138 28,067 29 12.77%

TRC/MARC 著者名典拠ファイル

(2009年3月29日) 464,962 58,979 22,969 27 12.68%

Page 8: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

著者名典拠における

異なり姓名ごとの登録件数の分布

8

0

5

10

15

20

25

30

150

110

01

15

01

20

01

25

01

30

01

35

01

40

01

45

01

50

01

55

01

60

01

65

01

70

01

75

01

80

01

85

01

90

01

95

01

10

001

10

501

11

001

11

501

12

001

12

50

113

001

NACSIS-CAT

527,567

13,344 20

0

5

10

15

20

25

30

150

110

01

15

01

20

01

25

01

30

01

35

01

40

01

45

01

50

01

55

01

60

01

65

01

70

01

75

01

80

01

85

01

90

01

95

01

10

001

10

501

11

001

11

501

12

001

12

501

13

001

13

501

14

001

14

501

15

001

15

501

16

001

16

501

17

001

17

501

18

001

18

501

19

001

19

501

20

001

20

501

21

001

21

501

22

001

22

501

23

001

23

501

24

001

24

501

25

001

25

501

26

001

26

501

27

001

27

501

28

001

0

5

10

15

20

25

30

150

110

01

15

01

20

01

25

01

30

01

35

01

40

01

45

01

50

01

55

01

60

01

65

01

70

01

75

01

80

01

85

01

90

01

95

01

10

001

10

501

11

001

11

501

12

001

12

501

13

001

13

501

14

001

14

501

15

001

15

501

16

001

16

501

17

001

17

501

18

001

18

501

19

001

19

501

20

001

20

501

21

001

21

501

22

001

22

501

JAPAN/MARC

TRC/MARC

29

27

28,067

22,969 428,952

311,174

異なり姓名順位

異なり姓名順位

異なり姓名順位

登録件数

登録件数

登録件数

Page 9: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

著者名典拠における

異なり姓名順位トップ20 NACSIS--CAT JAPAN/MARC TRC/MARC

順位 姓名 登録件数 姓名 登録件数 姓名 登録件数

1 高橋徹 20 鈴木博 29 鈴木博 27

2 鈴木博 17 田中実 29 田中実 26

3 佐藤進 17 伊藤博 28 小林茂 24

4 田中実 16 小林茂 26 高橋徹 23

5 伊藤博 16 鈴木一郎 24 鈴木実 22

6 高橋進 13 高橋一郎 22 佐藤進 21

7 高橋清 13 佐藤正 22 渡辺誠 19

8 鈴木一郎 13 高橋徹 21 佐藤正 19

9 小林茂 13 鈴木実 21 伊藤博 19

10 吉田豊 13 田中豊 21 田中稔 18

11 高橋誠 12 (李〓) 21 小林一郎 18

12 田中宏 12 鈴木茂 20 鈴木隆 17

13 渡辺誠 12 吉田稔 20 鈴木茂 17

14 渡辺茂 12 田中宏 19 田中宏 17

15 小林哲夫 12 佐藤進 19 吉田豊 17

16 田中明 11 高橋和子 18 佐藤博 17

17 佐藤正 11 渡辺誠 18 高橋進 16

18 中村宏 11 渡辺宏 18 田中豊 16

19 高橋豊 10 高橋清 17 田中茂 16

20 高橋正明 10 (陳〓) 17 田中一郎 16

9

Page 10: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

母集団の大きさに依存する

同姓同名の割合 • 文献によると

–田中康仁,同姓同名の発生頻度,計算言語学10-1,1977

–昭和51年当時の日本人の漢字姓名107万人の名簿を用いて機械的に数え上げ

10

0

10

20

30

40

0 50 100 150

同姓同名がいる人の割合(%)

万人

%

母集団

Page 11: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

研究者の名寄せの方法

• 図書館の目録のように、閉じたデータベースの中では人手で著者に英数字記号の識別子(Identity: ID)を付けて区別した

• 学術論文のデータベースでは、2つの方法がとられてきた – 計算機による名寄せ

– 手動で登録

• 新たな名寄せの潮流 – ORCID (Open Researcher and Contributor ID)

– 学術コミュニケーションに関与するすべてのステークホルダーを包含した、研究者にIDを付与するコミュニティを形成する

11

Page 12: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

学術論文データベースにおける

これまでの2つのアプローチ • 計算機による名寄せ

– 論文書誌を対象に著者でまとめる

– 論文情報システムの著者名検索結果として機能

– プロダクションシステムとして必要な99%以上の精度を求めるには程遠い

– 例 • Scopus Author Identifier

(Elsevier社のScopusに実装)

• Distinct Author Identification System (Thomson Reuters社のWeb of Scienceに実装)

• 手動で登録 – 著者を対象に論文書誌を集める

– 研究者業績ショーケースとして機能

– 簡単に著者と論文書誌を網羅できない

– 例 • ResearcherID (Thomson Reuters社) 12

Page 13: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

研究者ID付与コミュニティORCID

• Open Researcher and Contributor ID – Open : 公開された

– Researcher : 研究者

– Contributor : 貢献者

– ID : 本人証明

• 設立趣旨(Mission Statement) – ORCIDは、学術コミュニケーションにおける著者/貢献者の名前の曖昧性の問題を解決することを目的とし、個々の研究者に対する固有の識別子の中央レジストリと、ORCIDと現存する他の著者IDスキームとの間のオープンで透過的なリンクメカニズムを構築することによって実現する。これらの識別子及び識別子間の関係は研究者のアウトプットにリンクすることが可能であり、科学的発見プロセスを拡大させ、研究コミュニティにおける研究助成や協働の効率性を改善する。

• http://www.orcid.org/ 13

Page 14: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

ORCIDの参加組織

• 2010年11月では144機関。

–学術機関47、出版者28、企業19、学会15、政府11、NPO17、その他7

–米国70、英国30、ドイツ8、オーストラリア6、日本

3、イタリア3、インド3、スペイン2、中国2、カナダ2、トルコ1、スイス1 、スウェーデン1 、韓国1 、シンガポール1 、セルビア1 、オランダ1 、イスラエル1 、ギリシャ1 、フランス1 、エジプト1 、コロンビア1 、ブラジル1 、ベルギー1 、オーストリア1

14

Page 15: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

ORCID IDシステム

• アイデンティティとして扱う基本的な情報

–著者/貢献者自身の記述

–著者/貢献者とその出版物間の関係の記述

• ハイブリッド型による登録

–著者/貢献者による登録

–組織による登録

15

ORCID ID

プロファイル

出版物申告

Page 16: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

ORCID IDシステムのシナリオ

16

コアシステム (ORCID identity system)

パートナー システム

エンド ユーザー

だれが文書Xを書いたか?

ID Yの人が書いた、

または査読した文書はどれか?

たとえば、原稿追跡システム(MTS : Manuscript Tracking

System)にシングルサインオン(SSO)して、編集事務局、マーケ

ティング部門、ロイヤルティ支払いシステムなどと連絡先情報を共有

Page 17: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

プロファイルの交換とマッチング

ORCID

F67572010

17

可能なマッチングアルゴリズム • VIAF(OCLC) • Author Resolver (ProQuest) • OKKAM

(By Howard Ratner, ORCID Update, Slides at CrossRef Annual Meeting, in London, 16 Nov. 2010)

Page 18: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

著作者にIDを付ける活動

• バーチャル国際典拠ファイル VIAF (Virtual International Authority File), – 米国OCLC

– LC

– ドイツDNB

– フランスBnF

• 国際標準名前識別子 ISNI (International Standard Name Identifier), ISO27729 – International Confederation of Societies of Authors and

Composers (CISAC) www.cisac.org

– International Federation of Reproduction Rights Organisations (IFRRO)www.ifrro.org

– International Performers’ Database Association (ipda.sami.se)

– Bowker (www.bowker.com )

– Online Computer Library Center (OCLC) (www.oclc.org)

– Bibliotheque Nationale de France

– The British Library 18

Page 19: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

VIAF

• 各国の名前典拠ファイルをリンク

• 今は個人名のみ

19

• 1050万件(2010-03)の名前レコード

• 抽出元

– 1300万件名前レコード

– 8000万件の引用レコード

Page 20: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

ISNI

20

ブリッジ識別子

・16ケタの数字

・クリエーター一般

・少なくとも2000万件のIDを想定

Page 21: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

機関リポジトリを対象とした

著者にIDを付ける活動

• DAI (Digital Author Identifier), オランダSURF財団

• Names Project, 英国 Mimas, JISC funded

• arXiv.org Author Identifiers, 米国コーネル大学

• Networking Names, 米国OCLC

• 研究者リゾルバー,NII

21

Page 22: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

JAIRO著者同定

22

研究者リゾルバー JAIRO

IR著者名典拠

(研究者ディレクトリ) IR

機関 (機関レベル)

NII (国レベル)

書誌メタデータ

[ローカル研究者IDが組み込まれている]

日本の機関リポジトリからJAIROがハーベストした

書誌メタデータに書かれた著者を同定するために

研究者リゾルバーIDと機関のローカル研究者IDとの

マッピングテーブル

双方のシステムで同一のローカル研究者

IDスキームが使われるべきである

メタデータをハーベストする間、

ローカル研究者IDを解決する

書誌レコード 著者名典拠

Page 23: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

IRにおける研究者典拠IDの付与

23

DSpace 1.6

Authority Control

Page 24: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

研究者リゾルバーの目的

• 日本の研究者を対象としたWeb上の名前典拠 – Web上にアーカイブされたリソースをターゲット

• 例1) 機関リポジトリ

• 例2) 論文アーカイブ

– さらに、日本の研究組織を対象とした名称典拠

• 2種類のエンティティ、すなわち論文と研究者をベースとした情報マネージメント

• 情報の質に応じた研究者情報マネージメント – 研究者情報の品質レベル

• 機関担当者による

• 研究者自身による

• 機械の自動処理による

• Web上のリソースのリンキングハブ – 研究者データベースへ直接リンク

• 大学研究者ディレクトリ, KAKEN, ReaD

– 学術関連データベースへ 検索問い合わせURLリンク

• Google (Scholar), CiNii, WebcatPlus, ReaD

• Linked Data Webのための、 日本の研究者と組織のURI表現

• 名前解決するWebサービス

• NIIの学術関連サービスへの 密接なデータ連携 24

研究者のカバー率

\論文

研究者

機関担当者によるとりまとめ

研究者自身によるとりまとめ

機械による自動処理

機関担当者による登録

研究者ディレクトリReaD

IR

KAKEN

機関にあるホームページ

研究者自身による登録

ResearcherID

Researchmap

機械による自動処理

CiNii 著者検索 Google

Google

scholar

研究者 リゾルバー

情報の品質レベル

Page 25: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

研究者リゾルバーのアプローチ

• 日本の研究者を対象としたURIベースのIDスキーム – 研究者リゾルバーID

– http://rns.nii.ac.jp/nr/xxxxxxxxxxxxx (xxxxxxxxxxxxxはID)

• KAKENから研究者を初期登録 (2010年3月19日現在、 177,558人) • 機関担当者による、IDに紐づいた研究者プロファイルのアップロード

– 研究者リゾルバーIDと、他のIDスキームによるIDリスト • 機関による完全に永続的なID (例、職員番号、同姓同名を区別する) • ・・・・・ • 科研費研究者番号

• ReaD研究者コード

• ResearcherID (Thomson Reuters)

• 研究者リゾルバーID

– 名前

– 所属履歴

– 業績リスト

• 大学研究者ディレクトリへの自動リンキング – 大学研究者ディレクトリをWebクローリング

– 自動研究者同定 25

Page 26: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

研究者同定スキーム

• 研究者が同じ人物であることを示すこと

• 研究者/著者を同定しマネージメントするひとつの方法

– 番号IDスキーム • 13ケタの番号によって研究者を表す

• 研究者リゾルバーIDと呼ぶ

26

研究者同定

ID (13ケタの番号) 説明

10000xxxxxxxx 科研費登録者のID割り当て

xxxxxxxx は、科研費研究者番号 (8 桁)

200xxxxxxxxxx ReaD登録者のID割り当て(科研費登録者は除く)xxxxxxxxxx は、ReaD研究者コード (10桁)

3xxxxxxxxxxxx それ以外のID割り当て

Page 27: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

IDの特徴

• KAKEN ID (科研費研究者番号) – 科学研究費補助金における研究者番号

– 文部省(現・文部科学省)が1939年に開始した,多様な研究分野・研究組織・研究段階を対象とした,日本で最大唯一の研究費配分制度

– 約18万人が登録

• ReaD ID

– JST(科学技術振興機構)が運営する,研究者・研究機関ディレクトリの研究者ID

– 約22万人が登録

– 大学教員,研究スタッフのほか,大学院生含む 27

Page 28: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

機関担当者による

データアップローディング

28

研究者リゾルバー

IR研究者典拠

(研究者ディレクトリ) 機関

NII

研究者リゾルバーIDと機関のローカル研究者IDとのマッピングテーブルを構築し、

研究者名を解決する

機関は何をすべきか?

1. 機関自身を表明する

2. 機関のローカル研究者IDを登録するために、

a) ローカル研究者IDとそれに紐づいた国内で広く使われている研究者IDを知らせる

A: KAKEN ID

B:ReaD ID

→ KAKEN ID または ReaD ID ベースの研究者リゾルバーIDが

登録される

a’) ローカル研究者IDを新規登録者として知らせる

→ 新しい研究者リゾルバーIDが割り当てられる

3. 機関のローカル研究者ID同士のマッピングのために、

a) ローカル研究者IDに紐づいた、別の外部スキーマによる研究者IDを知らせる

A: KAKEN ID

B: ReaD ID

C: ResearcherID

D: その他サービスのIDs….

4. 研究者のプロファイルをステートするために、

a) 研究者名、所属履歴、研究業績を知らせる

5. 研究者リゾルバーから研究者ディレクトリへ逆リンクをはるために、

a) それぞれのローカル研究者IDに割り当てられた研究者ディレクトリのURLを教える

日本人の名前とデータに適用し、IDマップを構築できるよう

ResearcherIDのフォーマットを拡張したXMLファイルをアップロードする

Page 29: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

機関担当者の視点

• IR – 機関固有のローカルな研究者IDが埋め込まれた書誌メタデータが様々なOAIサービスプロバイダーにハーベスト

• IR研究者典拠(研究者ディレクトリ) – 機関がローカルな研究者IDに紐づいた研究者プロファイルを研究者を指向したサービスプロバイダにアップロード

– 研究者リゾルバーの研究者プロファイルには以下の項目が含まれる

• ローカルな研究者ID

• 名前

• 外部サービスのID,たとえば – 科研費研究者番号

– ReaD研究者コード

– ResearcherID

– 研究者リゾルバーID

• 個々の研究者の研究者ディレクトリ URL

• 所属履歴

• 業績リスト

29

研究者リゾルバー

(ResearcherID)

IR研究者典拠

(研究者ディレクトリ)

(ReaD)

IR JAIRO

OAIster

NDLTD (Networked Digital Library of Theses and Dissertations)

Page 30: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

異なる研究者リソース間のリンキング

• 異なる研究者ID集合間のIDマッチング

30

研究者ID集合A 研究者ID集合B

Page 31: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

研究者Webリソースリンキング

• Web上の研究者ID集合 – 大学研究者ディレクトリ

– J-Global (ReaD)

– KAKEN

• 集合間のIDマッチング

31

研究者リゾルバー 大学研究者ディレクトリ A

J-Global KAKEN

大学研究者ディレクトリ B

Page 32: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

大学研究者ディレクトリへのリンク

• Web上の大学研究者ディレクトリへのクローリング

–研究者ページのURLを特定

–それぞれのURLに対して研究者名を特定

• 研究者リゾルバーIDと大学研究者ディレクトリのローカルIDを同定する方法を適用

• 研究者リゾルバーの研究者ページから大学研究者ディレクトリの研究者ページURLへリンク

32

Page 33: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

研究者同定のひとつの方法

• KAKENと研究者ディレクトリのそれぞれのID

に対して以下のとき、同一人物と判定する

–漢字氏名の一致

–所属の一致

–所属内でユニーク名(同姓同名がいない)

• IDが以下のとき、同一人物である

– KAKEN IDが同一

– ReaD IDが同一

33

Page 34: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

システム間連携の概略

2010年度

34

Web of

Knowledge

(Thomson

Reuters)

ResearcherID

(Thomson Reuters)

研究者リゾルバー

(NII)

Researchmap

(NII)

機関研究者ディレクトリ

および

機関リポジトリ

J-Global

(Including ReaD)

(JST)

KAKEN

(NII)

CiNii

(NII)

機関リポジトリ

JAIRO

日本の機関リポジトリ

横断検索サービス

(NII)

機関研究者ディレクトリ

CLS

ALS

機関の永続固定IDごとの

研究者プロファイルと

業績リスト

KAKEN IDとReaD IDの

マッピングテーブル KAKEN ID、

研究者姓名、所属、

分野、キーワード

機関の永続固定IDと研究者リゾルバーIDを

変換するための質問と応答

論文著者フィールドに

機関の永続固定IDを組み込む

機関の永続固定IDごとの

研究者プロファイルと

業績リスト

研究者サービス

論文サービス

研究者と論文のサービス

データ連携

リンク

Page 35: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

研究者リゾルバー β1.0

現在の実装 • 研究者ごとのページ

– 現在はKAKENに登録された研究者に対しページを提供

– 約18万研究者

– 同姓同名解決された研究者

• Web上の研究者リソースとのリンク – 直接リンク

• KAKEN

• 機関の研究者DB(現在33大学を対象) • J-Global (JST 旧ReaD)

– 検索問い合わせリンク • Google, Google Scholar, CiNii, Webcat Plus, ReaDへの日本語・英語の氏名,所属による問い合わせ

• 機関担当者による研究者プロファイルと業績リストのアップロード

• SemanticWebのための質問応答 – OpenSearch

– RDF/XML

• 研究者IDリダイレクトWebサービス

• http://rns.nii.ac.jp/ 35

Webクローリングと

KAKEN IDマッチング

Page 36: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

研究者リゾルバー β1.0

研究者ページ(概略)

36

研究者姓名 (漢字,カタカナ,ローマ字)

研究者基本情報

直接リンク

検索質問フォーマットURLリンク

科研費研究課題のキーワード

科研費研究課題の研究分野

このページのURI

Page 37: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

研究者リゾルバー β1.0

研究者ページ(上側)

37

研究者姓名 (漢字,カタカナ,ローマ字)

研究者リゾルバーID

科研費研究者番号

所属

研究者

基本情報

Page 38: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

研究者リゾルバー β1.0

研究者ページ(上側)

38

直接リンク

•KAKEN(NII)

•大学研究者ディレクトリ

•J-Global(ReaD)

Page 39: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

研究者リゾルバー β1.0

研究者ページ(上側)

39

検索質問フォーマットURLリンク

(漢字姓名と所属)

•Google

Page 40: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

研究者リゾルバー β1.0

研究者ページ(上側)

40

検索質問フォーマットURLリンク

(漢字姓名)

•CiNii

•Webcat Plus

•ReaD

•Google Scholar

•Google

Page 41: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

研究者リゾルバー β1.0

研究者ページ(上側)

41

検索質問フォーマットURLリンク

(英語姓名)

•CiNii

•Webcat Plus

•ReaD

•Google Scholar

•Google

Page 42: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

研究者リゾルバー β1.0

研究者ページ(下側)

42

科研費研究課題の

キーワード

科研費研究課題の

研究分野

このページの

URI

Page 43: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

Webの波

• Web技術のパラダイムシフト

– Web of Documentsから

– Web of Dataへ

• Linking Open Dataの潮流

– RDFによって事実を記述して、データとして公開

– RDFでは、事実は2つのリソース(URI)と語彙で記述される

• 抽象的な概念を含めてすべてのモノをURIで表現

• モノの関係を表す語彙を定義して、2つのURIの関係を語彙でつないで表す

43

Page 44: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

Linked Data Web of Open Repositories in 2010 - 2015

Open Repositories by Institutions

Open Repositories in the Cloud

URI based Identification of All Resources Fact Descriptions in RDF (Resource Description Framework)

2010-07-28, Kei Kurakawa, NII

Scholarly Communications Vocabulary Open Repositories by Institutions Open Repositories

by Institutions

rdfs:Resource

dcterms:Agent

dcterms:creator

Page 45: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

Linked Data Webのための

検索質問応答API • OpenSearch1.1

• RDF/XML

45

Page 46: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

研究者IDリダイレクトWebサービス

• 研究者IDとターゲットサービスをURLで指定して,研究者ページへリダイレクトするWebサービス

46

http://rns.nii.ac.jp/services/redire

ct?source=resolver&id=1000010

295694&target=kaken

機関の研究者ディレクトリ

sourceに指定できるID 研究者リゾルバーID

KAKEN(NII)

ReaD(JST)

ResearcherID(Thomson Reuters)

アップロードした機関のローカル研究者ID

研究者ID解決して

目的のサービスへ

リダイレクト

Page 47: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

サービス連携の例

• 京都大学リポジトリ(KURENAI) – dc.contributor.author

• 静岡大学リポジトリ(SURE) – dc.contributor.author

– dc.contributor.alternative

– dc.contributor.transcription

47

Page 48: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

国際連携・協力

48

• 研究者・著者名システム間連携

Page 49: なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

http://www.nii.ac.jp/cscenter/

まとめ

• 研究者の学術研究の貢献度を正確に測るためには,名前の曖昧性の問題を解決して,研究成果に記述された著者の名寄せを行う必要がある.

• 日本人姓名に関しては,図書館典拠ファイルを調査したところ,同姓同名が50万人規模で10パーセント以上存在する.

• 著者に識別子を付与して名寄せを行う活動は,世界で行われている

• 研究者リゾルバーは,日本の研究者の識別子を与える

49