118118 ライブラリーナビゲーター 図書館からのメッセージ 大阪いばらきキャンパス新図書館 キャンパスの知的創造活動の象徴≪知の杜≫としての図書館
大学学部図書館のための図書選定補助ツールの紹介と考察
Transcript of 大学学部図書館のための図書選定補助ツールの紹介と考察
はじめに ねらいとコンセプト 開発ツール紹介
ブラウジング 専門用語の解釈 蔵書評価 選書成果の学術利用 さらなるツール
選書補助システムの考察 おわりに
ねらいとコンセプト
図書館員は何を指標に図書を選べばよいのだろうか。図書の選定は、機械的に処理できるのだろうか…
ねらい 図書選定の理由の明確化
図書選定の質の向上 予算活用の説明
図書館業務システムの補完 図書館業務システムでは、あまり手がつ
けられていない → ツールを自作・手法を検討する意味がある
大学の総合(中央)図書館や研究所図書室での活用も
コンセプト 職員の補助のためのツール
図書の内容理解なしで理由のある選書はできない 現状の人工知能では、テキストから内容を理解できない
使えそうな手法を必要に応じて作成 図書館の現場で必要に即し作成 十分な要件が整理できたら、統合システム化も
開発ツールの紹介
東京大学柏図書館に在籍した3年間で、実務上に即して作成したツール類を一部紹介
ブラウジング図書の選定を人間が行うという観点で考えれば、人間が選定候補の図書を読みやすく一覧できるインターフェイスは必要である。
Be- ビブリオ
開発ツール1
入力 ISBN リスト順で図書を 1 タイトルづつブラウジング
図書リストからの書籍内容チェックに使えます!
Be- ビブリオ
Be- ビブリオが提示する情報
書籍タイトルについての
Web 上のキーワードを集計( 現在は休止)
書籍タイトルについての
Google ブログ検索結果
書誌情報(国会図書館
or楽天ブックス)
内容紹介(楽天ブックス)
書影(楽天ブックス)
Be- ビブリオの情報あ源
楽天の「内容紹介」と「書影」 → 楽天に直に問い合わせて問題ないことを確認
Yahoo! 検索結果(抜粋)からのキーワード抽出(有料化に伴い現在は休止)
Web 上の書評 → Google ブログ検索がよさそう
著作権と網羅性、経費を考えると、使える情報は限られる!
ランチャー
開発ツール2
図書館職員はOPACのハードユーザー!使いどころを選べば、重複購入調査など業務が楽できます。
東京大学 OPAC ランチャー(学内限定)
「次を表示」ボタンをクリックするとリストのキーワードを順にOPA C 検索
東京大学 OPAC 検索結果画面
ランチャーとその応用
Javascript のみで作成 URL で検索結果 HTML を表示する DB なら簡
単対応 CiNii Books ランチャーも公開中
専門用語の解釈サブジェクトライブラリアンにはなれなくとも、図書のタイトルや内容紹介を表面上だけでも解釈して図書選定できるのではないか。
Wikipedia タガー
開発ツール 3
Wikipedia タガー
テキストを入力(例は「近刊検索 β の [ マルチン
ゲール理論による統計解析 ] 内容紹介)
Wikipedia 注釈す
みテキスト
Wikipedia記事へのリンク
用途
文章を自動注釈してくれると初学者には便利かもしれない
図書館でも職員による図書の選定に使えないか(アプリそのままではなく、機能の組み込み)
ホームページ作成者向けに注釈結果を HTML で保存する機能付き
東京大学内専門用語利用状況サーチ
開発ツール4
学部・研究所の図書室における図書の選定に非常に有用と思います
図書タイトルや図書の内容紹介中の専門用語を入れます
図書館室の所属する学部・研究所を選択します
実行をすると、図書館室が所属する学部・研究所の Web サイトでどの程度(どのように)その専門用語が使えるかがわかります。
学習・研究に頻出する語なら「買い」だとおもいます。
東京大学内専門用語利用状況サーチ(学内限定)
蔵書評価図書の選定は、 PDCAサイクルに則り行われるべきものではないか。そのためには、現状の把握や選書結果の評価が重要なポイントとなろう。
難語レポーター
開発ツール5
画面の入力例は「近刊検索 β 」にあった「昭和前期の科学思想史」(勁草書房)の内容紹介
難語レポーター
レポート1 学術度判定(独自手法)
学術 (ac.jp ドメイン ) 限定の Web 検索と、限定なしの Web 検索の
ヒット件数の比率で学術度を判定
レポート2 レア語をチェック(独自手法)
IPADIC の [形態素生起コスト ] をもとにした独自の用語生起コストと、
Yahoo! 検索件数をもとにレポート
レポート3 テキスト中の使用文字種
テキスト中の常用漢字(学年別)、ひらがなの比率などをレポート
従来の「難読度」とは別の視点で考える
個々の用語の難易度に着目する→ 短いフレーズでも有効に働くはず
上位概念と下位概念
学術度
レア度
日本語 WordNet を見てみたが、下位(より専門化されたもの)が難易度として高いわけではない
国内学術サイト (ac.jp) 中でへだたって使われる用語に着目IPADIC( 日本語辞書 ) の単語コストをもとにした用語の出現しにくさ、+ Webヒット件数
この2つの手法を採用
学術度判定 学術度 = 国内学術サイトのヒット件数 ÷ 日本語 Web サイトのヒット件数
レア語と同様に用語生起コストの上位3件のみ判定
判定基準学術度 判定0.5 より上 学術度が非常に高い0.1~ 0.5 学術度が高い0.05~ 0.1 学術度あり0.01~0.05
学術度判定不可
0~ 0.01 学術度が低い
Lib オススメ
開発ツール6
New Tool !
lib オススメ
判定のためのしきい値をセット
判定対象図書のISBN( リスト)を入
力
CiNii Books のタイトル情報
大学図書館と公共図書館の所蔵館数とそれによる評価
ポイント
図書館が所蔵すること → 図書館のオススメと解釈する
性格の異なる2館種の結果を組み合わせる 大学図書館 (CiNii Books) 公共図書館 (NDL Search)
公共図書館所蔵
大学図書館所蔵
多
多
公共図書館オススメ
大学図書館オススメ
一般教養本
判定不可
少
少
R 言語を使った蔵書評価
実験
科学
入門心理学
物質
電気
産業
東京大学新領域 Web サイトと東京大学柏図書館蔵書(開架一般書)相関
学生リクエスト多のため
不足テーマ?
これ以外に学内図書館室間の位置づけ調査も実施
選書成果の学術利用図書館の蔵書構成は図書館が長年にわたり価値判断を繰り返して末の結果といえる。これは有益なコーパスとなりえないだろうか。
専門用語コレ・モカモ
開発ツール7
学術分野に応じた関連語提示
CiNii Booksにリンク
①フレーズ入力 ②
学術文分野(図書館)セレクト③
クリック
専門用語コレ・モカモ
専門用語コレ・モカモの3つのねらい
サービス• 研究・学習者向けの検索補助
研究• 関連語提示手法のひとつの提案
図書館業界• 図書館の蔵書構築をフォーカス
さらなるツール図書の選定において、考慮すべき要件は多い。
個別紹介しきれなかった選書ツール・手法 あいまい重複調査 東京大学内図書室の位置づけ 学位論文タイトルマイニング xISBN を使った最新版調査 洋図書の納品期間の推定 東京大学新領域教員の著書チェック NCID から和書価格を得る シリーズものの所蔵漏れをチェック 評価表現辞書タガー
選書補助システムの考察いままでの開発ツールをまとめ、図書の選定のための統合システムとして、どのようなものが考えられるかを考察する。
ポイント1 ブラウジングを中心に置く
書籍に関連情報をまとめて提示 用語の注釈機能も取り込む 雑多な形式のリストを取り込み可に
ポイント2 ターゲットとする研究・学習データの活用
学部 Web サイト シラバス 学位論文タイトル など
ポイント3 蔵書評価を業務サイクルに
ターゲットに合っているか 入門書と専門書のバランスは適当か 学術性は十分か など
ブラウジングネット情報書籍 DB など
ターゲットとする研究・学習内容の情報
評価済み受入候補一覧
発注・受入
選定結果の評価
選書補助システム案
専門用語の解釈
学術度 専門・教養のバランス
研究・学修内容との整合
グループによるチェック
予算・重複受入チェック
数段階の評価コメント
書籍リスト
おわりに
ツール開発で関わったコミュニティ
図書系職員のためのアプリケーション開発講習会
東京大学柏図書館 言選 Web マイニング探検会
Special Thanks
紹介ツールの利用及びさらなる情報
「図書系職員のためのアプリケーション開発講習会」成果一覧
紹介のツールのうち一般公開のものは、以下のサイトからお試しいただけます。
https://mbc.dl.itc.u-tokyo.ac.jp/products.html
ご清聴ありがとうございました