日本語アプレイザル評価表現辞書(JAppraisal辞 …...2 日本語アプレイザル評価表現辞書(JAppraisal 辞書)は,評価表現に対して評価極性情報(肯定・
ミニプロジェクト 「辞書」
description
Transcript of ミニプロジェクト 「辞書」
ミニプロジェクト「辞書」
simitaka@SING
親: mitsuya
目的
• 複数の辞書を利用• 状況ごとに辞書を選択• ユーザの学習支援
設計
設計概要
CD-ROM
辞書クライアント
WEB 辞書 NDTP サーバ
DOG
×
設計概要
CD-ROM
辞書クライアント
WEB 辞書 NDTP サーバ
DOG
○
設計概要
CD-ROM
辞書クライアント
WEB 辞書 NDTP サーバ
犬キャッシュ
辞書選択ポリシ
• 優先順位をユーザが設定• 状況によって対応
検索結果のキャッシュ
• 調べた単語の意味、回数をクライアントで保持– オフラインで実行可能– パフォーマンス向上
• 学習支援への利用– 検索回数の表示– 覚えたページを破いて食べる
• 辞書データは変わらない
実装
対応した辞書
• CD-ROM 搭載サーバ– エコーサーバの応用
• ALC の Web 辞書– http://www.alc.co.jp/– CGI
CD-ROM データ利用
CD-ROM
• EPWING 形式• EB Library を利用
– CD-ROM 書籍にアクセスするための関数
必要なデータ取得まで① CD-ROM との bind
EB_Book 型のオブジェクト
eb_bind()
必要なデータ取得まで②副本の選択
EB_Book 型のオブジェクト
副本0: [国語辞典]
副本1: [英和辞典] 副本の選択
必要なデータ取得まで③検索
EB_Book 型のオブジェクト
副本0: [国語辞典]
副本1: [英和辞典]
D GO
必要なデータ取得まで④テキストデータの取得
EB_Book 型のオブジェクト
副本0: [国語辞典]
副本1: [英和辞典] 犬
ALC の WEB 辞書の利用
結果の抽出方法
<html> <head> <title>SPACE ALC</title> </head> <body> 辞書です。 <br> 以上 </body></html>
•二つのスタックを使う
•タグ
•要素
結果の抽出方法
<html> <head> <title>SPACE ALC</title> </head> <body> 辞書です。 <br> 以上 </body></html>
•二つのスタックを使う
•タグ
•要素
スタック
html
タグのスタック 要素のスタック
head
title
/title
SPACE ALC
スタック
html
タグのスタック 要素のスタック
head
/head
スタック
html
タグのスタック 要素のスタック
body 辞書です。
br
スタック
html
タグのスタック 要素のスタック
body
/body
以上
スタック
html
タグのスタック 要素のスタック
/html
スタック
タグのスタック 要素のスタック
文字コード変換
• Shift-JIS から EUC へ• popen() 関数を使い nkf で変換して表示
キャッシュ機能
• 検索ワードをキャッシュ– ファイル名 : .jisyo
• 今まで何回調べたか表示• 5 回同じ単語で「ばーか」
デモ
評価
• 複数辞書の利用 ○• 状況に応じた辞書選択 ○• 学習機能 △• SING 新人は毎日使っている ◎
今後の予定
• キャッシュ機能の拡張性• 他の辞書プロトコルの追加• 学習要素
– クイズ
リリース
http://www.sfc.wide.ad.jp/~simitaka/minipro/2001f/