物流情報系システムに求められる分析シナリオとは · 物流情報系システムに求められる分析シナリオとは (77)77 本稿の内容は,筆者が約2年に渡る物流情報のヒアリングならびに物流情報系システム構築
ブースティングとキーワードフィルタリング によるシステム要求検出
description
Transcript of ブースティングとキーワードフィルタリング によるシステム要求検出
![Page 1: ブースティングとキーワードフィルタリング によるシステム要求検出](https://reader035.fdocuments.net/reader035/viewer/2022070400/568134c2550346895d9be6b5/html5/thumbnails/1.jpg)
ブースティングとキーワードフィルタリングによるシステム要求検出
神戸大学大学院 自然科学研究科佐古淳,滝口哲也,有木康雄
![Page 2: ブースティングとキーワードフィルタリング によるシステム要求検出](https://reader035.fdocuments.net/reader035/viewer/2022070400/568134c2550346895d9be6b5/html5/thumbnails/2.jpg)
背景・目的
音声による機器の操作– ロボット・カーナビなど
雑談に反応してシステムが誤動作– スイッチを用いた音声入力制御– 使いにくい・音声を使うメリットが減少
スイッチレスで自動的にシステム要求と雑談を判別
![Page 3: ブースティングとキーワードフィルタリング によるシステム要求検出](https://reader035.fdocuments.net/reader035/viewer/2022070400/568134c2550346895d9be6b5/html5/thumbnails/3.jpg)
目的
システム要求と雑談の判別
「どうやって 動かすの?」
「こっちに来て」って言うと動くよ
…………
「こっちに、 えーと、来て」
了解
![Page 4: ブースティングとキーワードフィルタリング によるシステム要求検出](https://reader035.fdocuments.net/reader035/viewer/2022070400/568134c2550346895d9be6b5/html5/thumbnails/4.jpg)
従来手法
キーワード・スポッティング
ガベージ・モデル
ネットワーク文法
問題点– 柔軟な表現の受理が困難– ネットワークの構築コスト– ガベージ・モデルの構築方法
単語ベース 自動的に学習
![Page 5: ブースティングとキーワードフィルタリング によるシステム要求検出](https://reader035.fdocuments.net/reader035/viewer/2022070400/568134c2550346895d9be6b5/html5/thumbnails/5.jpg)
単語ベースでの要求検出
単語ベースで受理(検出)– 「えー こっちに 来て ちょうだい」– 「こっちに えーと 来て」
問題点– 「こっちに 来て って言うと」– わき出しに弱い
![Page 6: ブースティングとキーワードフィルタリング によるシステム要求検出](https://reader035.fdocuments.net/reader035/viewer/2022070400/568134c2550346895d9be6b5/html5/thumbnails/6.jpg)
提案手法
単語ベースで受理+拒否– えー こっちに 来て ちょうだい– こっちに えーと 来て– こっちに 来て って言うと
システム要求
雑談
単語による要求・雑談への重み付き投票で判別単語による要求・雑談への重み付き投票で判別
ブースティングにより学習ブースティングにより学習
– どの単語を用いるか - 投票の重みは?
投票
![Page 7: ブースティングとキーワードフィルタリング によるシステム要求検出](https://reader035.fdocuments.net/reader035/viewer/2022070400/568134c2550346895d9be6b5/html5/thumbnails/7.jpg)
ブースティング
ブースティングによるテキスト分類– Decision Stumps [Schapire,98]
単語ベースの単純・高速な手法
システム要求
雑談
単語Aがある
単語Aがない
true
false
注目する単語と投票重みをコーパスから学習
![Page 8: ブースティングとキーワードフィルタリング によるシステム要求検出](https://reader035.fdocuments.net/reader035/viewer/2022070400/568134c2550346895d9be6b5/html5/thumbnails/8.jpg)
コーパス 収録環境
– 2人とロボットが存在– 人同士で会話しながら任意にシステム要求– マイクは発話者2人の胸元に設置– コマンドは8種– 異なり単語数:約 700 語
規模– 1時間程度(実質発話時間は 20 分程度)– 切り出し後にラベル付与– 330 発話(うち 49 発話がシステム要求)
![Page 9: ブースティングとキーワードフィルタリング によるシステム要求検出](https://reader035.fdocuments.net/reader035/viewer/2022070400/568134c2550346895d9be6b5/html5/thumbnails/9.jpg)
コーパス
具体例ラベル 発話内容-1 こっち 、 こっち で よかっ た っけ-1 こっち に 来 て 、 とか 言う と+1 こっち に 来 て ください-1 ふふふ 来 た+1 こっち おいでー-1 あと 写真 を 撮っ て が ある なあ+1 写真 を 撮っ て
+1 :システム要求-1 :雑談
![Page 10: ブースティングとキーワードフィルタリング によるシステム要求検出](https://reader035.fdocuments.net/reader035/viewer/2022070400/568134c2550346895d9be6b5/html5/thumbnails/10.jpg)
実験
音声認識結果に対する要求検出音声認識結果に対する要求検出
![Page 11: ブースティングとキーワードフィルタリング によるシステム要求検出](https://reader035.fdocuments.net/reader035/viewer/2022070400/568134c2550346895d9be6b5/html5/thumbnails/11.jpg)
音声認識結果の判別
音響分析条件・ HMM サンプリング周波数
特徴パラメータフレーム長フレーム周期窓タイプ
16KHzMFCC(25 次元 )20ms10msハミング窓
タイプ混合数
244 音節32 混合
母音 (V)子音+母音 (CV)
5 状態 3 ループ7 状態 5 ループ
音響分析条
件
HMM
![Page 12: ブースティングとキーワードフィルタリング によるシステム要求検出](https://reader035.fdocuments.net/reader035/viewer/2022070400/568134c2550346895d9be6b5/html5/thumbnails/12.jpg)
音声認識結果の判別
実験条件– 音響モデル : CSJ ベースに MLLR+MAP 適応– 言語モデル : 書き起こしから学習
未知語なし(語彙数 700 語) 話者 A の認識に、話者 B のモデルを利用
– 認識結果 単語正解精度: 42.1% キーワード F 値: 0.76
![Page 13: ブースティングとキーワードフィルタリング によるシステム要求検出](https://reader035.fdocuments.net/reader035/viewer/2022070400/568134c2550346895d9be6b5/html5/thumbnails/13.jpg)
音声認識結果の判別
AdaBoost により選択された素性語例素性語例(キーワード)
システム要 求
ください 写真 来て 向こう おいで 場所 止まっ
雑 談 で たら ん って が ない とか の あー よ ちょっと
素性語数:約 40語 / 700語
![Page 14: ブースティングとキーワードフィルタリング によるシステム要求検出](https://reader035.fdocuments.net/reader035/viewer/2022070400/568134c2550346895d9be6b5/html5/thumbnails/14.jpg)
音声認識結果の判別
実験結果– Leave-one-out 法により実験– 結果は F 値が最大のケース
適合率 再現率 F 値unigra
m0.92 0.92 0.92
bi-gram 0.94 0.92 0.93
高精度に判別可能
![Page 15: ブースティングとキーワードフィルタリング によるシステム要求検出](https://reader035.fdocuments.net/reader035/viewer/2022070400/568134c2550346895d9be6b5/html5/thumbnails/15.jpg)
従来手法
キーワード・スポッティング
ガベージ・モデル
ネットワーク文法
問題点– 柔軟な表現の受理が困難– ネットワーク文法の構築コスト– ガベージ・モデルの構築方法
問題点– 柔軟な表現の受理が困難– ネットワーク文法の構築コスト– ガベージ・モデルの構築方法
![Page 16: ブースティングとキーワードフィルタリング によるシステム要求検出](https://reader035.fdocuments.net/reader035/viewer/2022070400/568134c2550346895d9be6b5/html5/thumbnails/16.jpg)
キーワード・フィルタリング
ブースティングによる学習の結果……
システム要求素性 雑談素性
語彙全体
– 未知語発話時…… ガベージ単語と認識 :判別に影響無し 雑談素性と認識 :問題低 システム要求素性と認識:問題あり
約 20 語 約 20 語ガベージ・モデル
約 660 語
![Page 17: ブースティングとキーワードフィルタリング によるシステム要求検出](https://reader035.fdocuments.net/reader035/viewer/2022070400/568134c2550346895d9be6b5/html5/thumbnails/17.jpg)
未知語を含む要求検出
– 辞書から単語を削除(キーワード以外)要求検出F値
00.10.20.30.40.50.60.70.80.9
1
10% 20% 30% 40% 50%
F値
辞書未知語率
未知語がある場合でも頑健に動作
![Page 18: ブースティングとキーワードフィルタリング によるシステム要求検出](https://reader035.fdocuments.net/reader035/viewer/2022070400/568134c2550346895d9be6b5/html5/thumbnails/18.jpg)
まとめ
システム要求と雑談の判別 音声認識結果(言語情報)を利用
– 単語認識精度: 42.1% において– 適合率: 0.94 再現率: 0.92 F 値: 0.93– 未知語に対しても頑健に動作
今後の課題– タスクの規模・難易度の向上– 言語のみで判別不能なケースへの対応