音声分野におけるMATLABの利用と先端研究紹介 - MathWorks ·...

埼玉大学大学院

理工学研究科教授

島村徹也

音声分野におけるMATLABの利用と先端研究紹介

Outline 自己紹介

MATLABと音声処理

音声強調

骨伝導

最後に

1986年慶應義塾大学理工学部電気工学科卒

高橋･浜田研究室（回路と信号処理）

1988年同大学院修士課程修了

1991年同博士課程修了工学博士

同年埼玉大学工学部助手

現在同大学院理工学研究科教授

MATLABについて 1990年頃

IEEE ICASSP 1990でMATLABデモ

日本ではほとんど出回っていなかった

MATLABについて（続き）制御分野でより早く

Control System Toolbox

System Identification Toolbox

これまではいったい何だったんだ？

MATLABについて（続き）埼玉大学で(1991年)

日本では大阪大学が早かった

日本語解説書はなかった

MATLABの利用拡大

制御信号処理・通信音声

・音声分野は出遅れた・ユーザは増大している・未だに専用ツールを用いる場合も多い

MATLABによる音声処理サイト「MATLABによる音声信号処理入門」Web資料

早稲田大学宮澤幸希http://www.ite.or.jp/data/journal/passed_issues/tool1202/

MATLAB音声信号処理

http://lis2.huie.hokudai.ac.jp/~toyo/MATLAB/

最近の動向

スペクトル引き算法の改善

スペクトル引き算法 Musical Noise

たいへん聞きざわり

いかにこれを抑圧するか？

非定常雑音環境対策の必要性

いかに雑音を追跡するか？

||)(| fWfY のとき

||)(||)(~

| fWfYfX

スペクトル引き算法の一般化表現

トレードオフ

小ＳＮ比改善小、明瞭度向上(Musical Noise小）

大ＳＮ比改善大、明瞭度低下（Musical Noise大）大

Musical Noise低減小、スペクトル引きすぎなし小

Musical Noise低減大、スペクトル引きすぎ大

適当なスペクトル引き算の後の事後処理が有効

スペクトログラム上で音声部分とMusical Noise部分を見分ける

音声スペクトルを保持し、Musical Noise部分を抑圧する

Goh(1998)

スペクトル引き算を反復的に処理する

緒方(2005)

反復スペクトル引き算

スペクトル引き算

反復

)()()( nwnxny )(ˆ nx

Noise Estimation Method

Noise Estimation Using Low Frequency Regions

＊Human speech information mostly exists between 50Hz and 3.5KHz

＊At 0Hz～50Hz, noisy speech spectra have only noise information

Track the variance of noise spectra by using the low frequency regions

)()( fYfW Low

Yamashita(2005)

Long-term Spectrum (Male Speech)

Use this region

Proposed Method

otherwisebfWfYa

fYfWfY

:)(,)(~

事前雑音推定

Behavior of the Proposed Method

Parameters for Experiments

Speaker : Japanese male and female

Speech Length : about 10 seconds

Sampling Rate : 10KHz (except for Yamauchi’s

Method)

Band Limitation : 3.4KHz(except for Yamauchi’s

Method)

Noise : 3 kinds of noise

*For Yamauchi’s Method : 30KHz sampling

No band limitation

Noise Characteristics

-Varying

White Noise

Train Noise

at Railroad

Crossing

Babble

Improved Segmental SNR

いくつかのデモ

各種マイクの性質

咽喉マイク使用例

骨導マイク

咽喉マイク

イヤマイク

接話マイク

周波数特性

平坦

ＬＰＦ的

トランスデューサ

ＬＰＦ的

骨伝導とは？

気導音

骨導音

（空気伝導による音）

（骨伝導による音）

発声経路

耳を塞いで発声しても、音が聞こえる

骨導音声空気を介さず声帯の振動が骨を伝わり、その振動が直接聴覚器官に伝達される

高騒音環境における通信に利用可能

骨導音声は気導音声に比べ、自然性、了解性に欠ける

音声導出のブロック図

骨導音声復元音声フィルタ

Normal Speech and Bone-Conducted Speech

Speech Production and Bone Conduction Model

)(zV)(ne

Vocal Tract

Bone Conduction

Transforming Bone-Conducted Speech into Normal Speech

)(nd )(ns)(

zB )(zV

Reconstruction Filtering

Direct design of H(z) is difficult

)(nd )(ˆ ns)(ˆ zH

|)(|)(ˆ

Filter Design

Long-term spectrum of s(n)

Long-term spectrum of d(n)

Direct design of H(z) is difficult

音声収録の手続き 20歳前後の男性2名(A,B)、女性2名(C,D)

5母音,5つの文

気導音声収録用マイク

(パナソニックRP-VK25)

骨導音声収録用マイク

(テムコHG-17ヘッドギア)

サンプリング周波数44.1kHzで収録し、11.025kHzまでダウンサンプリングして実験に使用

量子化ビット数16bit

骨導マイク骨などを介して音声波形信号が伝わる

Body vibrationをピックアップする特殊マイク

テムコ HG-17ヘッドギア

実験の様子

試聴実験概要

試聴者２０名

評価対象無処理の骨導音声と３種類の導出音声

評価基準「明瞭度」

評価方法一対比較法、「どちらが気導音声の明瞭度に近いか」

近い方を選択

評価値 3文の選択率を平均化し、評価

試聴実験結果（サーストン心理尺度）

話者A

-2 -1 0 1 2

話者B 話者C 話者D :骨導：同一：母音：長文明瞭度試験結果

いくつかのデモ

最後に MATLABを利用した音声処理の進展

複雑な関数を簡単にプログラミング

音声分野におけるMATLABの利用と 先端研究紹介 - MathWorks ·...

Documents

Transcript of 音声分野におけるMATLABの利用と 先端研究紹介 - MathWorks ·...

Cisco IOS Enterprise 音声ゲートウェイの設定...Cisco IOS Enterprise 音声ゲートウェイの設定•CiscoIOSEnterprise音声ゲートウェイの設定,1ページ Cisco

テレビCM素材搬入基準 「音声レベル運用規準」の …...テレビCM素材搬入基準「音声レベル運用規準」の適用について テレビ音声の課題

IIJmio meeting #3 音声通話サービスのお話

音声メールユニット 取扱説明書 - ntt-west.co.jp...音声メールユニット 取扱説明書 このたびは、ネットコミュニティシステムαGX typeS/typeM音声メールユニットをお買い求

発声のしくみ －声道の共鳴と音源の生成－

音声の特徴抽出/57 本講義の目的 デジタル信号処理の基礎 – 特徴抽出の前準備 音声とは – 音声の生成過程，包絡成分，微細構造 音声の特徴抽出

待望の技術 オラクル社の 音声対応テクノロジotndnld.oracle.co.jp/products/iaswe/pdf/9iASW_Voice_twp.pdf · 以前、音声認識は精度が低く、音声対応アプリケーションの開発と配置が難しい

沖縄語の音声・音韻の変化過程 - 広島大学 学術情報 …...沖縄語の音声・音韻の変化過程 多和田 員一郎 沖縄語の音声・音韻の変化過程(15-

高騒音下の音声の性質と雑音レベルの低減 - NICTVol. 22 No. 119 解説 電波研究所季報 高騒音下の音声の性質と雑音レベルの低減 高杉敏男＊

音声音響信号処理のための 確率モデルと学習アルゴ …声道特徴量：音韻性や声質に関係 声帯特徴量：声の高さや声のかすれに関係 応用例

AEON MOBILE - イオンモバイル音声通話サービスを ご契約の …...p. 1 AM20210115V 音声・シェア音声プラン イオンモバイル音声通話サービスを

ゲームキャラクタと声質の傾向分析 - IPSJ DBS · 制作されたゲームの音声を録音する．この音声から各キャラク タの音響特徴量を算出すると同時に，その声が与える印象につ

音声認識のための非線形音声強調happyoukai/2018/essay/岩本...音声認識のための非線形音声強調 及川靖広研究室 4年 岩本美緒 1. まえがき 近年，音声認識システムによる自動テキスト化の技術

音声の分析...– 音声信号処理 (speech signal processing) – 音巨信号処理 (acoustic signal processing) – 音声合成・変換 (speech synthesis, voice conversion)

日本語の無声子音・有声子音、 中国語の有気音・無気音の比較 ... · 2019-04-19 · 日本語の無声子音・有声子音、 中国語の有気音・無気音の比較

Android端末で音声ファイルをダウンロード...Android端末で音声ファイルをダウンロード 『保育英語の練習帳』の音声ファイル（MP3形式）はAn

2014 年度上智大学理工学部活動報告書 情報 - …...キーワード： 音声コミュニケーション，音声科学，音声生成，音声知覚，音響学， 音の福祉工学・障害者支援，音響音声学，音響教育

背景音付き音声の ノンパラレルデータ 声質変換...背景音付き音声の ノンパラレルデータ 声質変換 柴田研究室 C0116276 山田尭士 2020/2/5

音声言語処理アプリケーション• 現在の音声言語処理は何ができるのか？ –実際に音声認識が使われている場面 –音声言語処理の性能を理解したアプリケーションの構築

音声 VLAN の設定 - CiscoCisco IP Phone の音声トラフィックの設定 CiscoIPPhoneにCDPパケットを送信してIPPhoneによる音声トラフィックの送信方法を設定す

音声分野におけるMATLABの利用と先端研究紹介 - MathWorks ·...

Transcript of 音声分野におけるMATLABの利用と先端研究紹介 - MathWorks ·...

テレビCM素材搬入基準「音声レベル運用規準」の …...テレビCM素材搬入基準「音声レベル運用規準」の適用についてテレビ音声の課題

音声メールユニット取扱説明書 - ntt-west.co.jp...音声メールユニット取扱説明書このたびは、ネットコミュニティシステムαGX typeS/typeM音声メールユニットをお買い求

発声のしくみ－声道の共鳴と音源の生成－

音声の特徴抽出/57 本講義の目的デジタル信号処理の基礎 – 特徴抽出の前準備音声とは – 音声の生成過程，包絡成分，微細構造音声の特徴抽出

待望の技術オラクル社の音声対応テクノロジotndnld.oracle.co.jp/products/iaswe/pdf/9iASW_Voice_twp.pdf · 以前、音声認識は精度が低く、音声対応アプリケーションの開発と配置が難しい

沖縄語の音声・音韻の変化過程 - 広島大学学術情報 …...沖縄語の音声・音韻の変化過程多和田員一郎沖縄語の音声・音韻の変化過程(15-

高騒音下の音声の性質と雑音レベルの低減 - NICTVol. 22 No. 119 解説電波研究所季報高騒音下の音声の性質と雑音レベルの低減高杉敏男＊

音声音響信号処理のための確率モデルと学習アルゴ …声道特徴量：音韻性や声質に関係声帯特徴量：声の高さや声のかすれに関係応用例

AEON MOBILE - イオンモバイル音声通話サービスをご契約の …...p. 1 AM20210115V 音声・シェア音声プランイオンモバイル音声通話サービスを

ゲームキャラクタと声質の傾向分析 - IPSJ DBS · 制作されたゲームの音声を録音する．この音声から各キャラクタの音響特徴量を算出すると同時に，その声が与える印象につ

音声認識のための非線形音声強調happyoukai/2018/essay/岩本...音声認識のための非線形音声強調及川靖広研究室 4年岩本美緒 1. まえがき近年，音声認識システムによる自動テキスト化の技術

日本語の無声子音・有声子音、中国語の有気音・無気音の比較 ... · 2019-04-19 · 日本語の無声子音・有声子音、中国語の有気音・無気音の比較

Android端末で音声ファイルをダウンロード...Android端末で音声ファイルをダウンロード『保育英語の練習帳』の音声ファイル（MP3形式）はAn

2014 年度上智大学理工学部活動報告書情報 - …...キーワード：音声コミュニケーション，音声科学，音声生成，音声知覚，音響学，音の福祉工学・障害者支援，音響音声学，音響教育

背景音付き音声のノンパラレルデータ声質変換...背景音付き音声のノンパラレルデータ声質変換柴田研究室 C0116276 山田尭士 2020/2/5