稀疏性雙反旋積非負矩陣分解法結合 遮罩之 單通道盲訊號分離
-
Upload
armando-patrick -
Category
Documents
-
view
101 -
download
0
description
Transcript of 稀疏性雙反旋積非負矩陣分解法結合 遮罩之 單通道盲訊號分離
稀疏性雙反旋積非負矩陣分解法結合遮罩之單通道盲訊號分離
蛙類純音辨識
非負矩陣分解法
稀疏性雙反旋積非負矩陣分解法
遮罩
大綱
預處理 端點偵測
特徵擷取
辨識與分類
蛙類純音辨識
預處理
預強調
音框化
窗函數訊號 預處理後訊號
平均熵值法
端點偵測
預處理後訊號
訊號轉換
計算平均能量值
機率密度函數
平均熵值
擷取端點
多段式平均頻譜法狀態
音框
狀態一
狀態二
狀態三
音框一
音框二
音框三
音框四
音框五
音框六
音框七
辨識與分類
物種模型最小累積
距離
白頷樹蛙 d1
艾氏樹蛙 d2
盤古蟾蜍 d3
古氏赤蛙 d4
日本樹蛙 d5
物種模型最小累積
距離
日本樹蛙 d5
盤古蟾蜍 d3
古氏赤蛙 d4
白頷樹蛙 d1
艾氏樹蛙 d2
日本樹蛙
排序
由原始矩陣 V 藉由不同的限制條件,而分解成兩個矩陣相乘的形式
限制條件為 : 矩陣內的元素值必須都大於等於零
非負矩陣分解法
mrrnmn HWV
其中 [W] 為基底矩陣, [H] 為係數矩陣
為了要使矩陣 W 與矩陣 H 相乘後的訊號能夠相似於原始信號,作者提出一個基於 KL 散度的目標函數來當作指標
目標函數如下
非負矩陣分解法
WHV
ji
ijijij
ijij V
VVVD
,
)log()||(
其中
當 V = WH 時,目標函數才有最小值 0
非負矩陣分解法
r
kkjik HW
1
更新規則
其中 為同位素 (Element-Wise) 的相乘,其除法也是進行同位素的運算, 1 則是元素值都為1 的矩陣,且其維度與原始信號的維度相等
非負矩陣分解法
1
T
T
WHW
VW
HH
T
T
H
HHW
V
WW
1
經由非負矩陣分解法所分析出的資料雖然能局部化、稀疏化 (Sparseness) 的呈現,但是稀疏性只是屬於其演算法的附屬品,並不能對資料的稀疏性去做程度上的控制
非負矩陣分解法延伸版本—稀疏性雙反旋積非負矩陣分解法◦控制非負矩陣分解法之稀疏程度◦取得基底資訊之時間上的變化和係數資訊上的頻譜改變
稀疏性雙反旋積非負矩陣分解法
目標函數改寫成如下所示 :
其中
稀疏性雙反旋積非負矩陣分解法
)(~
~log)~
||(,
HfVV
VVji
ijij
ij
ijij
HW,
~~
2
,
,
2,
,,
)(
~
d
di
idi
didi W
W
W
WW
且
與 是執行移動 (Shift) 的動作,指的是移動矩陣i 個列向量或是移動 j 個行向量,其執行示意圖如下 :
稀疏性雙反旋積非負矩陣分解法i
)(j
)(
987
654
321
A
654
321
0001
A
700
400
1002
A
更新規則
稀疏性雙反旋積非負矩陣分解法
H
HfW
VW
HH T
T
)(1
~
~~
WHV
diagWH
WHdiagWHV
WWTT
TT
~~1
~1
~11
~~
~
稀疏性雙反旋積非負矩陣分解法初始化W與H
正規化W矩陣
更新H矩陣
更新W矩陣
計算目標函數值
收斂?
結束
原始音檔 ( 拉都希氏 + 梭德氏 )
重建音檔 ( 拉都希氏 )
遮罩
Otsu 演 算 法
遮 蔽 訊 號
計 算 混 合 比 例
修 正 信 號
重 建 信 號
將重建的訊號利用 Otsu 演算法 (Otsu Method)[] 找尋適合的門檻值 (Threshold) ,將其轉變成一個二元式的遮罩 (Binary Mask)
建立直方圖
遮罩
計算各元素值的機率值,其公式如下 :
其中 N 為元素值的總數, ni 為第 i 個元素值所得的數量, Pi 為元素值的機率值。
利用一門檻值 T 將值方圖的機率分布分成兩個部分
遮罩
N
nP i
i
並計算各部分的機率總和與平均值
遮罩
T
其中 W1 與 W2 各為門檻值 T 之前、後部分的機率總和, M1 與 M2 各為門檻值 T 之前、後部分的平均值
遮罩
T
iiPTW
01 )(
1
12 )(
L
TiiPTW
T
iiiPTM
01 )(
1
12 )(
L
TiiiPTM
利用下列的公式,將每個元素值逐步帶入,找出差異值 D 最大時的 T 值 :
利用門檻值 T 將重建訊號 G(x , y) 轉換成二元式的遮罩 M(x , y)
遮罩
22121 )( MMWWD
1,),(
0,),(),(
TyxG
TyxGyxM
進行遮蔽動作來擷取局部訊號 S(x , y)
假設混音的數學表示如下所示
對於將混音訊號除以個別訊號則可得到個別訊號在混音當中所佔的比例
遮罩
),(),(),( yxMyxVyxS
),(),(),( 21 ftSftSftX
),(
),(
),(
),(1 21
ftX
ftS
ftX
ftS
利用總重建訊號與各自重建訊號進行同位素的相除,找出各混合成分的比例 R(x , y)
再將混合比例與擷取後的局部訊號進行同位素的相乘
遮罩
),(
),(),(
yxM
yxMyxR
T
ii Li 1,
),(),(),(~
yxRyxSyxS iii Li 1,
進行修正步驟
防止負值出現而導致錯誤發生,因此要對 所有的負值修改為零
遮罩
),(~
),(),(ˆ yxSyxSyxS jii ji ,
0
),(ˆ),(ˆ yxS
yxS0),(ˆ,
0),(ˆ,
yxS
yxS
分離結果
原始音檔 ( 拉都希氏 + 梭德氏 )
利用 SNMF2D 重建音檔 ( 拉都希氏 )
遮罩後的重建音檔 ( 拉都希氏 )