稀疏性雙反旋積非負矩陣分解法結合遮罩之單通道盲訊號分離
蛙類純音辨識
非負矩陣分解法
稀疏性雙反旋積非負矩陣分解法
遮罩
大綱
預處理 端點偵測
特徵擷取
辨識與分類
蛙類純音辨識
預處理
預強調
音框化
窗函數訊號 預處理後訊號
平均熵值法
端點偵測
預處理後訊號
訊號轉換
計算平均能量值
機率密度函數
平均熵值
擷取端點
多段式平均頻譜法狀態
音框
狀態一
狀態二
狀態三
音框一
音框二
音框三
音框四
音框五
音框六
音框七
辨識與分類
物種模型最小累積
距離
白頷樹蛙 d1
艾氏樹蛙 d2
盤古蟾蜍 d3
古氏赤蛙 d4
日本樹蛙 d5
物種模型最小累積
距離
日本樹蛙 d5
盤古蟾蜍 d3
古氏赤蛙 d4
白頷樹蛙 d1
艾氏樹蛙 d2
日本樹蛙
排序
由原始矩陣 V 藉由不同的限制條件,而分解成兩個矩陣相乘的形式
限制條件為 : 矩陣內的元素值必須都大於等於零
非負矩陣分解法
mrrnmn HWV
其中 [W] 為基底矩陣, [H] 為係數矩陣
為了要使矩陣 W 與矩陣 H 相乘後的訊號能夠相似於原始信號,作者提出一個基於 KL 散度的目標函數來當作指標
目標函數如下
非負矩陣分解法
WHV
ji
ijijij
ijij V
VVVD
,
)log()||(
其中
當 V = WH 時,目標函數才有最小值 0
非負矩陣分解法
r
kkjik HW
1
更新規則
其中 為同位素 (Element-Wise) 的相乘,其除法也是進行同位素的運算, 1 則是元素值都為1 的矩陣,且其維度與原始信號的維度相等
非負矩陣分解法
1
T
T
WHW
VW
HH
T
T
H
HHW
V
WW
1
經由非負矩陣分解法所分析出的資料雖然能局部化、稀疏化 (Sparseness) 的呈現,但是稀疏性只是屬於其演算法的附屬品,並不能對資料的稀疏性去做程度上的控制
非負矩陣分解法延伸版本—稀疏性雙反旋積非負矩陣分解法◦控制非負矩陣分解法之稀疏程度◦取得基底資訊之時間上的變化和係數資訊上的頻譜改變
稀疏性雙反旋積非負矩陣分解法
目標函數改寫成如下所示 :
其中
稀疏性雙反旋積非負矩陣分解法
)(~
~log)~
||(,
HfVV
VVji
ijij
ij
ijij
HW,
~~
2
,
,
2,
,,
)(
~
d
di
idi
didi W
W
W
WW
且
與 是執行移動 (Shift) 的動作,指的是移動矩陣i 個列向量或是移動 j 個行向量,其執行示意圖如下 :
稀疏性雙反旋積非負矩陣分解法i
)(j
)(
987
654
321
A
654
321
0001
A
700
400
1002
A
更新規則
稀疏性雙反旋積非負矩陣分解法
H
HfW
VW
HH T
T
)(1
~
~~
WHV
diagWH
WHdiagWHV
WWTT
TT
~~1
~1
~11
~~
~
稀疏性雙反旋積非負矩陣分解法初始化W與H
正規化W矩陣
更新H矩陣
更新W矩陣
計算目標函數值
收斂?
結束
原始音檔 ( 拉都希氏 + 梭德氏 )
重建音檔 ( 拉都希氏 )
遮罩
Otsu 演 算 法
遮 蔽 訊 號
計 算 混 合 比 例
修 正 信 號
重 建 信 號
將重建的訊號利用 Otsu 演算法 (Otsu Method)[] 找尋適合的門檻值 (Threshold) ,將其轉變成一個二元式的遮罩 (Binary Mask)
建立直方圖
遮罩
計算各元素值的機率值,其公式如下 :
其中 N 為元素值的總數, ni 為第 i 個元素值所得的數量, Pi 為元素值的機率值。
利用一門檻值 T 將值方圖的機率分布分成兩個部分
遮罩
N
nP i
i
並計算各部分的機率總和與平均值
遮罩
T
其中 W1 與 W2 各為門檻值 T 之前、後部分的機率總和, M1 與 M2 各為門檻值 T 之前、後部分的平均值
遮罩
T
iiPTW
01 )(
1
12 )(
L
TiiPTW
T
iiiPTM
01 )(
1
12 )(
L
TiiiPTM
利用下列的公式,將每個元素值逐步帶入,找出差異值 D 最大時的 T 值 :
利用門檻值 T 將重建訊號 G(x , y) 轉換成二元式的遮罩 M(x , y)
遮罩
22121 )( MMWWD
1,),(
0,),(),(
TyxG
TyxGyxM
進行遮蔽動作來擷取局部訊號 S(x , y)
假設混音的數學表示如下所示
對於將混音訊號除以個別訊號則可得到個別訊號在混音當中所佔的比例
遮罩
),(),(),( yxMyxVyxS
),(),(),( 21 ftSftSftX
),(
),(
),(
),(1 21
ftX
ftS
ftX
ftS
利用總重建訊號與各自重建訊號進行同位素的相除,找出各混合成分的比例 R(x , y)
再將混合比例與擷取後的局部訊號進行同位素的相乘
遮罩
),(
),(),(
yxM
yxMyxR
T
ii Li 1,
),(),(),(~
yxRyxSyxS iii Li 1,
進行修正步驟
防止負值出現而導致錯誤發生,因此要對 所有的負值修改為零
遮罩
),(~
),(),(ˆ yxSyxSyxS jii ji ,
0
),(ˆ),(ˆ yxS
yxS0),(ˆ,
0),(ˆ,
yxS
yxS
分離結果
原始音檔 ( 拉都希氏 + 梭德氏 )
利用 SNMF2D 重建音檔 ( 拉都希氏 )
遮罩後的重建音檔 ( 拉都希氏 )
Top Related