[Poster Presentation] Nonconvex Optimization …rhayakawa/paper/RCC2019...[Poster Presentation]...

6
[ポスター講演]非凸最適化に基づく離散値ベクトル再構成アルゴリズム 早川 和則 †† 京都大学大学院情報学研究科 〒 606-8501 京都市左京区吉田本町 †† 大阪市立大学大学院工学研究科 〒 558-8585 大阪市住吉区杉本 3-3-138 E-mail: [email protected], [email protected] あらまし 本稿では,成分が離散値をとるベクトルをその線形観測から再構成する問題に対して,非凸最適化に基づ くアルゴリズムを提案する.まず,一般のスパース正則化項の重み付き和を離散値ベクトルに対する正則化として用い SSRSum of Sparse Regularizers)最適化問題を提案し,ADMMAlternating Direction Method of Multiplier交互方向乗数法)と主・双対近接分離法に基づくアルゴリズムをそれぞれ導出する.さらに,ADMM に基づくアルゴ リズムを複素離散値ベクトルの再構成に拡張する.計算機シミュレーションにより,凸最適化に基づく手法よりも非 凸最適化に基づく手法の方が良い特性を達成可能であることを示す. キーワード 離散値ベクトル再構成,非凸最適化,ADMM,主・双対近接分離法 [Poster Presentation] Nonconvex Optimization Based Algorithm for Discrete-Valued Vector Reconstruction Ryo HAYAKAWA and Kazunori HAYASHI †† Graduate School of Informatics, Kyoto University, Yoshida-Honmachi, Sakyo-ku, Kyoto, 606-8501 Japan †† Graduate School of Engineering, Osaka City University, 3-3-138 Sugimoto, Sumiyoshi-ku, Osaka, 558-8585 Japan E-mail: [email protected], [email protected] Abstract In this paper, we propose a possibly nonconvex optimization problem to reconstruct a discrete-valued vector from its underdetermined linear measurements. The proposed sum of sparse regularizers (SSR) optimization uses the sum of sparse regularizers as a regularizer for the discrete-valued vector. We also propose two proximal splitting algorithms for the SSR optimization problem on the basis of alternating direction method of multipliers (ADMM) and primal-dual splitting. Moreover, we extend the ADMM based approach for the reconstruction of complex discrete-valued vectors. Simulation results show that the proposed algorithms with nonconvex regularizers can achieve good reconstruction performance. Key words Discrete-valued vector reconstruction, nonconvex optimization, ADMM (Alternating Direction Method of Multipliers), primal-dual splitting. 1. まえがき 離散値をとるベクトルをその線形観測から再構成する問題は, 通信システムにおいてよく現れる.例えば,MIMOMultiple- Input Multiple-Output)信号検出 [1–3] やマルチユーザ検出 [4] などが例として挙げられる.特に観測の数が未知変数の数より も少ない劣決定系の問題においては,低演算量な線形の再構成 手法の特性は大きく劣化する.網羅的な探索を行う最尤推定に 基づく手法は良い特性を達成可能であるが,大規模な問題に対 しては計算量が膨大になり現実的ではない.少ない計算量で比 較的良好な特性を達成するための手法として,未知変数の離散 性を利用したメッセージ伝播法 [5–7] に基づくアプローチが提 案されているが,これらの手法は観測行列に関する仮定が必要 であり,その仮定が満たされない場合,特性が大きく劣化する ことがある.他のアプローチとしては,離散性を活用した正則 化を用いる数理最適化に基づく手法 [8–10] が提案されている. しかしながら,これらの手法は凸緩和の結果得られる凸最適化 問題を解くものであり,離散性を十分に活用できているとは言 い難い. 本稿では,観測行列に関する陽な仮定をせずに凸最適化に基 一般社団法人 電子情報通信学会 信学技報 THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS This article is a technical report without peer review, and its polished and/or extended version may be published elsewhere. Copyright ©2019 by IEICE IEICE Technical Report WBS2019-24,ITS2019-15,RCC2019-55(2019-11) - 11 -

Transcript of [Poster Presentation] Nonconvex Optimization …rhayakawa/paper/RCC2019...[Poster Presentation]...

Page 1: [Poster Presentation] Nonconvex Optimization …rhayakawa/paper/RCC2019...[Poster Presentation] Nonconvex Optimization Based Algorithm for Discrete-Valued Vector Reconstruction Ryo

社団法人 電子情報通信学会THE INSTITUTE OF ELECTRONICS,INFORMATION AND COMMUNICATION ENGINEERS

信学技報TECHNICAL REPORT OF IEICE.

[ポスター講演]非凸最適化に基づく離散値ベクトル再構成アルゴリズム

早川 諒† 林 和則††

† 京都大学大学院情報学研究科 〒 606-8501 京都市左京区吉田本町†† 大阪市立大学大学院工学研究科 〒 558-8585 大阪市住吉区杉本 3-3-138

E-mail: [email protected], [email protected]

あらまし 本稿では,成分が離散値をとるベクトルをその線形観測から再構成する問題に対して,非凸最適化に基づ

くアルゴリズムを提案する.まず,一般のスパース正則化項の重み付き和を離散値ベクトルに対する正則化として用い

る SSR(Sum of Sparse Regularizers)最適化問題を提案し,ADMM(Alternating Direction Method of Multiplier,

交互方向乗数法)と主・双対近接分離法に基づくアルゴリズムをそれぞれ導出する.さらに,ADMMに基づくアルゴ

リズムを複素離散値ベクトルの再構成に拡張する.計算機シミュレーションにより,凸最適化に基づく手法よりも非

凸最適化に基づく手法の方が良い特性を達成可能であることを示す.

キーワード 離散値ベクトル再構成,非凸最適化,ADMM,主・双対近接分離法

[Poster Presentation] Nonconvex Optimization Based Algorithm

for Discrete-Valued Vector Reconstruction

Ryo HAYAKAWA† and Kazunori HAYASHI††

† Graduate School of Informatics, Kyoto University, Yoshida-Honmachi, Sakyo-ku, Kyoto, 606-8501 Japan

†† Graduate School of Engineering, Osaka City University, 3-3-138 Sugimoto, Sumiyoshi-ku, Osaka, 558-8585

Japan

E-mail: [email protected], [email protected]

Abstract In this paper, we propose a possibly nonconvex optimization problem to reconstruct a discrete-valued

vector from its underdetermined linear measurements. The proposed sum of sparse regularizers (SSR) optimization

uses the sum of sparse regularizers as a regularizer for the discrete-valued vector. We also propose two proximal

splitting algorithms for the SSR optimization problem on the basis of alternating direction method of multipliers

(ADMM) and primal-dual splitting. Moreover, we extend the ADMM based approach for the reconstruction of

complex discrete-valued vectors. Simulation results show that the proposed algorithms with nonconvex regularizers

can achieve good reconstruction performance.

Key words Discrete-valued vector reconstruction, nonconvex optimization, ADMM (Alternating Direction

Method of Multipliers), primal-dual splitting.

1. ま え が き

離散値をとるベクトルをその線形観測から再構成する問題は,

通信システムにおいてよく現れる.例えば,MIMO(Multiple-

Input Multiple-Output)信号検出 [1–3]やマルチユーザ検出 [4]

などが例として挙げられる.特に観測の数が未知変数の数より

も少ない劣決定系の問題においては,低演算量な線形の再構成

手法の特性は大きく劣化する.網羅的な探索を行う最尤推定に

基づく手法は良い特性を達成可能であるが,大規模な問題に対

しては計算量が膨大になり現実的ではない.少ない計算量で比

較的良好な特性を達成するための手法として,未知変数の離散

性を利用したメッセージ伝播法 [5–7]に基づくアプローチが提

案されているが,これらの手法は観測行列に関する仮定が必要

であり,その仮定が満たされない場合,特性が大きく劣化する

ことがある.他のアプローチとしては,離散性を活用した正則

化を用いる数理最適化に基づく手法 [8–10] が提案されている.

しかしながら,これらの手法は凸緩和の結果得られる凸最適化

問題を解くものであり,離散性を十分に活用できているとは言

い難い.

本稿では,観測行列に関する陽な仮定をせずに凸最適化に基

— 1 —

一般社団法人 電子情報通信学会 信学技報THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS

This article is a technical report without peer review, and its polished and/or extended version may be published elsewhere.                                           Copyright ©2019 by IEICE

IEICE Technical Report WBS2019-24,ITS2019-15,RCC2019-55(2019-11)

- 11 -

Page 2: [Poster Presentation] Nonconvex Optimization …rhayakawa/paper/RCC2019...[Poster Presentation] Nonconvex Optimization Based Algorithm for Discrete-Valued Vector Reconstruction Ryo

づく手法より良い特性を達成することを目的として,非凸最適

化に基づく手法を提案する.提案最適化問題の SSR(Sum of

Sparse Regularizers)最適化では,未知ベクトルの離散性を活

用するため,一般のスパース正則化関数 [11, 12]の和を離散値

ベクトルに対する正則化として用いる.SSR 最適化は SOAV

(Sum of Absolute Values)最適化 [10, 13–17]の一般化となっ

ており,スパース正則化として ℓ1 ノルムを用いた場合,SOAV

最適化と等価になる.SSR最適化では,ℓ1ノルム以外にも, ℓp

ノルム(0 < p < 1)[18–22],ℓ0 ノルム,ℓ1 − ℓ2 差分 [23, 24]

などの非凸なスパース正則化関数を用いることができる.本稿

では,SSR最適化問題に対するアルゴリズムとして,ADMM

(Alternating Direction Method of Multiplier,交互方向乗数

法)[25–28] に基づくアルゴリズムを提案する.ADMM に基

づくアルゴリズムは最適解の近くへの収束が比較的速いこと

が知られているが,逆行列計算を必要とするため,大規模な

問題においては計算量が膨大になる場合がある.この問題を

解決するため,逆行列計算を必要としない主・双対近接分離法

(Primal-Dual Splitting)[29,30]に基づくアルゴリズムも提案

する.さらに,SSR最適化問題を複素数領域における最適化問

題に拡張し,通信の分野でよく現れる複素離散値ベクトル再構

成のためのアルゴリズムを導出する.計算機シミュレーション

により,非凸な正則化を用いた提案アルゴリズムが従来の手法

よりも良い特性を達成することを示す.

本稿では,以下の記法を用いる.Rは実数全体の集合を表し,Cは複素数全体の集合を表す.(·)T は転置,(·)H はエルミート転置,j は虚数単位,IN は N × N の単位行列,1 は成分が

すべて 1 のベクトル,0 は成分がすべて 0 のベクトルである.

Re{·}と Im{·}はそれぞれ実部と虚部を表す.下半連続な関数ϕ : KN → R ∪ {∞}(K = Rまたは C)に対して,その近接写像を proxϕ(u) = arg min s∈KN

{ϕ(s) +

1

2∥s− u∥22

}と定義

する.

2. 離散値ベクトル再構成

成分が離散値をとるベクトル x = [x1 · · · xN ]T ∈ RN ⊂ RN

をその線形観測 y = Ax+ v ∈ RM から再構成する問題を考え

る.ここで,R = {r1, . . . , rL} は未知ベクトル x の成分がと

りうる値の集合であり,L ≪ N と仮定する.xn の分布は既知

であるとし,それを Pr (xn = rℓ) = pℓ(ℓ = 1, . . . , L)とおく

(∑L

ℓ=1 pℓ = 1).A ∈ RM×N は観測行列であり,v ∈ RM は

加法性の雑音ベクトルである.

3. 提案最適化問題

未知ベクトル xを y と Aから再構成するための最適化問題

として,SSR最適化問題

minimizes∈RN

{L∑

ℓ=1

qℓhℓ (s− rℓ1) +λ

2∥y −As∥22

}(1)

を提案する.ここで,qℓ と λ(> 0)はパラメータであり,∑Lℓ=1 qℓ = 1(qℓ >= 0)であるとする.関数 hℓ(·)はスパース正

則化のための関数であり,その近接写像が効率的に計算可能で

あると仮定する.SOAV最適化 [10]の場合と同様に,SSR最

適化に含まれるスパース正則化の関数は,x− rℓ1がいくつか

零成分をもつという事実に基づいている.そのため,スパース

正則化関数の和∑L

ℓ=1 qℓhℓ (s− rℓ1)は,離散値ベクトルに対

する正則化として捉えられる.

スパース正則化関数 hℓ(·)の例とその近接写像を示す.

例 1 (ℓ1 ノルム).

ℓ1 ノルムに基づく正則化 h(1)(u) = ∥u∥1 =∑N

n=1 |un|(u = [u1 · · · uN ]T ∈ RN)の近接写像 proxγh(1)(·)は[

proxγh(1)(u)]n= sign(un)max (|un| − γ, 0) (2)

で与えられる(γ > 0).ここで,[·]n はベクトルの n番目の成

分を表し,sign(·)は符号関数を表す.ℓ1 正則化を用いた SSR

最適化は,SOAV最適化 [10]と等価になる.

例 2 (ℓ0 ノルム).

ℓ0ノルム(非零成分の数)に基づく非凸な正則化h(0)(u) = ∥u∥0に対しては,

[proxγh(0)(u)

]n=

{0}

(|un| <

√2γ)

{0, un}(|un| =

√2γ)

{un}(|un| >

√2γ) (3)

となる(n = 1, . . . , N).

例 3 (ℓp ノルム(0 < p < 1)).

ℓp ノルム(0 < p < 1)に基づく正則化 h(p)(u) = ∥u∥pp =∑Nn=1 |un|p を考える.図 1 に,二値ベクトルの場合(R =

{−1, 1})に対する正則化関数 (h(p)(s+ 1) + h(p)(s− 1))/2を

示す.図から,h(1/2)(·)や h(2/3)(·)を用いた非凸な正則化関数は s = ±1のみで最小となるため,h(1)(·)を用いた凸な正則化関数に比べてより離散性を促進できることがわかる.ℓp ノルム

に対する近接写像に関しては,[19–21] で検討されている.任

意の p ∈ (0, 1)に対して proxγh(p)(·)を数値的に計算可能であり,p = 1/2, 2/3に対しては閉形式で書くことができる.図 2

は γh(1)(·),γh(2/3)(·),γh(1/2)(·),および γh(0)(·)(γ = 0.5)

の近接写像を示したものである.非凸な正則化関数に対する近

接写像は不連続となることがわかる.

例 4 (ℓ1 − ℓ2 差分).

ℓ1ノルムと ℓ2ノルムの差分を用いた非凸な正則化 h(1−2)(u) =

∥u∥1−∥u∥2が圧縮センシングに対して提案されている [23,24].

h(1−2)(·) の近接写像は,[24] の Lemma 1 や [31] の Proposi-

tion 7.1を用いて計算可能である.

4. SSR最適化のためのアルゴリズム

本節では,SSR最適化問題に対するアルゴリズムを 2つ提案

する.

4. 1 ADMMに基づくアルゴリズム

ADMMに基づくアルゴリズムを導出するため,SSR最適化

— 2 —- 12 -

Page 3: [Poster Presentation] Nonconvex Optimization …rhayakawa/paper/RCC2019...[Poster Presentation] Nonconvex Optimization Based Algorithm for Discrete-Valued Vector Reconstruction Ryo

図 1 (h(s+ 1) + h(s− 1))/2

図 2 proxγh(u) (γ = 0.5)

(1)を新たな変数 z1, . . . , zL ∈ RN を用いて

minimizes,z1,...,zL∈RN

{L∑

ℓ=1

qℓhℓ (zℓ − rℓ1) +λ

2∥y −As∥22

}

subject to s = zℓ (ℓ = 1, . . . , L) (4)

と書き換える.さらに,z =[zT1 · · · zT

L

]T ∈ RLN,

Φ = [IN · · · IN ]T,f(s) = λ2∥y −As∥22,および g(z) =∑L

ℓ=1 qℓhℓ (zℓ − rℓ1)とおくと,ADMMの標準形

minimizes∈RN ,z∈RLN

{f(s) + g(z)} subject to Φs = z (5)

に変形できる.

ADMMに基づく提案アルゴリズムを導出する.最適化問題

(5)に対する ADMMの更新式は

sk+1 = arg mins∈CN

{f (s) +

ρ

2

∥∥∥Φs− zk +wk∥∥∥22

}, (6)

zk+1 = arg minz∈CLN

{g (z) +

ρ

2

∥∥∥Φsk+1 − z +wk∥∥∥22

},

(7)

wk+1 = wk +Φsk+1 − zk+1 (8)

Algorithm 1 ADMM-SSR: ADMM Based Algorithm for (1)

Input: y ∈ RM ,A ∈ RM×N

Output: x ∈ RN

1: Fix ρ > 0, z0 ∈ RNL, and w0 ∈ RNL

2: for k = 0 to K − 1 do

3: sk+1 =(ρLIN + λATA

)−1

·(ρ∑L

ℓ=1

(zkℓ −wk

)+ λATy

)4: zk+1

ℓ = rℓ1+ prox qℓρ

hℓ

(sk+1 +wk

ℓ − rℓ1)

(ℓ = 1, . . . , L)

5: wk+1ℓ = wk

ℓ + sk+1 − zk+1ℓ (ℓ = 1, . . . , L)

6: end for

7: x = Q(sK)

となる.kは繰り返しのインデックス,ρ(> 0)はパラメータであ

り,wk ∈ RLN である.∂

∂sT

{f(s) +

ρ

2

∥∥Φs− zk +wk∥∥22

}=

0を解くと,sk の更新式 (6)は

sk+1 =(ρLIN + λATA

)−1(ρ

L∑ℓ=1

(zkℓ −wk

)+ λATy

)(9)

と書ける.ここで,zkℓ ∈ RN および wk

ℓ ∈ RN(ℓ =

1, . . . , L)はそれぞれ zk =[zk1T · · · zk

LT]Tおよび wk =[

wk1T · · · wk

LT]Tの部分ベクトルである.zk の更新式 (7)は,

関数 g(·)が g (z) =∑L

ℓ=1 qℓhℓ (zℓ − rℓ1)のように分離できる

ことを利用すると

zk+1 = prox 1ρg

(Φsk+1 +wk

)(10)

=

r11+ prox q1

ρh1

(sk+1 +wk

1 − r11)

...

rL1+ prox qLρ

hL

(sk+1 +wk

L − rL1) (11)

と書ける.式 (11) の変形では,平行移動に関する近接写像の

性質 [27]を用いた.

ADMM に基づく提案アルゴリズムの ADMM-SSR を Al-

gorithm 1 に示す.Q(·) は,入力ベクトルの各成分を最も近い R の要素に写像する操作を表す.ADMM-SSR は正則化項∑L

ℓ=1 qℓhℓ (s− rℓ1) 全体の近接写像の計算を必要としないた

め,例 1–4の正則化関数のように hℓ(·)の近接写像が計算可能であればよい.アルゴリズム中で逆行列

(ρLIN + λATA

)−1の

計算を一度行う必要があるため,計算量は O(N3) [32, Ch. 11]

となる.

4. 2 主・双対近接分離法に基づくアルゴリズム

前項で述べたように,ADMM-SSRは逆行列計算を必要とす

るため,非常に大規模な問題においては計算量が膨大となる場

合がある.そこで,本項では逆行列計算を必要としない主・双

対近接分離法 [30]に基づくアルゴリズムを提案する.

まず,SSR最適化問題 (1)を

minimizes∈RN

{f(s) + g(Φs)} (12)

と書き換える.最適化問題 (12)に対する主・双対近接分離法の

— 3 —- 13 -

Page 4: [Poster Presentation] Nonconvex Optimization …rhayakawa/paper/RCC2019...[Poster Presentation] Nonconvex Optimization Based Algorithm for Discrete-Valued Vector Reconstruction Ryo

Algorithm 2 PDS-SSR: PDS Based Algorithm for (1)

Input: y ∈ RM ,A ∈ RM×N

Output: x ∈ RN

1: Fix ρ1 > 0, ρ2 > 0, s0 ∈ RN , and w0 ∈ RNL

2: for k = 0 to K − 1 do

3: sk+1 = sk − ρ1(λAT

(Ask − y

)+

∑Lℓ=1 w

kℓ

)4: zk+1

ℓ = wkℓ + ρ2

(2sk+1 − sk

)(ℓ = 1, . . . , L)

5: wk+1ℓ = zk+1

ℓ − ρ2

(rℓ1+ prox qℓ

ρ2hℓ

(zk+1ℓρ2

− rℓ1

))(ℓ = 1, . . . , L)

6: end for

7: x = Q(sK)

更新式は

sk+1 = sk − ρ1(∇f

(sk)+ΦTwk

), (13)

zk+1 = wk + ρ2Φ(2sk+1 − sk

), (14)

wk+1 = proxρ2g∗

(zk+1

)(15)

となる.ここで,ρ1, ρ2(> 0)はパラメータであり,∇f(·)は f(·) の勾配,g∗(·) は g(·) の共役関数を表す.∇f(s) =

λAT (As− y)であるから,sk の更新式 (13)は

sk+1 = sk − ρ1

(λAT

(Ask − y

)+

L∑ℓ=1

wkℓ

)(16)

となる.また,式 (15) の proxρ2g∗(·) は proxρ2g∗(u) = u −ρ2proxg/ρ2

(u/ρ2) と書けるため,式 (11) と式 (15) を用いる

と,wk+1ℓ の更新式は

wk+1ℓ = zk+1

ℓ − ρ2

(rℓ1+ prox qℓ

ρ2hℓ

(zk+1ℓ

ρ2− rℓ1

))(17)

と書ける.

Algorithm 2に,主・双対近接分離法に基づく提案アルゴリズ

ムである PDS (Primal-Dual Splitting)-SSRを示す.ADMM-

SSRと同様に,PDS-SSRも hℓ(·)の近接写像を用いて計算可能である.PDS-SSRは逆行列計算を必要とせず,その計算量

は O(MN)となる.

4. 3 提案アルゴリズムの収束性

提案アルゴリズムの収束性はスパース正則化 hℓ(·)の凸性に依存する.h1(·), . . . , hL(·)がすべて凸の場合は,SSR最適化の目

的関数も凸になるため,ADMMの収束性 [26]よりADMM-SSR

によって得られる系列{sk}は最適解に収束する.また,[30]

の Theorem 3.1を用いると, 1/ρ1 − ρ2L >= λ∥∥ATA

∥∥2/2. で

あれば PDS-SSRによって得られる系列{sk}も最適解に収束

することがわかる.しかし,hℓ(·)が非凸な場合,一般に最適解への収束性は保証されない.いくつかの仮定をおいた上で非凸

な最適化問題に対する収束性が議論されている [33–37]が,こ

れらの結果を提案アルゴリズムに直接適用するのは困難である.

5. 複素離散値ベクトル再構成への拡張

本節では,前節の提案手法を複素離散値ベクトル x ∈ CN ⊂

CN の再構成の問題に拡張する.ここで,C = {c1, . . . , cL}は未知ベクトルの各成分がとりうる複素数値の集合を表す.観測

ベクトル y ∈ CM は,観測行列 A ∈ CM×N と雑音ベクトル

v ∈ CM を用いて y = Ax+ v と表されるとする.

複素離散値ベクトルの再構成のための最適化問題として,SSR

最適化問題 (1) を拡張した SCSR(Sum of Complex Sparse

Regularizers)

minimizes∈CN

{L∑

ℓ=1

qℓhℓ (s− cℓ1) + λ∥∥∥y − As

∥∥∥22

}(18)

を提案する.関数 hℓ(·)は複素スパースベクトルに対する正則化関数である.ℓ1 正則化を用いた SCSR最適化は [38]で提案

されているが,本稿では hℓ(·)として非凸な正則化関数も考える.[38]で議論されているように,未知ベクトルの実部と虚部

が独立でない場合,複素数領域における最適化問題を用いるの

が適切である.

本稿では,二種類の正則化関数 hℓ(·) を考える.例えば,ℓp ノルムに基づく正則化としては,h

(p)⋆ (u) =

∑Nn=1 |un|p

および h(p)⋆⋆ (u) =

∑Nn=1 (|Re{un}|p + |Im{un}|p) を定義する

(u = [u1 · · · uN ]T ∈ CN).一つ目の正則化 h(p)⋆ (·)は複素数

の絶対値に基づいており,二つ目の正則化 h(p)⋆⋆ (·)は実部と虚部

を別々に取り扱う.同様に h(1)⋆ (·),h

(0)⋆ (·),h

(1−2)⋆ (·),h

(1)⋆⋆ (·),

h(0)⋆⋆ (·),および h

(1−2)⋆⋆ (·)を定義する.γh⋆(·)(h⋆(·) = h

(1)⋆ (·),

h(0)⋆ (·),h(p)

⋆ (·),h(1−2)⋆ (·))の近接写像は対応する γh(·)(h(·) =

h(1)(·),h(0)(·),h(p)(·),h(1−2)(·))の近接写像を用いて書ける.実際,h⋆(·) が h⋆ (u) = h (|u|)(|u| = [|u1| · · · |uN |]T)を満たすことを用いると,γh⋆(·)の近接写像は[

proxγh⋆(u)]n=[proxγh(|u|)

]n

un

|un|(19)

と書ける.γh⋆⋆(·)の近接写像も対応するproxγh(·)の近接写像を用いて書ける.具体的には,定義から h⋆⋆ (u) = h (uR)+h (uI)

(uR = Re{u}および uI = Im{u})が成り立つので,[proxγh⋆⋆

(u)]n=[proxγh (uR)

]n+ j ·

[proxγh (uI)

]n

(20)

となる.

複素数領域の最適化問題に対する ADMM [39]の結果を利用

すると,SCSR最適化問題 (18)に対するADMMに基づくアル

ゴリズムを導出可能である.結果として得られるアルゴリズム

は,Algorithm 1の R,(·)T,rℓ,および prox qℓρ

hℓ(·)をそれぞ

れ C,(·)H,cℓ,および prox qℓ2ρ

hℓ(·)に置き換えたものとなる.

6. シミュレーション結果

計算機シミュレーションにより,提案アルゴリズムの特性

を評価する.観測行列 A の各成分は i.i.d.(independent and

identically distributed)で平均 0,分散 1のガウス分布に従う

とする.また,雑音ベクトルの各成分は i.i.d.で平均 0のガウ

ス分布に従うとする.ADMM-SSRと PDS-SSRにおける初期

値はそれぞれ z0 = w0 = 0および s0 = 0,w0 = 0とする.

— 4 —- 14 -

Page 5: [Poster Presentation] Nonconvex Optimization …rhayakawa/paper/RCC2019...[Poster Presentation] Nonconvex Optimization Based Algorithm for Discrete-Valued Vector Reconstruction Ryo

図 3 二値ベクトルの再構成におけるシンボル誤り率 ((N,M) =

(200, 160), SNR = 15 dB)

図 4 二値ベクトル再構成のシンボル誤り率 ((N,M) = (200, 150))

図 3 は,二値ベクトルの再構成におけるシンボル誤り率

(symbol error rate, SER)を示している.ここで,(r1, r2) =

(−1, 1) および (p1, p2) = (1/2, 1/2) である.問題のサイズは

(N,M) = (200, 160)であり,信号対雑音比(signal-to-noise ra-

tio, SNR)は 15 dBとした. 提案アルゴリズムのパラメータは

q1 = q2 = 1/2,λ = 0.05,ρ = 3,ρ1 = 2/(λ∥∥ATA

∥∥2+ 4),

および ρ2 = 1/2とした.図 3では,‘ℓ1’,‘ℓ2/3’,‘ℓ1/2’,‘ℓ0’,お

よび ‘ℓ1 − ℓ2’がそれぞれスパース正則化として ℓ1ノルム,ℓ2/3

ノルム,ℓ1/2 ノルム,ℓ0 ノルム,ℓ1 − ℓ2 差分を用いた場合を

表す.凸な ℓ1 正則化を用いた場合,ADMM-SSRと PDS-SSR

が同じシンボル誤り率に収束していることがわかる.一方で,

ℓp ノルムや ℓ0 ノルムなどの非凸な正則化を用いた場合,提案

アルゴリズムはより小さいシンボル誤り率を達成している.ま

た,ADMM-SSRと PDS-SSRを比較すると,逆行列を用いる

ADMM-SSRの方が収束が速いことがわかる.

図 4は,ADMM-SSRの SNRに対するシンボル誤り率を示

す.未知ベクトルの分布は図 3の場合と同じ((r1, r2) = (−1, 1)

および (p1, p2) = (1/2, 1/2))とし,問題のサイズは (N,M) =

(200, 150) とした.比較のため,線形の MMSE(Minimum

図 5 複素離散値ベクトル再構成のシンボル誤り率 ((N,M) =

(200, 160))

Mean-Square-Error)を ‘LMMSE’,Box制約を用いた手法 [8]

を ‘Box’で示している.ADMM-SSRのパラメータは λ = 0.05,

ρ = 3,およびK = 300とした.非凸な正則化を用いたADMM-

SSRが,凸な ℓ1 正則化を用いた場合や Box制約を用いた手法

よりも良い特性を達成していることがわかる.

図 5は,複素離散値ベクトルの再構成に対するシンボル誤り率

特性を示す.問題のサイズは (N,M) = (200, 160)とし,未知ベ

クトルの分布は (c1, c2, c3, c4, c5) = (0, 1+j,−1+j,−1−j, 1−j)

および (p1, p2, p3, p4, p5) = (0.6, 0.1, 0.1, 0.1, 0.1) とした.こ

こで,pℓ = Pr(xn = cℓ)(ℓ = 1, . . . , 5)である.この場合未知

変数は実部と虚部が同時に 0になるため,スパース正則化の関

数としては h1(·) = h⋆(·)および hℓ(·) = h⋆⋆(·)(ℓ = 2, . . . , 5)

を用いた.提案アルゴリズムの ADMM-SCSRのパラメータは

qℓ = pℓ,λ = 0.05,ρ = 3,および K = 300とした.図から,

複素離散値ベクトルの再構成においても非凸な正則化を用いた

提案アルゴリズムが良い特性を達成することがわかる.

7. ま と め

本稿では,離散値ベクトル再構成のための非凸最適化に基づ

くアルゴリズムを提案した.提案手法では,スパース正則化関

数の和を離散値ベクトルに対する正則化として用いる.計算機

シミュレーションにより,非凸な正則化を用いた提案手法が従

来の凸最適化に基づく手法より良い特性を達成可能であること

を示した.

謝辞 本研究の一部は,科学研究費補助金(研究課題番号

18K04148, 18H03765, 17J07055)及び,総務省の電波資源拡

大のための研究開発における委託研究課題「IoT機器増大に対

応した有無線最適制御型電波有効利用基盤技術の研究開発」に

よるものです.

文 献[1] L. Lu, G. Y. Li, A. L. Swindlehurst, A. Ashikhmin, and

R. Zhang, “An overview of massive MIMO: Benefits and

challenges,” IEEE J. Sel. Signal Process., vol. 8, no. 5, pp.

742–758, Oct. 2014.

[2] A. Chockalingam and B. S. Rajan, Large MIMO systems.

— 5 —- 15 -

Page 6: [Poster Presentation] Nonconvex Optimization …rhayakawa/paper/RCC2019...[Poster Presentation] Nonconvex Optimization Based Algorithm for Discrete-Valued Vector Reconstruction Ryo

Cambridge University Press, 2014.

[3] S. Yang and L. Hanzo, “Fifty years of MIMO detection:

The road to large-scale MIMOs,” IEEE Commun. Surveys

Tuts., vol. 17, no. 4, pp. 1941–1988, Fourthquarter 2015.

[4] S. Verdu, Multiuser Detection. Cambridge University

Press, 1998.

[5] C. Jeon, R. Ghods, A. Maleki, and C. Studer, “Optimality

of large MIMO detection via approximate message passing,”

in Proc. IEEE ISIT, Jun. 2015.

[6] R. Hayakawa and K. Hayashi, “Discreteness-aware approxi-

mate message passing for discrete-valued vector reconstruc-

tion,” IEEE Trans. Signal Process., vol. 66, no. 24, pp.

6443–6457, Dec. 2018.

[7] J. Cespedes, P. M. Olmos, M. Sanchez-Fernandez, and

F. Perez-Cruz, “Expectation propagation detection for

high-order high-dimensional MIMO systems,” IEEE Trans.

Commun., vol. 62, no. 8, pp. 2840–2849, Aug. 2014.

[8] P. H. Tan, L. K. Rasmussen, and T. J. Lim, “Constrained

maximum-likelihood detection in CDMA,” IEEE Trans.

Commun., vol. 49, no. 1, pp. 142–153, Jan. 2001.

[9] A. Aıssa-El-Bey, D. Pastor, S. M. A. Sbaı, and Y. Fadlallah,

“Sparsity-based recovery of finite alphabet solutions to un-

derdetermined linear systems,” IEEE Trans. Inf. Theory,

vol. 61, no. 4, pp. 2008–2018, Apr. 2015.

[10] M. Nagahara, “Discrete signal reconstruction by sum of ab-

solute values,” IEEE Signal Process. Lett., vol. 22, no. 10,

pp. 1575–1579, Oct. 2015.

[11] D. L. Donoho, “Compressed sensing,” IEEE Trans. Inf.

Theory, vol. 52, no. 4, pp. 1289–1306, Apr. 2006.

[12] K. Hayashi, M. Nagahara, and T. Tanaka, “A user’s guide

to compressed sensing for communications systems,” IEICE

Trans. Commun., vol. E96-B, no. 3, pp. 685–712, Mar. 2013.

[13] H. Sasahara, K. Hayashi, and M. Nagahara, “Symbol detec-

tion for faster-than-Nyquist signaling by sum-of-absolute-

values optimization,” IEEE Signal Process. Lett., vol. 23,

no. 12, pp. 1853–1857, Dec. 2016.

[14] ——, “Multiuser detection based on MAP estimation with

sum-of-absolute-values relaxation,” IEEE Trans. Signal

Process., vol. 65, no. 21, pp. 5621–5634, Nov. 2017.

[15] R. Hayakawa and K. Hayashi, “Convex optimization-based

signal detection for massive overloaded MIMO systems,”

IEEE Trans. Wireless Commun., vol. 16, no. 11, pp. 7080–

7091, Nov. 2017.

[16] ——, “Error recovery for massive MIMO signal detection

via reconstruction of discrete-valued sparse vector,” IEICE

Trans. Fundamentals, vol. E100-A, no. 12, pp. 2671–2679,

Dec. 2017.

[17] ——, “Discreteness-aware decoding for overloaded non-

orthogonal STBCs via convex optimization,” IEEE Com-

mun. Lett., vol. 22, no. 10, pp. 2080–2083, Oct. 2018.

[18] Z. Xu, H. Zhang, Y. Wang, X. Chang, and Y. Liang, “L1/2

regularization,” Sci. China Inf. Sci., vol. 53, no. 6, pp.

1159–1169, Jun 2010.

[19] Z. Xu, X. Chang, F. Xu, and H. Zhang, “L1/2 regular-

ization: A thresholding representation theory and a fast

solver,” IEEE Trans. Neural Netw. Learn. Syst., vol. 23,

no. 7, pp. 1013–1027, Jul. 2012.

[20] Y. Zhang and W. Ye, “L2/3 regularization: Convergence of

iterative thresholding algorithm,” J. Vis. Commun. Image

Represent., vol. 33, pp. 350–357, 2015.

[21] F. Chen, L. Shen, and B. W. Suter, “Computing the prox-

imity operator of the ℓp norm with 0 < p < 1,” IET Signal

Process., vol. 10, no. 5, pp. 557–565, Jun. 2016.

[22] Z. Li, S. Ding, Y. Li, Z. Yang, S. Xie, and W. Chen, “Man-

ifold optimization-based analysis dictionary learning with

an ℓ1/2-norm regularizer,” Neural Networks, vol. 98, pp.

212–222, 2018.

[23] P. Yin, Y. Lou, Q. He, and J. Xin, “Minimization of ℓ1−2

for compressed sensing,” SIAM J. Sci. Comput., vol. 37,

no. 1, pp. A536–A563, Feb. 2015.

[24] Y. Lou and M. Yan, “Fast L1–L2 minimization via a proxi-

mal operator,” J. Sci. Comput., vol. 74, no. 2, pp. 767–785,

Feb. 2018.

[25] D. Gabay and B. Mercier, “A dual algorithm for the so-

lution of nonlinear variational problems via finite element

approximation,” Comput. Math. Appl., vol. 2, no. 1, pp.

17–40, 1976.

[26] J. Eckstein and D. P. Bertsekas, “On the Douglas-Rachford

splitting method and the proximal point algorithm for max-

imal monotone operators,” Math. Program., vol. 55, no. 1,

pp. 293–318, Apr. 1992.

[27] P. L. Combettes and J.-C. Pesquet, “Proximal splitting

methods in signal processing,” in Fixed-point algorithms

for inverse problems in science and engineering. Springer,

2011.

[28] S. Boyd, N. Parikh, E. Chu, B. Peleato, and J. Eckstein,

“Distributed optimization and statistical learning via the

alternating direction method of multipliers,” Foundations

and Trends R⃝ in Machine Learning, vol. 3, no. 1, pp. 1–

122, 2011.

[29] A. Chambolle and T. Pock, “A first-order primal-dual al-

gorithm for convex problems with applications to imaging,”

J. Math. Imaging Vision, vol. 40, no. 1, pp. 120–145, May

2011.

[30] L. Condat, “A primal-dual splitting method for convex opti-

mization involving Lipschitzian, proximable and linear com-

posite terms,” J. Optim. Theory Appl., vol. 158, no. 2, pp.

460–479, Aug. 2013.

[31] T. Liu and T. K. Pong, “Further properties of the forward–

backward envelope with applications to difference-of-convex

programming,” Comput. Optim. Appl., vol. 67, no. 3, pp.

489–520, Jul. 2017.

[32] S. Boyd and L. Vandenberghe, Introduction to Applied Lin-

ear Algebra: Vectors, Matrices, and Least Squares. Cam-

bridge University Press, 2018.

[33] H. Attouch, J. Bolte, and B. F. Svaiter, “Convergence of de-

scent methods for semi-algebraic and tame problems: Prox-

imal algorithms, forward-backward splitting, and regular-

ized Gauss-Seidel methods,” Math. Program. Ser. A, vol.

137, no. 1, pp. 91–129, Feb. 2013.

[34] G. Li and T. Pong, “Global convergence of splitting meth-

ods for nonconvex composite optimization,” SIAM J. Op-

tim., vol. 25, no. 4, pp. 2434–2460, 2015.

[35] M. Hong, Z. Luo, and M. Razaviyayn, “Convergence analy-

sis of alternating direction method of multipliers for a family

of nonconvex problems,” SIAM J. Optim., vol. 26, no. 1, pp.

337–364, 2016.

[36] D. Hajinezhad, M. Hong, T. Zhao, and Z. Wang, “NESTT:

A nonconvex primal-dual splitting method for distributed

and stochastic optimization,” in Proc. NIPS, 2016.

[37] Y. Wang, W. Yin, and J. Zeng, “Global convergence of

ADMM in nonconvex nonsmooth optimization,” J. Sci.

Comput., Jun. 2018.

[38] R. Hayakawa and K. Hayashi, “Reconstruction of complex

discrete-valued vector via convex optimization with sparse

regularizers,” IEEE Access, vol. 6, pp. 66 499–66 512, Dec.

2018.

[39] L. Li, X. Wang, and G. Wang, “Alternating direction

method of multipliers for separable convex optimization of

real functions in complex variables,” Mathematical Prob-

lems in Engineering, vol. 2015, 2015.

— 6 —- 16 -