MBD中部コンファレンス ブロック構成パターンの 検出と置換 …...Confidential AISIN COMCRUISE Co.,Ltd. ブロック構成パターンの 検出と置換の自動化
Finger pattern のブロック化による 陰的 wavelet 近似逆行列前処理の 高速化
description
Transcript of Finger pattern のブロック化による 陰的 wavelet 近似逆行列前処理の 高速化
Finger patternFinger pattern のブロック化によのブロック化によるる
陰的陰的 waveletwavelet 近似逆行列前処理近似逆行列前処理のの
高速化高速化
今倉 暁 曽我部 知広 張 紹良名古屋大学 大学院工学研究科 計算理工学専攻
近似逆行列前処理
Wavelet 近似逆行列前処理
Finger pattern のブロック化 [ 提案法 ]
数値実験 ・ 結果
まとめ ・ 今後の課題
OutlineOutline
近似逆行列前処理近似逆行列前処理
近似逆行列前処理近似逆行列前処理
最小二乗問題
: M の j 番目の列ベクトル: I の j 番目の列ベクトル
完全独立・並列化が容易
偏微分方程式を離散化した際の線形方程式
を前処理付き Krylov 部分空間法で解くことを考える .
本研究では , 前処理として以下の近似逆行列前処理を扱う .
M の計算 .
近似逆行列前処理近似逆行列前処理
M の非零構造を考える . →→ A-1 の構造を参考にする .
疎性 : ○精度 : ×
閾値 : 大
疎性 : ×精度 : ○
閾値 : 小 値
0
0 大
小
値大
小
0
0
I. 疎行列である .II. が小
さい .
・・・計算コスト・・・近似逆行列の精度
実際に解く上で , M に要求される性質
フィルタリングを行う疎性と精度を両立させたい
WaveletWavelet 近似逆行列前処理近似逆行列前処理
WaveletWavelet 近似逆行列前処理近似逆行列前処理~離散~離散 waveletwavelet 変換(変換( DWTDWT )~)~
W の非零構造
L = 1L = 2L = 34
L : 任意パラメータ
Finger pattern(S. C. Hawkins and K. Chen, 2006)
Finger pattern(T. F. Chan et al., 1997)
WaveletWavelet 近似逆行列前処理近似逆行列前処理
0
0
0
0
00
疎性と精度の両立が可能
同値
W
WaveletWavelet 近似逆行列前処理近似逆行列前処理
Finger pattern
Finger pattern
近似逆行列前処理
陰的 wavelet 近似逆行列前処理
WaveletWavelet 近似逆行列前処理近似逆行列前処理~~ waveletwavelet 依存性~依存性~
DWT の精度に影響 近似逆行列の疎性に影響
Daubechies 4精度が高い疎性が低い計算コストが高い
Haar精度が低い疎性が高い計算コストが低い
Daubechies4 Haar
Time[s] Sherman 4 (n=1104)
影響が少ない
85 87
0.4 Watt 1 (n=1856)
1.2
116 128
前処理行列の構築時間反復法にかかる時間
反復回数
本研究ではWavelet を Haar に限定する
Finger patternFinger pattern のブロックのブロック化化
Finger patternFinger pattern のブロック化のブロック化~従来法の問題点~~従来法の問題点~
近似逆行列の計算
QR 分解 後退代入
問題点 近似逆行列の非零構造が 列ごとに異なる為 , 異なる 部分行列に対して , QR 分解 を合計 n 回行う必要がある .QR 分解の結果を再利用する
為に , Finger pattern のブロック化を提案する .
本研究では , 陰的法に対してブロック化を行った .
最小二乗問題陰的法を例に・・・
Finger patternFinger pattern のブロック化のブロック化
従来法 提案法
A(:,Sj) mj(Sj) A(:,Sj) mj(Sj)
Finger patternFinger pattern のブロック化のブロック化~精度比較~精度比較~~
従来法 提案法
の非零構造Theorem 1.
Proof.
数値実験・結果数値実験・結果
数値実験数値実験
計算環境• CPU : PowerPC G5 2.5GHz • メモリ : 4.0GB• コード : Fortran77• コンパイラ : g77 – O5
Test 行列• Poisson3Da (electromagnetics problem)
• dw8192 (computational fluid dynamics problem)n = 13514, Nnz = 352726
n = 8192, Nnz = 41746前処理
• 陰的 wavelet 近似逆行列前処理 [ 従来法 ]• 提案法• ILU(0)
b = (1,…,1)T
x = (0,…,0)|r |/|r | < 10
T0
• GMRES- 初期近似解- 停止条件 -8
0n
解法
結果結果 poisson3Dapoisson3Da
QR 分解後退代入
ILU(0) の分解GMRES
従来法 提案法 従来法 提案法従来法 提案法 ILU(0)L= 3 4 5
3.5 倍 3.0 倍
2.2 倍
158 158 159 159 160 160 5712
Tim
e[s
]
反復回数
1.8 倍 1.7 倍 1.5 倍
結果結果 dw8192dw8192
反復回数 5000
相対残差
― 前処理なし― 従来法 L=8― 提案法 L=6― 提案法 L=7― 提案法 L=8― ILU(0)
QR 分解後退代入
ILU(0) の分解GMRES
結果結果
提案法 ILU(0)
484230449 316 反復回数
25
0
Tim
e[s
]
L= 6 87449 316 230
指数関数的に計算時間が増大指数関数的に
計算時間が増大計算時間は減少
dw8192dw8192
まとめ・今後の課題まとめ・今後の課題
まとめ ・ 今後の課題まとめ ・ 今後の課題陰的 wavelet 近似逆行列前処理に対して , finger pattern のブロック化を行った .
最小二乗問題での QR 分解の結果を再利用すること により , 全体で約 1.5 倍高速化された .また , 従来法では収束しない問題に対しても収束す る場合もみられた .
提案法は従来法に代わる有効な解法になり得る .
今後の課題前処理行列の構築の更なる高速化アルゴリズムの並列化及び実装