分散アルゴリズム入門kakugawa/distalg.pdf1. 分散システムと 分散アルゴリズム 分散システム概要 分散システムとは 5 通信ネットワークで結ばれた計算機群
シェリングモデルに着想を得た 軽量な分散クラスタリング手法
description
Transcript of シェリングモデルに着想を得た 軽量な分散クラスタリング手法
2012/5/24 ITRC meet311
シェリングモデルに着想を得た軽量な分散クラスタリング手法
○ 津川 翔 ( 阪大・経済 ) 大崎 博之 ( 阪大・情報 ) 今瀬 真 ( 阪大・情報 )
2012/5/24ITRC meet312
発表の内容
研究の背景:接続性に基づく分散クラスタリング 関連研究 研究の目的:トポロジ変化が頻繁な環境に適した分散
クラスタリング手法の実現 SBDC (Schelling-Based Distributed Clustering) シミュレーション まとめと今後の課題
2012/5/24ITRC meet313
研究の背景:接続性に基づくクラスタリング
ネットワークの接続性に基づき自然な分割を決定 クラスタ内のリンクが密に
クラスタ間のリンクは疎に
なるようにクラスタを決定
MANET 、 WSN な ど の 大 規 模 ネ ッ ト ワ ー ク に お け るアプリケーションの品質向上に有効
2012/5/24ITRC meet314
研究の背景:分散クラスタリング
各ノードが近隣ノードの情報のみでクラスタを決定する
大規模ネットワークにおいて求められる– ノード数やリンク数が膨大でありネットワーク全
体の情報を集めるのが困難であるため
2012/5/24ITRC meet315
関連研究:既存の接続性に基づく分散クラスタリング手法
CDC [Ramaswamy05]– Originator と呼ばれる特定のノードからのフラッ
ディングにより近隣ノードの情報を収集 SDC [Li10]
– 各ノードが積極的に問い合わせを行うことにより近隣ノードの情報を収集
積極的に近隣ノードの情報を収集し高い精度のクラスタリングを目指す
2012/5/24ITRC meet316
既存手法のトポロジ変化への耐性
ノードの参加・離脱に対応しクラスタを維持する機構を備えている→ ある程度のトポロジ変化には対応可能
頻繁にトポロジが変化する環境は想定していない→ 頻繁にトポロジが変化する環境では多数の近隣
ノードの情報を収集する既存手法の性能は劣化すると考えられる
頻繁にトポロジが変化する環境では、最小限の近隣ノードの情報のみでクラスタリングを行うことが望ましい
2012/5/24ITRC meet317
研究の目的
動的な環境に適した分散クラスタリング手法 SBDC (Schelling-Based Distributed Clustering) の提案– 最小限の近隣ノードの情報のみでクラスタリング
を行う– シェリングモデルと呼ばれる社会モデルから着想
を得る SBDC の評価
– 動的な環境として MANET を想定したシミュレーション
2012/5/24ITRC meet318
シェリングモデル
各エージェントは「許容水準」と呼ばれるパラメータ θ (0≦θ≦1) を有する
近隣 (8 個の隣接セル ) のエージェントのうち、自身と同じ属性を持つエージェントの比率を計算
この値が許容水準 θ未満であれば空きセルに移動
同じ属性を有するエージェントの集団が形成
各エージェントが移動を繰り返すと
※ 色の違いは属性の違いを表す
近隣にいる同じ属性のエージェントの比
率 = 1/4
1/4 < θ
各エージェントは積極的に集ろうとしてないにもかかわらず、結果として近隣のエージェントの情報のみでエージェントの集団が形成される
シェリングモデルの示唆すること
社会学にとって…– Micromotives do not always match
macrobehaviour 情報科学にとって…
– 一種のクラスタリングアルゴリズムと捉えられる単純、分散、自己組織最適ではないが、効率的
– 各エージェントは自身の近隣の情報しか用いない
2012/5/24ITRC meet319
SBDC の核となるアイディア (1/4)
接続性に基づくクラスタリングをノードの色分けと捉える– 同色の連結部分を一つのクラスタとみなす
2012/5/24ITRC meet3110
SBDC の核となるアイディア (2/4)
空セルとエージェントをネットワークにマッピングする
エージェントを色を持つ通常ノードとして表現
空セルを空き地ノードとして表現
各ノードは確率 p で空き地ノードに、 1-p で通常ノードになる
2012/5/24ITRC meet3111
SBDC の核となるアイディア (3/4)
「近隣の同色のエージェントの割合」の代わりに「隣接ノードとの距離」を用いる
距離は 2 ホップの範囲のサブネットワークから得られる辺の媒介中心性の推定値を利用して求める
同色のノードが媒介中心性の小さい辺で接続されている時、距離が近いと考える
2012/5/24ITRC meet3112
SBDC の核となるアイディア (4/4)
エージェントの移動をノードの色の交換として表現
空き地ノードは隣接ノードの中で最も多い色と同じクラスタに所属
する
2012/5/24ITRC meet3113 色を交換
2012/5/24ITRC meet3114
シミュレーションの概要
ノードが高速に移動する MANET のトポロジ変化を想定– 二次元平面上にランダムにノードを配置– 無線通信範囲内に存在するノード同士はリンクを生成
– ノードの移動モデル: RWP (Random WayPoint) モデル
– T [s] ごとにクラスタ更新
ITRC meet3115
評価指標
モジュラリティ:クラスタリングの精度を評価
クラスタの更新に必要なメッセージ数:クラスタリング手法の効率性を評価
クラスタのサイズ、孤立ノード数、クラスタサイズの変動係数:クラスタの一様性を評価
クラスタの変更回数:クラスタの安定性を評価
2012/5/24
全てのリンクのうちクラスタ i 内のリンクの割合
全てのリンクのうちクラスタ i に属するノードの有するリンクの割
合
ITRC meet3116
シミュレーション結果:静的な環境における精度
最小限の近隣ノードの情報しか用いていないにもかかわらず、既存手法と同程度の精度を達成することに成功している
2012/5/24
2012/5/24ITRC meet3117
シミュレーション結果:ノードの移動速度が精度に与える影響
動的な環境であっても既存手法よりも高い精度を維持できている
2012/5/24ITRC meet3118
シミュレーション結果:クラスタ更新の間隔を変化させた時の効率性と精度の関係
効率性と精度のトレードオフを考慮することで、 SBDC の有効
性が明らかになる
SDC はクラスタ更新の間隔を短かくすることで精度を向上させることができるが膨大な量の
メッセージ交換が発生するCDC は非常に単純なクラスタ更新の手法を用いているため、
精度は高くない
ITRC meet3119
シミュレーション結果:ノードの移動速度がクラスタの大きさに与える影響
2012/5/24
CDC は大きなクラスタを形成
SDC は孤立ノードが増加し、クラスタサイズも小さくなる
SBDC のクラスタサイズはトポロジ変化の頻度にそれほど影響され
ない
ITRC meet3120
シミュレーション結果:ノードの移動速度がクラスタの安定性に与える影響
2012/5/24
SBDC は比較的安定したクラスタを形成
接続性に基づくクラスタリングのアプリケーションにとって好ましい性
質
2012/5/24ITRC meet3121
まとめと今後の課題
動的な環境に適した分散クラスタリング手法 SBDC (Schelling-Based Distributed Clustering) を提案– 最小限の近隣ノードの情報でクラスタを構築
シミュレーションにより SBDC の有効性を評価→ 動的な環境で SBDC は既存手法を上まわる性能
を発揮することを確認 今後の課題
– ネットワークのダイナミクスに応じて制御の複雑さを適応的に切り替える機構の検討
ITRC meet3122 2012/5/24
ITRC meet3123 2011/11/18情報ネットワーク研究会23
モジュラリティ
全てのリンクのうちクラスタ i のノード同士をつ
なぐリンクの割合
全てのリンクのうちクラスタ i に属するノードの有するリンクの割合
2012/5/24
2012/5/24ITRC meet3124
シミュレーション結果:クラスタ更新の間隔が効率性と精度に与える影響
SBDC は良い精度を実現できるにもかかわらず SDC と比べて効率的である
ITRC meet3125
静的な環境における精度
2012/5/24
2012/5/24ITRC meet3126
基本的なアイディア
最小限の近隣ノードの情報のみでクラスタを形成 シェリングモデルと呼ばれる社会モデルを応用
– 人種間の分居現象を説明した社会モデルを応用– 最小限の近隣の人の情報に基づき各人が移動するこ
とで人のグループが形成されるという性質を利用
空き地ノード:シェリングモデルの空きセルに相当 通常ノード:シェリングモデルのエージェントに相当 色属性 ( この例では 3 色のいずれかの色 ) を持つ
2012/5/24ITRC meet3127
動作の概要:初期化
確率 p で空き地ノードになる
確率 1-p で通常ノードとなり、自身の色を
決定
2012/5/24ITRC meet3128
動作の概要:隣接ノードの情報収集隣接ノードの色および、隣接ノードのリス
トを問い合わせる
2012/5/24ITRC meet3129
動作の概要:隣接ノードの類似度の計算
接続性を考慮するため媒介中心性の推定値を用いて類似度を計
算
媒介中心性:全最短経路のうち、そのリンクを通る経路の割 合媒介中心性の高いリンク:クラスタの境界になりやすい
ノードの動作を決定するため、隣接ノードの類似度を計算
基本的な考え:同じ色のノードは類似度が高い
迂回路が存在しないので最短経路が多数通る
2 ホップの範囲のサブネットワークから媒介中心性を推定
14
6
隣接ノードの平均類似度 :6/20=0.3
2012/5/24ITRC meet3130
動作の概要:許容水準と隣接ノードの類似度の比較
隣接ノードの平均類似度 0.3 が許容水準 0.5 を下回っているた
め、空き地を探して移動する
許容水準 ( 移動するかしないかを決める類似度の閾値 ) :0.5
2012/5/24ITRC meet3131
動作の概要:空き地ノードの探索と色の交換
深さ優先探索で空き地を探して、色を交換
ITRC meet3132 2011/11/18情報ネットワーク研究会32
動作の概要:空き地ノードの探索と色の交換
深さ優先探索で空き地を探して、色を交換
この動作を各ノードが自律分散で行う
2012/5/24
2012/5/24ITRC meet3133
動作の概要:クラスタの決定
各ノードは隣接する同色のノードを同じクラスタと判
定
空き地ノードは隣接ノードの中で最も多い色と同じクラスタと判定
2012/3/28CIF 201234
Cluster update interval vs. Message cost and Modularity score
Simulation time vs. Modularity score
2012/3/28CIF 201235
Number of nodes vs. Modularity score in dynamic environment
2012/3/28CIF 201236
Cluster size
2012/3/28CIF 201237
Coefficient of variation of cluster size
2012/3/28CIF 201238
Number of orphan nodes
2012/3/28CIF 201239
Stability
2012/3/28CIF 201240
Application-level performance
2012/3/28CIF 201241
Tolerance vs. Modularity
2012/3/28CIF 201242
Node color vs. Modularity score
2012/3/28CIF 201243
44 2012/3/28CIF 2012