yamauchi b

仮想ロボットにおける身体拡張に関する研究

Effects of Body Extension in Virtual Robots

北海道大学工学部情報工学コース

複雑系工学講座調和系工学研究室学部4年

山内翔

研究背景ロボットにおける身体拡張

• ロボットにおいて身体拡張がどのような効果をもたらすか、

多くの研究がなされている

西出俊, 中川達裕, 尾形哲也, 谷淳, 高橋徹, 奥乃博, "二次リカレントニューラルネットワークを用いた道具身体化モデルの構築", 日本ロボット学会第27 回学術講演会, 2009.

Mai Hikita, Sawa Fuke, Masaki Ogino and Minoru Asada,"Cross-modal body representation based on visual attention by saliency",Proc.IROS,pp.2041-2046,2008.

Cota Nabeshima, Yasuo Kuniyoshi and Max Lungarella, "Towards a Model for Tool- Body Assimilation and Adaptive Tool-Use", Proc.ICDL, pp288-293, 2007.

Rolf Pfeifer, Fumiya Iida, Gabriel Gomez,“Morphological computation for adaptive behavior and cognition”, International Congress Series 1291, 2006.

研究目的ロボットにおける身体拡張と行動ルールの関係

• ロボットにおいて身体拡張はどのような効果をもたらすか – ロボット相撲をテーマに身体拡張の効果を調べる

車両ロボット

車両ロボットの

押し相撲ゲームを採用

多様な対戦相手の設定が可能

接触（身体構造）が影響

単純な移動のみに基づく戦略

全探索可能なパターン数

拡張部熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

シミュレーション実験シミュレーションを支える物理演算エンジン

・シミュレーション空間 ―物理法則が成立する空間を再現

物理演算エンジンの導入

様々な物理演算エンジン Bullet Physics Library

―オープンソースであり、移植性も高い ―商用製品への利用実績多数 ―活発なコミュニティによる迅速なアップデート

シミュレーション実験実験で用いる車両ロボット

・車両ロボットーDifferential Drive ー剛体の接続が可能

4 4

10

5

2.7

2.7

VL

VR

VL =VR

VL >VR

VL <VR

直進

VR = -VL,VR > 0

右折

左折

反時計回りの回転

Differential Drive

左右の車輪の速度差でコントロール

シミュレーション上での表示

シミュレーション実験車両ロボットと剛体の接続

ブルドーザー

三角柱

棒

2

20

2

2

30°

30°

10

10

10

0.1

10 5 5

5

6

8

8

剛体の接続

Body Ext.

Body :Ext. = 10 :3

重量比

ロボットの身体構造を変化させる

剛体の接続

表面積:168

表面積:300

表面積:164

シミュレーション実験ロボットの行動ルール

4種の動作

回転

中央へ停止

VL

VR

q

VL =VR

VL <VR

VL >VR

ì

íï

îïï

VL =VR

VL <VR

VL >VR

ì

íï

îïï

VR = -VL,VR > 0

VL =VR = 0

j

中央

p

16<q £ p

æ

èç

ö

ø÷

-p

16£q £

p

16

æ

èç

ö

ø÷

-p <q < -p

16

æ

èç

ö

ø÷

-p

16£j £

p

16

æ

èç

ö

ø÷

-p <j < -p

16

æ

èç

ö

ø÷

p

16<j £ p

æ

èç

ö

ø÷

相手の距離を3段階で評価

距離毎の

動作を決定

ロボットの行動ルール

（１）相手の方向（θ）及び相手の中央からの距離を3段階（）（２）自分から見た中央の方向（φ）

攻撃

センサ

1R 2R 3R

321 ,, RRR

シミュレーション実験ロボットの行動ルール例

1R

2R

3R 中央へ

攻撃攻撃回転

回転

停止

中央へ

中央へ

中央へ

中央へ

中央へ

攻撃

1R 2R 3R

相手の拡張部


1R

2R

3R 中央へ

攻撃攻撃回転

回転

停止

中央へ

中央へ

中央へ

中央へ

中央へ

攻撃

1R 2R 3R

相手の拡張部

相手の拡張部と


1R

2R

3R 中央へ

攻撃攻撃回転

回転

停止

中央へ

中央へ

中央へ

中央へ

中央へ

攻撃

1R 2R 3R

相手の拡張部

相手の中央からの距離に応じて

行動が決まる

シミュレーション実験今回の実験

取りうる全ての行動ルール

今回の実験

種類のロボット 25644

対戦



今回の実験


対戦

３段階の距離に応じた動作

４種類の拡張状態

34

25644



今回の実験


対戦

各組み合わせ毎の勝率を分析する



今回の実験


対戦

こちら側の行動ルールは固定



今回の実験


対戦

こちら側の行動ルールは固定

この実験によりどの拡張部が性能を上げるか議論する

シミュレーション実験 GAによる行動ルールの探索

個体数 50 世代数 200 ルーレット方式

2点交叉

相手としてランダムに拡張部・行動ルールが

決まる相手50体

トータル勝利数が適応度

GAの設定

拡張部ごとに最も良い個体を

選ぶ

より良い行動ルールを探索

ランダムな50体

それぞれの拡張部の相手と競う

遺伝子型近中遠相手が中央からどの程度の

距離にいるか

という情報をもとにしたルールテーブルを表す

シミュレーション実験 GAによる行動ルールの探索

個体数 50 世代数 200 ルーレット方式

2点交叉

相手としてランダムに拡張部・行動ルールが

決まる相手50体

トータル勝利数が適応度

GAの設定

拡張部ごとに最も良い個体を

選ぶ

より良い行動ルールを探索

ランダムな50体

それぞれの拡張部の相手と競う

遺伝子型近中遠相手が中央からどの程度の

距離にいるか

という情報をもとにしたルールテーブルを表す

以降これらをGAロボットと呼ぶ

シミュレーション実験実験の目的





勝率向上






勝率向上

GAロボット

すべての行動ルールパターン

今何を表すか






勝率向上

GAロボット


今何を表すか

これら二つの観点から勝敗の結果を考察する

シミュレーション実験勝敗の結果

0.84375 0.34375 0.515625 0.59375

0.78125 0.25 0.828125 0.671875

0.96875 0.828125 0.234375 0.828125

0.953125 0.6875 0.890625 0.828125

G A

ロボット


勝率

シミュレーション実験勝敗の結果

0.84375 0.34375 0.515625 0.59375

0.78125 0.25 0.828125 0.671875

0.96875 0.828125 0.234375 0.828125

0.953125 0.6875 0.890625 0.828125


GAロボット側を主軸に結果を考察

G A

ロボット

シミュレーション実験 GAロボット側から見た勝率

0.84375 0.34375 0.515625 0.59375

0.78125 0.25 0.828125 0.671875

0.96875 0.828125 0.234375 0.828125

0.953125 0.6875 0.890625 0.828125


トータル勝率

0.57421875

0.6328125

0.71484375

0.83984375

G A

ロボット

シミュレーション実験 GAロボット側から見た勝率

0.84375 0.34375 0.515625 0.59375

0.78125 0.25 0.828125 0.671875

0.96875 0.828125 0.234375 0.828125

0.953125 0.6875 0.890625 0.828125


トータル勝率

0.57421875

0.6328125

0.71484375

0.83984375

勝率の順序 > > >

G A

ロボット

シミュレーション実験 GAロボット側からから見た勝率

0.84375 0.34375 0.515625 0.59375

0.78125 0.25 0.828125 0.671875

0.96875 0.828125 0.234375 0.828125

0.953125 0.6875 0.890625 0.828125


トータル勝率

0.57421875

0.6328125

0.71484375

0.83984375

強さの順序 > > >

何も拡張されていないロボットが最も勝率が高い、という

結果

G A

ロボット






勝率向上

GAロボット


今何を表すか

シミュレーション実験 GAロボット側からから見た勝率

0.84375 0.34375 0.515625 0.59375

0.78125 0.25 0.828125 0.671875

0.96875 0.828125 0.234375 0.828125

0.953125 0.6875 0.890625 0.828125


勝率を反転

G A

ロボット

シミュレーション実験すべての行動ルールパターン側から見た勝率

0.15625 0.65625 0.484375 0.40625

0.21875 0.75 0.171875 0.328125

0.03125 0.171875 0.765625 0.171875

0.046875 0.3125 0.109375 0.171875


G A

ロボット


0.15625 0.65625 0.484375 0.40625

0.21875 0.75 0.171875 0.328125

0.03125 0.171875 0.765625 0.171875

0.046875 0.3125 0.109375 0.171875

すべての行動ルールパターンすべての行動ルールパター

ン側を主軸に結果を考察

G A

ロボット


0.15625 0.65625 0.484375 0.40625

0.21875 0.75 0.171875 0.328125

0.03125 0.171875 0.765625 0.171875

0.046875 0.3125 0.109375 0.171875


トータル勝率

0.11328125 0.47265625 0.3828125 0.26953125

G A

ロボット

シミュレーション実験身体拡張と行動・行動ルールの関係

0.15625 0.65625 0.484375 0.40625

0.21875 0.75 0.171875 0.328125

0.03125 0.171875 0.765625 0.171875

0.046875 0.3125 0.109375 0.171875


トータル勝率

0.11328125 0.47265625 0.3828125 0.26953125


G A

ロボット

シミュレーション実験身体拡張と行動・行動ルールの関係

0.15625 0.65625 0.484375 0.40625

0.21875 0.75 0.171875 0.328125

0.03125 0.171875 0.765625 0.171875

0.046875 0.3125 0.109375 0.171875


トータル勝率

0.11328125 0.47265625 0.3828125 0.26953125


GAロボット側とは異なる結果

この見方は何を意味するか？

勝率を高める働きをする拡張部が変化

G A

ロボット

結果の分析２つの分析





勝率向上

GAロボット


今何を表すか







勝率向上

GAロボット

すべての

行動ルールパターン

今何を表すか


なぜこの差が生まれるか？






勝率向上

GAロボット

すべての


今何を表すか



軌道の分析






勝率向上

GAロボット

すべての


今何を表すか



軌道の分析

接触時間の分析

拡張部別の相手の行動パターンの比較拡張部別の相手の行動パターン

・移動の軌跡による分類

移動の軌跡を取得

クラスター１

クラスター２

クラスター３

クラスター４

K-means法により

４つのクラスターに分類

取りうる全パターンの相手に対して取得

GAロボットの軌道




クラスター１

クラスター２

クラスター３

クラスター４

K-means法により



ゲーム開始から終了までの

X座標とZ座標





クラスター１

クラスター２

クラスター３

クラスター４

K-means法により



ゲーム開始から終了までの

X座標とZ座標

相手（GAロボット側）にゲーム中どのような軌道を取らせたか、というデータにどのような特徴が現れるか？


拡張部別の相手の行動パターンの比較拡張部別の相手の行動パターン-結果-


0

50

100

150

200

250

1 2 3 4

該当する試合数

クラスター

棒

ブルドーザー

三角柱

拡張部なし




0

50

100

150

200

250

1 2 3 4


クラスター

棒

ブルドーザー

三角柱

拡張部なし


各クラスターに満遍なく存在



0

50

100

150

200

250

1 2 3 4


クラスター

棒

ブルドーザー

三角柱

拡張部なし


各クラスターに満遍なく存在

相手に様々な動きをさせている



0

50

100

150

200

250

1 2 3 4


クラスター

棒

ブルドーザー

三角柱

拡張部なし


分類されるクラスターに偏りがある


0

50

100

150

200

250

1 2 3 4


クラスター

棒

ブルドーザー

三角柱

拡張部なし


分類されるクラスターに偏りがある

相手に動きのパターンが似通っている

拡張部別の身体利用の比較拡張部別の身体利用

・部位別に相手との接触を計測

接触時間を計測

拡張部への接触

ボディへの接触２パターンに分類

拡張部ごとに接触時間にどのような差異が現れるか？拡張部がない場合との差は？

拡張部別の身体利用の比較拡張部別の身体利用-結果-

拡張部の表面積 300 168 164

0

50

100

150

200

250

300

350

400

ブルドーザー三角柱拡張部なし棒

相手との接触時間の平均

拡張部

ボディ

> > >勝率の順序

0


拡張部の表面積 300 168 164

0

50

100

150

200

250

300

350

400



拡張部

ボディ


0

拡張部接触の時間は表面積に比例しない


拡張部の表面積 300 168 164

0

50

100

150

200

250

300

350

400



拡張部

ボディ


0

拡張部なしの場合との差から表面積あたりの増加率を求める



拡張部の表面積 300 168 164

0

50

100

150

200

250

300

350

400



拡張部

ボディ


0

拡張部なしの場合との差から単位表面積あたりの増加率を求

める

ブルドーザー三角柱棒

単位表面積あたりの増加率

+14.435％ -6.217％ -69.6337%



拡張部の表面積 300 168 164

0

50

100

150

200

250

300

350

400



拡張部

ボディ


0

拡張部なしの場合との差から表面積あたりの増加率を求める

ブルドーザー三角柱棒

単位表面積あたりの増加率

+14.435％ -6.217％ -69.6337%


増加率の大小関係が拡張部なしを除いた強さの順序に一致する

まとめ





勝率向上

まとめ





勝率向上

> > >


強さの順序

まとめ





勝率向上

> > >


強さの順序

・拡張部には特定の行動ルールの勝率を向上させる働きをするものと行動ルールに依らず平均的に勝率を向上させるものがあることを示した・相手に様々な動きをさせる、身体を効率的に利用する、といった要素によりこれらの性質が生まれていることを示した

yamauchi b

Documents

Transcript of yamauchi b