yamauchi b
-
Upload
harmonylab -
Category
Documents
-
view
146 -
download
4
Transcript of yamauchi b
仮想ロボットにおける身体拡張に関する研究
Effects of Body Extension in Virtual Robots
北海道大学 工学部 情報工学コース
複雑系工学講座 調和系工学研究室 学部4年
山内翔
研究背景 ロボットにおける身体拡張
• ロボットにおいて身体拡張がどのような効果をもたらすか、
多くの研究がなされている
西出俊, 中川達裕, 尾形哲也, 谷淳, 高橋徹, 奥乃博, "二次リカレントニューラルネットワークを用いた 道具身体化モデルの構築", 日本ロボット学会第27 回学術講演会, 2009.
Mai Hikita, Sawa Fuke, Masaki Ogino and Minoru Asada,"Cross-modal body representation based on visual attention by saliency",Proc.IROS,pp.2041-2046,2008.
Cota Nabeshima, Yasuo Kuniyoshi and Max Lungarella, "Towards a Model for Tool- Body Assimilation and Adaptive Tool-Use", Proc.ICDL, pp288-293, 2007.
Rolf Pfeifer, Fumiya Iida, Gabriel Gomez,“Morphological computation for adaptive behavior and cognition”, International Congress Series 1291, 2006.
研究目的 ロボットにおける身体拡張と行動ルールの関係
• ロボットにおいて身体拡張はどのような効果をもたらすか – ロボット相撲をテーマに身体拡張の効果を調べる
車両ロボット
車両ロボット の
押し相撲ゲームを採用
多様な対戦相手の設定が可能
接触(身体構造)が影響
単純な移動のみに基づく戦略
全探索可能なパターン数
拡張部 熟達した者がより強くなる
特定の行動ルールにおいて
行動ルールに依らず強くなりやすい
複数の行動ルールにおいて
勝率向上
シミュレーション実験 シミュレーションを支える物理演算エンジン
・シミュレーション空間 ―物理法則が成立する空間を再現
物理演算エンジンの 導入
様々な物理演算エンジン Bullet Physics Library
―オープンソースであり、移植性も高い ―商用製品への利用実績多数 ―活発なコミュニティによる 迅速なアップデート
シミュレーション実験 実験で用いる車両ロボット
・車両ロボット ーDifferential Drive ー剛体の接続が可能
4 4
10
5
2.7
2.7
VL
VR
VL =VR
VL >VR
VL <VR
直進
VR = -VL,VR > 0
右折
左折
反時計回りの回転
Differential Drive
左右の車輪の速度差でコントロール
シミュレーション上での表示
シミュレーション実験 車両ロボットと剛体の接続
ブルドーザー
三角柱
棒
2
20
2
2
30°
30°
10
10
10
0.1
10 5 5
5
6
8
8
剛体の接続
Body Ext.
Body :Ext. = 10 :3
重量比
ロボットの身体構造を変化させる
剛体の接続
表面積:168
表面積:300
表面積:164
シミュレーション実験 ロボットの行動ルール
4種の動作
回転
中央へ 停止
VL
VR
q
VL =VR
VL <VR
VL >VR
ì
íï
îïï
VL =VR
VL <VR
VL >VR
ì
íï
îïï
VR = -VL,VR > 0
VL =VR = 0
j
中央
p
16<q £ p
æ
èç
ö
ø÷
-p
16£q £
p
16
æ
èç
ö
ø÷
-p <q < -p
16
æ
èç
ö
ø÷
-p
16£j £
p
16
æ
èç
ö
ø÷
-p <j < -p
16
æ
èç
ö
ø÷
p
16<j £ p
æ
èç
ö
ø÷
相手の距離を3段階で評価
距離毎 の
動作を決定
ロボットの 行動ルール
(1)相手の方向(θ)及び相手の中央からの距離を3段階( ) (2)自分から見た中央の方向(φ)
攻撃
センサ
1R 2R 3R
321 ,, RRR
シミュレーション実験 ロボットの行動ルール例
1R
2R
3R 中央へ
攻撃 攻撃 回転
回転
停止
中央へ
中央へ
中央へ
中央へ
中央へ
攻撃
1R 2R 3R
相手の拡張部
シミュレーション実験 ロボットの行動ルール例
1R
2R
3R 中央へ
攻撃 攻撃 回転
回転
停止
中央へ
中央へ
中央へ
中央へ
中央へ
攻撃
1R 2R 3R
相手の拡張部
相手の 拡張部と
シミュレーション実験 ロボットの行動ルール例
1R
2R
3R 中央へ
攻撃 攻撃 回転
回転
停止
中央へ
中央へ
中央へ
中央へ
中央へ
攻撃
1R 2R 3R
相手の拡張部
相手の 中央からの距離に応じて
行動が決まる
シミュレーション実験 今回の実験
取りうる全ての行動ルール
今回の実験
種類のロボット 25644
対戦
シミュレーション実験 今回の実験
取りうる全ての行動ルール
今回の実験
種類のロボット 25644
対戦
3段階の距離に応じた動作
4種類の拡張状態
34
25644
シミュレーション実験 今回の実験
取りうる全ての行動ルール
今回の実験
種類のロボット 25644
対戦
各組み合わせ毎の 勝率を分析する
シミュレーション実験 今回の実験
取りうる全ての行動ルール
今回の実験
種類のロボット 25644
対戦
こちら側の行動ルールは 固定
シミュレーション実験 今回の実験
取りうる全ての行動ルール
今回の実験
種類のロボット 25644
対戦
こちら側の行動ルールは 固定
この実験により どの拡張部が性能を上げるか議論する
シミュレーション実験 GAによる行動ルールの探索
個体数 50 世代数 200 ルーレット方式
2点交叉
相手として ランダムに拡張部・行動ルールが
決まる相手50体
トータル勝利数が適応度
GAの設定
拡張部ごとに 最も良い個体を
選ぶ
より良い行動ルールを探索
ランダムな50体
それぞれの 拡張部の 相手と競う
遺伝子型 近 中 遠 相手が中央からどの程度の
距離にいるか
という情報をもとにしたルールテーブルを表す
シミュレーション実験 GAによる行動ルールの探索
個体数 50 世代数 200 ルーレット方式
2点交叉
相手として ランダムに拡張部・行動ルールが
決まる相手50体
トータル勝利数が適応度
GAの設定
拡張部ごとに 最も良い個体を
選ぶ
より良い行動ルールを探索
ランダムな50体
それぞれの 拡張部の 相手と競う
遺伝子型 近 中 遠 相手が中央からどの程度の
距離にいるか
という情報をもとにしたルールテーブルを表す
以降これらをGAロボットと呼ぶ
シミュレーション実験 実験の目的
拡張部 熟達した者がより強くなる
特定の行動ルールにおいて
行動ルールに依らず強くなりやすい
複数の行動ルールにおいて
勝率向上
シミュレーション実験 実験の目的
拡張部 熟達した者がより強くなる
特定の行動ルールにおいて
行動ルールに依らず強くなりやすい
複数の行動ルールにおいて
勝率向上
GAロボット
すべての 行動ルール パターン
今何を表すか
シミュレーション実験 実験の目的
拡張部 熟達した者がより強くなる
特定の行動ルールにおいて
行動ルールに依らず強くなりやすい
複数の行動ルールにおいて
勝率向上
GAロボット
すべての 行動ルール パターン
今何を表すか
これら二つの観点から勝敗の結果を考察する
シミュレーション実験 勝敗の結果
0.84375 0.34375 0.515625 0.59375
0.78125 0.25 0.828125 0.671875
0.96875 0.828125 0.234375 0.828125
0.953125 0.6875 0.890625 0.828125
G A
ロボッ ト
すべての行動ルールパターン
勝率
シミュレーション実験 勝敗の結果
0.84375 0.34375 0.515625 0.59375
0.78125 0.25 0.828125 0.671875
0.96875 0.828125 0.234375 0.828125
0.953125 0.6875 0.890625 0.828125
すべての行動ルールパターン
GAロボット側を 主軸に結果を考察
G A
ロボッ ト
シミュレーション実験 GAロボット側から見た勝率
0.84375 0.34375 0.515625 0.59375
0.78125 0.25 0.828125 0.671875
0.96875 0.828125 0.234375 0.828125
0.953125 0.6875 0.890625 0.828125
すべての行動ルールパターン
トータル 勝率
0.57421875
0.6328125
0.71484375
0.83984375
G A
ロボッ ト
シミュレーション実験 GAロボット側から見た勝率
0.84375 0.34375 0.515625 0.59375
0.78125 0.25 0.828125 0.671875
0.96875 0.828125 0.234375 0.828125
0.953125 0.6875 0.890625 0.828125
すべての行動ルールパターン
トータル 勝率
0.57421875
0.6328125
0.71484375
0.83984375
勝率の順序 > > >
G A
ロボッ ト
シミュレーション実験 GAロボット側からから見た勝率
0.84375 0.34375 0.515625 0.59375
0.78125 0.25 0.828125 0.671875
0.96875 0.828125 0.234375 0.828125
0.953125 0.6875 0.890625 0.828125
すべての行動ルールパターン
トータル 勝率
0.57421875
0.6328125
0.71484375
0.83984375
強さの順序 > > >
何も拡張されていない ロボットが最も勝率が高い、という
結果
G A
ロボッ ト
シミュレーション実験 実験の目的
拡張部 熟達した者がより強くなる
特定の行動ルールにおいて
行動ルールに依らず強くなりやすい
複数の行動ルールにおいて
勝率向上
GAロボット
すべての 行動ルール パターン
今何を表すか
シミュレーション実験 GAロボット側からから見た勝率
0.84375 0.34375 0.515625 0.59375
0.78125 0.25 0.828125 0.671875
0.96875 0.828125 0.234375 0.828125
0.953125 0.6875 0.890625 0.828125
すべての行動ルールパターン
勝率を反転
G A
ロボッ ト
シミュレーション実験 すべての行動ルールパターン側から見た勝率
0.15625 0.65625 0.484375 0.40625
0.21875 0.75 0.171875 0.328125
0.03125 0.171875 0.765625 0.171875
0.046875 0.3125 0.109375 0.171875
すべての行動ルールパターン
G A
ロボッ ト
シミュレーション実験 すべての行動ルールパターン側から見た勝率
0.15625 0.65625 0.484375 0.40625
0.21875 0.75 0.171875 0.328125
0.03125 0.171875 0.765625 0.171875
0.046875 0.3125 0.109375 0.171875
すべての行動ルールパターン すべての行動ルールパター
ン側を 主軸に結果を考察
G A
ロボッ ト
シミュレーション実験 すべての行動ルールパターン側から見た勝率
0.15625 0.65625 0.484375 0.40625
0.21875 0.75 0.171875 0.328125
0.03125 0.171875 0.765625 0.171875
0.046875 0.3125 0.109375 0.171875
すべての行動ルールパターン
トータル 勝率
0.11328125 0.47265625 0.3828125 0.26953125
G A
ロボッ ト
シミュレーション実験 身体拡張と行動・行動ルールの関係
0.15625 0.65625 0.484375 0.40625
0.21875 0.75 0.171875 0.328125
0.03125 0.171875 0.765625 0.171875
0.046875 0.3125 0.109375 0.171875
すべての行動ルールパターン
トータル 勝率
0.11328125 0.47265625 0.3828125 0.26953125
勝率の順序 > > >
G A
ロボッ ト
シミュレーション実験 身体拡張と行動・行動ルールの関係
0.15625 0.65625 0.484375 0.40625
0.21875 0.75 0.171875 0.328125
0.03125 0.171875 0.765625 0.171875
0.046875 0.3125 0.109375 0.171875
すべての行動ルールパターン
トータル 勝率
0.11328125 0.47265625 0.3828125 0.26953125
勝率の順序 > > >
GAロボット側とは異なる結果
この見方は何を意味するか?
勝率を高める働きをする 拡張部が変化
G A
ロボッ ト
結果の分析 2つの分析
拡張部 熟達した者がより強くなる
特定の行動ルールにおいて
行動ルールに依らず強くなりやすい
複数の行動ルールにおいて
勝率向上
GAロボット
すべての 行動ルール パターン
今何を表すか
勝率の順序 > > >
結果の分析 2つの分析
拡張部 熟達した者がより強くなる
特定の行動ルールにおいて
行動ルールに依らず強くなりやすい
複数の行動ルールにおいて
勝率向上
GAロボット
すべての
行動ルールパターン
今何を表すか
勝率の順序 > > >
なぜこの差が生まれるか?
結果の分析 2つの分析
拡張部 熟達した者がより強くなる
特定の行動ルールにおいて
行動ルールに依らず強くなりやすい
複数の行動ルールにおいて
勝率向上
GAロボット
すべての
行動ルールパターン
今何を表すか
勝率の順序 > > >
なぜこの差が生まれるか?
軌道の分析
結果の分析 2つの分析
拡張部 熟達した者がより強くなる
特定の行動ルールにおいて
行動ルールに依らず強くなりやすい
複数の行動ルールにおいて
勝率向上
GAロボット
すべての
行動ルールパターン
今何を表すか
勝率の順序 > > >
なぜこの差が生まれるか?
軌道の分析
接触時間の分析
拡張部別の相手の行動パターンの比較 拡張部別の相手の行動パターン
・移動の軌跡による分類
移動の軌跡を取得
クラスター1
クラスター2
クラスター3
クラスター4
K-means法により
4つのクラスターに分類
取りうる全パターンの 相手に対して取得
GAロボットの軌道
拡張部別の相手の行動パターンの比較 拡張部別の相手の行動パターン
・移動の軌跡による分類
移動の軌跡を取得
クラスター1
クラスター2
クラスター3
クラスター4
K-means法により
4つのクラスターに分類
取りうる全パターンの 相手に対して取得
ゲーム開始から終了までの
X座標とZ座標
GAロボットの軌道
拡張部別の相手の行動パターンの比較 拡張部別の相手の行動パターン
・移動の軌跡による分類
移動の軌跡を取得
クラスター1
クラスター2
クラスター3
クラスター4
K-means法により
4つのクラスターに分類
取りうる全パターンの 相手に対して取得
ゲーム開始から終了までの
X座標とZ座標
相手(GAロボット側)に ゲーム中どのような軌道を取らせたか、という データにどのような特徴が現れるか?
GAロボットの軌道
拡張部別の相手の行動パターンの比較 拡張部別の相手の行動パターン-結果-
・移動の軌跡による分類
0
50
100
150
200
250
1 2 3 4
該当する試合数
クラスター
棒
ブルドーザー
三角柱
拡張部なし
勝率の順序 > > >
拡張部別の相手の行動パターンの比較 拡張部別の相手の行動パターン-結果-
・移動の軌跡による分類
0
50
100
150
200
250
1 2 3 4
該当する試合数
クラスター
棒
ブルドーザー
三角柱
拡張部なし
勝率の順序 > > >
各クラスターに 満遍なく存在
拡張部別の相手の行動パターンの比較 拡張部別の相手の行動パターン-結果-
・移動の軌跡による分類
0
50
100
150
200
250
1 2 3 4
該当する試合数
クラスター
棒
ブルドーザー
三角柱
拡張部なし
勝率の順序 > > >
各クラスターに 満遍なく存在
相手に様々な動きをさせている
拡張部別の相手の行動パターンの比較 拡張部別の相手の行動パターン-結果-
・移動の軌跡による分類
0
50
100
150
200
250
1 2 3 4
該当する試合数
クラスター
棒
ブルドーザー
三角柱
拡張部なし
勝率の順序 > > >
分類されるクラスターに 偏りがある
拡張部別の相手の行動パターンの比較 拡張部別の相手の行動パターン-結果-
0
50
100
150
200
250
1 2 3 4
該当する試合数
クラスター
棒
ブルドーザー
三角柱
拡張部なし
勝率の順序 > > >
分類されるクラスターに 偏りがある
相手に動きのパターンが 似通っている
拡張部別の身体利用の比較 拡張部別の身体利用
・部位別に相手との接触を計測
接触時間を計測
拡張部への接触
ボディへの接触 2パターンに分類
拡張部ごとに接触時間にどのような差異が現れるか? 拡張部がない場合との差は?
拡張部別の身体利用の比較 拡張部別の身体利用-結果-
拡張部の表面積 300 168 164
0
50
100
150
200
250
300
350
400
ブルドーザー 三角柱 拡張部なし 棒
相手との接触時間の平均
拡張部
ボディ
> > >勝率の順序
0
拡張部別の身体利用の比較 拡張部別の身体利用-結果-
拡張部の表面積 300 168 164
0
50
100
150
200
250
300
350
400
ブルドーザー 三角柱 拡張部なし 棒
相手との接触時間の平均
拡張部
ボディ
> > >勝率の順序
0
拡張部接触の時間は 表面積に比例しない
拡張部別の身体利用の比較 拡張部別の身体利用-結果-
拡張部の表面積 300 168 164
0
50
100
150
200
250
300
350
400
ブルドーザー 三角柱 拡張部なし 棒
相手との接触時間の平均
拡張部
ボディ
> > >勝率の順序
0
拡張部接触の時間は 表面積に比例しない
拡張部別の身体利用の比較 拡張部別の身体利用-結果-
拡張部の表面積 300 168 164
0
50
100
150
200
250
300
350
400
ブルドーザー 三角柱 拡張部なし 棒
相手との接触時間の平均
拡張部
ボディ
> > >勝率の順序
0
拡張部なしの場合との差から表面積あたりの増加率を求める
拡張部接触の時間は 表面積に比例しない
拡張部別の身体利用の比較 拡張部別の身体利用-結果-
拡張部の表面積 300 168 164
0
50
100
150
200
250
300
350
400
ブルドーザー 三角柱 拡張部なし 棒
相手との接触時間の平均
拡張部
ボディ
> > >勝率の順序
0
拡張部なしの場合との差から単位表面積あたりの増加率を求
める
ブルドーザー 三角柱 棒
単位表面積あたりの 増加率
+14.435% -6.217% -69.6337%
拡張部接触の時間は 表面積に比例しない
拡張部別の身体利用の比較 拡張部別の身体利用-結果-
拡張部の表面積 300 168 164
0
50
100
150
200
250
300
350
400
ブルドーザー 三角柱 拡張部なし 棒
相手との接触時間の平均
拡張部
ボディ
> > >勝率の順序
0
拡張部なしの場合との差から表面積あたりの増加率を求める
ブルドーザー 三角柱 棒
単位表面積あたりの 増加率
+14.435% -6.217% -69.6337%
拡張部接触の時間は 表面積に比例しない
増加率の大小関係が 拡張部なしを除いた 強さの順序に 一致する
まとめ
拡張部 熟達した者がより強くなる
特定の行動ルールにおいて
行動ルールに依らず強くなりやすい
複数の行動ルールにおいて
勝率向上
まとめ
拡張部 熟達した者がより強くなる
特定の行動ルールにおいて
行動ルールに依らず強くなりやすい
複数の行動ルールにおいて
勝率向上
> > >
強さの順序 > > >
強さの順序
まとめ
拡張部 熟達した者がより強くなる
特定の行動ルールにおいて
行動ルールに依らず強くなりやすい
複数の行動ルールにおいて
勝率向上
> > >
強さの順序 > > >
強さの順序
・拡張部には特定の行動ルールの勝率を向上させる働きをするものと 行動ルールに依らず平均的に勝率を向上させるものがあることを示した ・相手に様々な動きをさせる、身体を効率的に利用する、といった 要素によりこれらの性質が生まれていることを示した