PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

41

PG - Q @shohu33

Upload
-
Category

Engineering
view
890
download
2

Embed Size (px):

Transcript of PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

Page 1: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

PG - Q@shohu33

Page 2: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

ATARI

Page 3: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

PG

PG

Page 4: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

(policy)

Page 5: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

PG

PG

Page 6: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

PG

Q

( ) ( or

) (

) Q

Page 7: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

"Q-Learning Tutorial". Mnemosyne Studio. http://mnemstudio.org/path-finding-q-learning-tutorial.htm

Page 8: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

6

5

Page 9: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

1. (Gamma)

2. Q 0

3. :

3.1

3.2 5 :

3.2.1

3.2.2

3.2.3 Q

Q(state, action) = R(state, action) + Gamma * Max[Q(next state, all actions)]* Q

3.2.4

3.2.5 5

3.3

Page 10: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

Page 11: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

1. (Gamma)

Page 12: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

(Gamma) 0 1

0 ( )

0.8

Page 13: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

[ ]

Page 14: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

100

Page 15: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

Page 16: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

2. Q( ) 0

Page 17: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

0

1 5

100

Q( )

0( )

Page 18: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

Page 19: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

3.1

Page 20: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

RANDOM

Page 21: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

3.2 5

Page 22: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

3.2.1

Page 23: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

3 5

Page 24: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

3.2.2

Page 25: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

5

Page 26: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

3.2.3 Q

Q(state, action) = R(state, action) + Gamma * Max[Q(next state, all actions)]

Page 27: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

今回、部屋1 から部屋5 に移動する⾏動を選んだので

Q

state=1, action=5, Gamma=0.8, next state=5, all actions = 1,4,5

Q

Page 28: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

Q

Q

5

1,4,5

Q

Page 29: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

3.2.4

Page 30: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

5

Page 31: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

3.2.6 5

Page 32: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

5

Page 33: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

3.3

Page 34: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

3.1

Page 35: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

31

Q(state, action) = R(state, action) + Gamma * Max[Q(next state, all actions)]

Q(3, 1) = R(3, 1) + 0.8 * Max[Q(1, 3), Q(1, 5)] = 0 + 0.8 * Max(0, 100) = 80

1

Page 36: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

Page 37: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

1 55

5 Q(state, action) = R(state, action) + Gamma * Max[Q(next state, all actions)]

Q(1, 5) = R(1, 5) + 0.8 * Max[Q(5, 1), Q(5, 4), Q(5, 5)] = 100 + 0.8 * Max(0, 0, 0) = 100

Q

Page 38: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

Page 39: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

Q

Q

2Q 2 → 3 → 1 → 5

OR

2 → 3 → 4 → 5

5

Page 40: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

Q

Page 41: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

Q

教育実習を終えて - 学校法人行吉学園...教育実習を終えて

教育実習を終えて - 学校法人行吉学園...教育実習を終えて

Deep Learningを用いた効率的な特許調査 - msi.co.jp · 学習実行パラメータを調整可能学習したモデルを保存学習用データ学習済モデル

Deep Learningを用いた効率的な特許調査 - msi.co.jp · 学習実行パラメータを調整可能学習したモデルを保存学習用データ学習済モデル

家庭学習の手引き家庭を学びの環境に家庭を学びの環境に · 家庭学習の提案をすすんで学ぶ力・家庭学習の習慣化を目指して家庭教育を見直し、各家庭の事情に合わせた内容や

家庭学習の手引き家庭を学びの環境に家庭を学びの環境に · 家庭学習の提案をすすんで学ぶ力・家庭学習の習慣化を目指して家庭教育を見直し、各家庭の事情に合わせた内容や

ソーシャルメディア分析サービスにおけるNLP技術の活⽤と近 … · 深層学習を含む機械学習 2005年 2019年深層学習を含む機械学習 Øスパム推定

ソーシャルメディア分析サービスにおけるNLP技術の活⽤と近 … · 深層学習を含む機械学習 2005年 2019年深層学習を含む機械学習 Øスパム推定

Pythonで機械学習を自動化 auto sklearn

Pythonで機械学習を自動化 auto sklearn

母性看護学実習 - 東海大学...母性看護学実習では、褥婦実習（産婦実習を含む）、妊婦実習、NICU実習を行う。詳細のスケジュールについては、別紙参照のこと。

母性看護学実習 - 東海大学...母性看護学実習では、褥婦実習（産婦実習を含む）、妊婦実習、NICU実習を行う。詳細のスケジュールについては、別紙参照のこと。

大学における映画を活用した授業の特徴 · 行研究を検討し、映画を教材とした授業のコンセプトとして学生中心の学習、経験学習、反省的学習、問題解決学習の4つを挙げている。

大学における映画を活用した授業の特徴 · 行研究を検討し、映画を教材とした授業のコンセプトとして学生中心の学習、経験学習、反省的学習、問題解決学習の4つを挙げている。

機械学習を適用したボイラデジタルツイン,三菱重工技報 Vol.55 … · 機械学習を大きく分けると，教師あり学習・教師なし学習・強化学習

機械学習を適用したボイラデジタルツイン,三菱重工技報 Vol.55 … · 機械学習を大きく分けると，教師あり学習・教師なし学習・強化学習

親を学び伝える学習プログラム2 プドキドキを楽しもう！1 ワクワクを楽しもう！親を学び伝える学習プログラム 3 イキ

親を学び伝える学習プログラム2 プドキドキを楽しもう！1 ワクワクを楽しもう！親を学び伝える学習プログラム 3 イキ

情報機器等を効果的に活用する中学校数学の学習...解を深めていく学習，生徒が実際にデータを集め処理する学習など，作業的・体験的な活動を取り入れ

情報機器等を効果的に活用する中学校数学の学習...解を深めていく学習，生徒が実際にデータを集め処理する学習など，作業的・体験的な活動を取り入れ

2019 年度看護学科第 4学年シラバス · ー・場所」の欄を確認の上、その指示に従ってください。 2. 事前学習・事後学習について. 単位修得は事前学習・事後学習を前提としています。各科目の事前学習・事後学習は.

2019 年度看護学科第 4学年シラバス · ー・場所」の欄を確認の上、その指示に従ってください。 2. 事前学習・事後学習について. 単位修得は事前学習・事後学習を前提としています。各科目の事前学習・事後学習は.

「自己調整学習能力を育む学習支援」概算プロジェクト概要と平 … · • リフレクションシートにある「振返分析」に注目し，学習者の学習の取

「自己調整学習能力を育む学習支援」概算プロジェクト概要と平 … · • リフレクションシートにある「振返分析」に注目し，学習者の学習の取

0519 01何故チーム学習をするか

0519 01何故チーム学習をするか

CALL学習に対する学習者個人特性の分析€¦ · 近年学習者の多様化に伴い、外国語教育の分野では、教師が学習者に教えるという方向から、学習者が教師を含む学習リソースを利用して自律的に学習す

CALL学習に対する学習者個人特性の分析€¦ · 近年学習者の多様化に伴い、外国語教育の分野では、教師が学習者に教えるという方向から、学習者が教師を含む学習リソースを利用して自律的に学習す

学生のモチベーションを上げ自律的学習習慣を確立 …...2018/04/02 · 学生のモチベーションを上げ自律的学習習慣を確立させるには 9

学生のモチベーションを上げ自律的学習習慣を確立 …...2018/04/02 · 学生のモチベーションを上げ自律的学習習慣を確立させるには 9

赤外線学習リモコンESP学習リモコン 7 学習画面の例各ボタンに対応するリモコン信号を学習させます、リモコン画面は好みに合った画像ファイルを

赤外線学習リモコンESP学習リモコン 7 学習画面の例各ボタンに対応するリモコン信号を学習させます、リモコン画面は好みに合った画像ファイルを

タブレット・スマートフォンを使った学習タブレット・スマートフォンを使った学習 2020年2月27日 Android iOSどちらでも利用できる学習メニュー

タブレット・スマートフォンを使った学習タブレット・スマートフォンを使った学習 2020年2月27日 Android iOSどちらでも利用できる学習メニュー

家庭学習ノートを活用した自主学習指導- 1 - 家庭学習ノートを活用した自主学習指導～学習習慣の改善を促す学級システム作り～東久留米市立第十小学校

家庭学習ノートを活用した自主学習指導- 1 - 家庭学習ノートを活用した自主学習指導～学習習慣の改善を促す学級システム作り～東久留米市立第十小学校

機械学習の仕組みの指導と機械学習を用いた問題解決の授業実践€¦ · 機械学習の指導一斉学習機械学習の仕組みの理解、機械学習を用いる技能の習得

機械学習の仕組みの指導と機械学習を用いた問題解決の授業実践€¦ · 機械学習の指導一斉学習機械学習の仕組みの理解、機械学習を用いる技能の習得

103C2 ニューラルネットワークを使った強化学習による行動学習 …shws.cc.oita-u.ac.jp/shibata/pub/SICEQ2017Egoshi.pdf · た強化学習を用いて、音声を入力として簡単な行動学習

103C2 ニューラルネットワークを使った強化学習による行動学習 …shws.cc.oita-u.ac.jp/shibata/pub/SICEQ2017Egoshi.pdf · た強化学習を用いて、音声を入力として簡単な行動学習

Languages

Pages

Legal

Copyright © 2022 FDOCUMENTS