Reinforcement Learning : A Beginners Tutorial

REINFORCEMENT LEARNINGA Beginner’s Tutorial

By: Omar Enayet

(Presentation Version)

The Problem

Agent-Environment Interface

Environment Model

Goals & Rewards

Returns

Credit-Assignment Problem

Markov Decision Process

An MDP is defined by < S, A, p, r, >S - set of states of the environmentA(s) – set of actions possible in state s - probability of transition from s

- expected reward when executing a in s - discount rate for expected reward

Assumption: discrete time t = 0, 1, 2, . . .

s. . .t a

t +1t +1

t +2t +2

t +3. . .

Value Functions

Optimal Value Functions

Exploration-Exploitation Problem

Policies

Elementary Solution Methods

Dynamic Programming

Perfect Model

Bootstrapping

Generalized Policy Iteration

Efficiency of DP

Monte-Carlo Methods

Episodic Return

Advantages over DP•No Model

•Simulation OR part of Model

•Focus on small subset of states

•Less Harmed by violations of Markov Property

First Visit VS Every-Visit

On-Policy VS Off-Policy

Action-value instead of State-value

Temporal-Difference Learning

Advantages of TD Learning

SARSA (On-Policy)

Q-Learning (Off-Policy)

Actor-Critic Methods(On-Policy)

R-Learning (Off-Policy)>>Average Expected reward per time-step

Eligibility Traces

REFERENCES

Richard S. Sutton and Andrew G. Barto. Reinforcement Learning, Bradford Books, 1998.

Richard Crouch, Peter Bennett, Stephen Bridges, Nick Piper and Robert Oates - Monte Carlo - 2003

SLIDES FOR READING WITH : Omar Enayet – Reinforcement Learning : A

Beginner’s Tutorial - 2009

Reinforcement Learning : A Beginners Tutorial

Documents

Transcript of Reinforcement Learning : A Beginners Tutorial

PPC Tutorial for Beginners

SEO Tutorial For Beginners

UNIX Tutorial for Beginners

JADEProgramming Tutorial for Beginners

SAP Query Tutorial for Beginners

Html5 tutorial for beginners

Dotnet tutorial for beginners

Laravel Beginners Tutorial 2

SAP BPM-Tutorial for Beginners

Gecko-research Beginners Tutorial

PHP Tutorial for Beginners

GOODREADS TUTORIAL FOR BEGINNERS REVISION

RobotC Tutorial Beginners 1

Hibernate tutorial for beginners

AIMMS Tutorial for Beginners

WordPress for Beginners Tutorial

Ruby Tutorial for Beginners

Adwords training tutorial for beginners

Wordpress for Beginners Tutorial eBook

Laravel Beginners Tutorial 1