Variational Inference and Generative...

Variational Inference and Generative Models

CS 285: Deep Reinforcement Learning, Decision Making, and Control

Sergey Levine

Class Notes

1. Homework 3 due next week!

Where we are in the course

RL algorithms advanced topics

1. Probabilistic latent variable models

2. Variational inference

3. Amortized variational inference

4. Generative models: variational autoencoders

• Goals• Understand latent variable models in deep learning

• Understand how to use (amortized) variational inference

Today’s Lecture

Probabilistic models

Latent variable models

mixtureelement

Latent variable models in general

“easy” distribution(e.g., Gaussian)

“easy” distribution(e.g., conditional Gaussian)

Latent variable models in RLconditional latent variable

models for multi-modal policieslatent variable models for

model-based RL

Other places we’ll see latent variable models

Mombaur et al. ‘09Muybridge (c. 1870) Ziebart ‘08Li & Todorov ‘06

Using RL/control + variational inference to model human behavior

Using generative models and variational inference for exploration

How do we train latent variable models?

Estimating the log-likelihood

The variational approximation

Jensen’s inequality

A brief aside…

Entropy:

Intuition 1: how random is the random variable?

Intuition 2: how large is the log probability in expectation under itself

this maximizes the first part

this also maximizes the second part(makes it as wide as possible)

A brief aside…

KL-Divergence:

Intuition 1: how different are two distributions?

Intuition 2: how small is the expected log probability of one distribution under another, minus entropy?

why entropy?

this maximizes the first part

this also maximizes the second part(makes it as wide as possible)

The variational approximation

How do we use this?

What’s the problem?

Amortized variational inference

how do we calculate this?

Amortized variational inference

look up formula for entropy of a Gaussian

can just use policy gradient!

What’s wrong with this gradient?

The reparameterization trick

Is there a better way?

most autodiff software (e.g., TensorFlow) will compute this for you!

Another way to look at it…

this often has a convenient analytical form (e.g., KL-divergence for Gaussians)

Reparameterization trick vs. policy gradient

• Policy gradient• Can handle both discrete and

continuous latent variables

• High variance, requires multiple samples & small learning rates

• Reparameterization trick• Only continuous latent variables

• Very simple to implement

• Low variance

The variational autoencoder

Using the variational autoencoder

Conditional models

Examples

1. collect data

2. learn embedding of image & dynamics model (jointly)

3. run iLQG to learn to reach image of goal

a type of variational autoencoder with temporally decomposed latent state!

Local models with images

variational autoencoder with stochastic dynamics

We’ll see more of this for…

Mombaur et al. ‘09Muybridge (c. 1870) Ziebart ‘08Li & Todorov ‘06

Using RL/control + variational inference to model human behavior

Using generative models and variational inference for exploration

Variational Inference and Generative...

Documents

Transcript of Variational Inference and Generative...

Grammar Variational Autoencoder pmlr-v70 …...Syntax-directed variational autoencoder for structured data. CoRR, abs/1802.08786, 2018. Rafael G omez-Bombarelli, David K. Duvenaud,

Auto-Encoding Variational Bayes - Machine Learningmachinelearning.math.rs/Ilic-VAE.pdfAuto-Encoding Variational Bayes Milan Ilic 3rd April 2019 ... By using the variational autoencoder,

The Multi-Entity Variational Autoencoder - Charlie Nashcharlienash.github.io/assets/docs/mevae2017.pdf · The Multi-Entity Variational Autoencoder Charlie Nash1,2, S. M. Ali Eslami

Variational Autoencoders - GitHub Pages · Variational Autoencoder q ... Autoencoder (reconstruction loss) KL divergence only VAE (KL + recon. loss) From:this webpage. Title: Variational

Variational Inference and Generative Modelsrail.eecs.berkeley.edu/deeprlcourse-fa18/static/slides/lec-14.pdf · Variational Inference and Generative Models CS 294-112: Deep Reinforcement

Counterfactual Autoencoder for Unsupervised Semantic ...rvc.eng.miami.edu/Paper/2018/IJMDEM2018-2.pdfKeywords: Variational autoencoder (VAE), Variational inferencing, Counterfactual

Mixture Variational Autoencoder, Computers and Chemical ...

Jointly Trained Variational Autoencoder for Multi-Modal ......Variational Autoencoder (VAE) combine neural networks with variational inference to allow unsupervised learning of complicated

The shape variational autoencoder: A deep generative model ...

Learning to regularize with a variational autoencoder … G V...Learning to regularize with a variational autoencoder for hydrologic inverse analysis Daniel O’Malley 1;2, John K.

Dhaka: Variational Autoencoder for Unmasking Tumor ... · Gene Expression Dhaka: Variational Autoencoder for Unmasking Tumor Heterogeneity from Single Cell Genomic Data Sabrina Rashid,1

Nonparametric Variational Auto-encoders for Hierarchical ... · Figure 1. Illustration of the nonparametric hierarchical variational autoencoder. We combines hierarhical Bayesian

Monaural Audio Source Separation using Variational ...2. Variational Autoencoder The variational autoencoder [15] is a generative model which assumes that an observed variable xis

Linked Causal Variational Autoencoder for Inferring Paired ...rguo12/CIKM18.pdfLinked Causal Variational Autoencoder for Inferring Paired Spillover Effects Vineeth Rakesh∗ Arizona

Variational Bi-domain Triplet Autoencoder · Variational Bi-domain Triplet Autoencoder KDD’18 Deep Learning Day, August 2018, London, UK 4 METHODS 4.1 Variational Autoencoder Let

A Variational Autoencoder Approach for Representation and Transformation … · 2018-06-19 · A Variational Autoencoder Approach for Representation and Transformation of Sounds -

Variational Autoencoder for Deep Learning of Images, Labels and … · 2020-04-25 · Title: Variational Autoencoder for Deep Learning of Images, Labels and Captions Author: Yunchen

BassNet: A Variational Gated Autoencoder for Conditional ...

Variational Autoencoder

Supplementary Material: Scene Grammar Variational Autoencoder · 2020. 8. 5. · 1 Supplementary Material: Scene Grammar Variational Autoencoder Pulak Purkait1[0000 00030684 1209],