(zhuan) Deep Reinforcement Learning Papers

阅读量：7281 次

发布时间：2019-06-30

本文共 10370 字，大约阅读时间需要 34 分钟。

Deep Reinforcement Learning Papers

A list of recent papers regarding deep reinforcement learning.

The papers are organized based on manually-defined bookmarks.

They are sorted by time to see the recent papers first.

Any suggestions and pull requests are welcome.

Bookmarks

All Papers

, C. Blundell et al., arXiv, 2016.

, R. Munos et al., arXiv, 2016.

, T. D. Kulkarni et al., arXiv, 2016.

, M. G. Bellemare et al., arXiv, 2016.

, R. Houthooft et al., arXiv, 2016.

, J. Oh et al., ICML, 2016.

, A. S. Lakshminarayanan et al., IJCAI Deep RL Workshop, 2016.

, R. Krishnamurthy et al., arXiv, 2016.

, Y. Duan et al., ICML, 2016.

, T. D. Kulkarni et al., arXiv, 2016.

, S. Levine et al., arXiv, 2016.

, S. Gu et al., ICML, 2016.

, C. Finn et al., arXiv, 2016.

, I. Osband et al., arXiv, 2016.

, A. Tamar et al., arXiv, 2016.

, J. N. Foerster et al., arXiv, 2016.

, V. Mnih et al., arXiv, 2016.

, D. Silver et al., Nature, 2016.

, M. G. Bellemare et al., AAAI, 2016.

, N. Heess et al., NIPS Workshop, 2015.

, V. François-Lavet et al., NIPS Workshop, 2015.

, A. Tampuu et al., arXiv, 2015.

, H. Cuayáhuitl et al., NIPS Workshop, 2015.

, S. Sukhbaatar et al., arXiv, 2016.

, W. Zaremba et al., arXiv, 2015.

, Z. Wang et al., arXiv, 2015.

, E. Parisotto, et al., ICLR, 2016.

, Y. Tian et al., ICLR, 2016.

, A. A. Rusu et at., ICLR, 2016.

, T. Schaul et al., ICLR, 2016.

, J. He et al., arXiv, 2015.

, M. Hausknecht et al., ICLR, 2016.

, F. Zhang et al., arXiv, 2015.

, H. Guo, arXiv, 2015.

, J. Rajendran et al., arXiv, 2015.

, S. Mohamed and D. J. Rezende, arXiv, 2015.

, H. van Hasselt et al., arXiv, 2015.

, X. Li et al., arXiv, 2015.

, T. P. Lillicrap et al., ICLR, 2016.

, K. Narasimhan et al., EMNLP, 2015.

, M. Lai, arXiv, 2015.

, J. Oh et al., NIPS, 2015.

, N. Heess et al., NIPS, 2015.

, M. Zhang et al., arXiv, 2015.

, M. Hausknecht and P. Stone, arXiv, 2015.

, H. Mei et al., arXiv, 2015.

, B. C. Stadie et al., arXiv, 2015.

, M. Wulfmeier et al., arXiv, 2015.

, J. Schulman et al., ICLR, 2016.

, S. Levine et al., arXiv, 2015.

, I. Lenz, et al., RSS, 2015.

, T. Schaul et al., ICML, 2015.

, D. Silver et al., ICML, 2015.

, A. Nair et al., ICML Workshop, 2015.

, J. Schulman et al., ICML, 2015.

, V. Mnih et al., Nature, 2015.

, X. Guo et al., NIPS, 2014.

, V. Mnih et al., NIPS Workshop, 2013.

Value

, C. Blundell et al., arXiv, 2016.

, R. Munos et al., arXiv, 2016.

, T. D. Kulkarni et al., arXiv, 2016.

, M. G. Bellemare et al., arXiv, 2016.

, J. Oh et al., ICML, 2016.

, A. S. Lakshminarayanan et al., IJCAI Deep RL Workshop, 2016.

, R. Krishnamurthy et al., arXiv, 2016.

, T. D. Kulkarni et al., arXiv, 2016.

, S. Gu et al., ICML, 2016.

, I. Osband et al., arXiv, 2016.

, A. Tamar et al., arXiv, 2016.

, J. N. Foerster et al., arXiv, 2016.

, V. Mnih et al., arXiv, 2016.

, D. Silver et al., Nature, 2016.

, M. G. Bellemare et al., AAAI, 2016.

, V. François-Lavet et al., NIPS Workshop, 2015.

, A. Tampuu et al., arXiv, 2015.

, H. Cuayáhuitl et al., NIPS Workshop, 2015.

, W. Zaremba et al., arXiv, 2015.

, Z. Wang et al., arXiv, 2015.

, T. Schaul et al., ICLR, 2016.

, J. He et al., arXiv, 2015.

, M. Hausknecht et al., ICLR, 2016.

, F. Zhang et al., arXiv, 2015.

, H. Guo, arXiv, 2015.

, H. van Hasselt et al., arXiv, 2015.

, X. Li et al., arXiv, 2015.

, T. P. Lillicrap et al., ICLR, 2016.

, K. Narasimhan et al., EMNLP, 2015.

, J. Oh et al., NIPS, 2015.

, M. Hausknecht and P. Stone, arXiv, 2015.

, B. C. Stadie et al., arXiv, 2015.

, A. Nair et al., ICML Workshop, 2015.

, V. Mnih et al., Nature, 2015.

, V. Mnih et al., NIPS Workshop, 2013.

Policy

, R. Houthooft et al., arXiv, 2016.

, Y. Duan et al., ICML, 2016.

, S. Levine et al., arXiv, 2016.

, C. Finn et al., arXiv, 2016.

, V. Mnih et al., arXiv, 2016.

, D. Silver et al., Nature, 2016.

, N. Heess et al., NIPS Workshop, 2015.

, S. Sukhbaatar et al., arXiv, 2016.

, J. Rajendran et al., arXiv, 2015.

, T. P. Lillicrap et al., ICLR, 2016.

, N. Heess et al., NIPS, 2015.

, J. Schulman et al., ICLR, 2016.

, S. Levine et al., arXiv, 2015.

, D. Silver et al., ICML, 2015.

, J. Schulman et al., ICML, 2015.

Discrete Control

, C. Blundell et al., arXiv, 2016.

, R. Munos et al., arXiv, 2016.

, T. D. Kulkarni et al., arXiv, 2016.

, M. G. Bellemare et al., arXiv, 2016.

, J. Oh et al., ICML, 2016.

, A. S. Lakshminarayanan et al., IJCAI Deep RL Workshop, 2016.

, R. Krishnamurthy et al., arXiv, 2016.

, T. D. Kulkarni et al., arXiv, 2016.

, I. Osband et al., arXiv, 2016.

, A. Tamar et al., arXiv, 2016.

, J. N. Foerster et al., arXiv, 2016.

, V. Mnih et al., arXiv, 2016.

, D. Silver et al., Nature, 2016.

, M. G. Bellemare et al., AAAI, 2016.

, V. François-Lavet et al., NIPS Workshop, 2015.

, A. Tampuu et al., arXiv, 2015.

, H. Cuayáhuitl et al., NIPS Workshop, 2015.

, W. Zaremba et al., arXiv, 2015.

, Z. Wang et al., arXiv, 2015.

, Y. Tian et al., ICLR, 2016.

, E. Parisotto, et al., ICLR, 2016.

, A. A. Rusu et at., ICLR, 2016.

, T. Schaul et al., ICLR, 2016.

, J. He et al., arXiv, 2015.

, M. Hausknecht et al., ICLR, 2016.

, F. Zhang et al., arXiv, 2015.

, H. Guo, arXiv, 2015.

, J. Rajendran et al., arXiv, 2015.

, S. Mohamed and D. J. Rezende, arXiv, 2015.

, H. van Hasselt et al., arXiv, 2015.

, X. Li et al., arXiv, 2015.

, K. Narasimhan et al., EMNLP, 2015.

, M. Lai, arXiv, 2015.

, J. Oh et al., NIPS, 2015.

, M. Hausknecht and P. Stone, arXiv, 2015.

, H. Mei et al., arXiv, 2015.

, B. C. Stadie et al., arXiv, 2015.

, T. Schaul et al., ICML, 2015.

, A. Nair et al., ICML Workshop, 2015.

, V. Mnih et al., Nature, 2015.

, X. Guo et al., NIPS, 2014.

, V. Mnih et al., NIPS Workshop, 2013.

Continuous Control

, R. Houthooft et al., arXiv, 2016.

, Y. Duan et al., ICML, 2016.

, S. Levine et al., arXiv, 2016.

, S. Gu et al., ICML, 2016.

, C. Finn et al., arXiv, 2016.

, V. Mnih et al., arXiv, 2016.

, N. Heess et al., NIPS Workshop, 2015.

, S. Mohamed and D. J. Rezende, arXiv, 2015.

, T. P. Lillicrap et al., ICLR, 2016.

, N. Heess et al., NIPS, 2015.

, M. Zhang et al., arXiv, 2015.

, J. Schulman et al., ICLR, 2016.

, S. Levine et al., arXiv, 2015.

, I. Lenz, et al., RSS, 2015.

, D. Silver et al., ICML, 2015.

, J. Schulman et al., ICML, 2015.

Text Domain

, H. Cuayáhuitl et al., NIPS Workshop, 2015.

, S. Sukhbaatar et al., arXiv, 2016.

, J. He et al., arXiv, 2015.

, H. Guo, arXiv, 2015.

, K. Narasimhan et al., EMNLP, 2015.

, H. Mei et al., arXiv, 2015.

Visual Domain

, C. Blundell et al., arXiv, 2016.

, T. D. Kulkarni et al., arXiv, 2016.

, M. G. Bellemare et al., arXiv, 2016.

, J. Oh et al., ICML, 2016.

, A. S. Lakshminarayanan et al., IJCAI Deep RL Workshop, 2016.

, R. Krishnamurthy et al., arXiv, 2016.

, T. D. Kulkarni et al., arXiv, 2016.

, S. Levine et al., arXiv, 2016.

, I. Osband et al., arXiv, 2016.

, A. Tamar et al., arXiv, 2016.

, V. Mnih et al., arXiv, 2016.

, D. Silver et al., Nature, 2016.

, M. G. Bellemare et al., AAAI, 2016.

, N. Heess et al., NIPS Workshop, 2015.

, V. François-Lavet et al., NIPS Workshop, 2015.

, A. Tampuu et al., arXiv, 2015.

, Z. Wang et al., arXiv, 2015.

, E. Parisotto, et al., ICLR, 2016.

, Y. Tian et al., ICLR, 2016.

, A. A. Rusu et at., ICLR, 2016.

, T. Schaul et al., ICLR, 2016.

, M. Hausknecht et al., ICLR, 2016.

, F. Zhang et al., arXiv, 2015.

, S. Mohamed and D. J. Rezende, arXiv, 2015.

, H. van Hasselt et al., arXiv, 2015.

, T. P. Lillicrap et al., ICLR, 2016.

, M. Lai, arXiv, 2015.

, J. Oh et al., NIPS, 2015.

, N. Heess et al., NIPS, 2015.

, M. Hausknecht and P. Stone, arXiv, 2015.

, B. C. Stadie et al., arXiv, 2015.

, J. Schulman et al., ICLR, 2016.

, S. Levine et al., arXiv, 2015.

, T. Schaul et al., ICML, 2015.

, A. Nair et al., ICML Workshop, 2015.

, J. Schulman et al., ICML, 2015.

, V. Mnih et al., Nature, 2015.

, X. Guo et al., NIPS, 2014.

, V. Mnih et al., NIPS Workshop, 2013.

Robotics

, R. Houthooft et al., arXiv, 2016.

, Y. Duan et al., ICML, 2016.

, S. Levine et al., arXiv, 2016.

, S. Gu et al., ICML, 2016.

, C. Finn et al., arXiv, 2016.

, V. Mnih et al., arXiv, 2016.

, N. Heess et al., NIPS Workshop, 2015.

, F. Zhang et al., arXiv, 2015.

, N. Heess et al., NIPS, 2015.

, M. Zhang et al., arXiv, 2015.

, J. Schulman et al., ICLR, 2016.

, S. Levine et al., arXiv, 2015.

, I. Lenz, et al., RSS, 2015.

, J. Schulman et al., ICML, 2015.

Games

, C. Blundell et al., arXiv, 2016.

, R. Munos et al., arXiv, 2016.

, T. D. Kulkarni et al., arXiv, 2016.

, M. G. Bellemare et al., arXiv, 2016.

, J. Oh et al., ICML, 2016.

, A. S. Lakshminarayanan et al., IJCAI Deep RL Workshop, 2016.

, R. Krishnamurthy et al., arXiv, 2016.

, T. D. Kulkarni et al., arXiv, 2016.

, I. Osband et al., arXiv, 2016.

, J. N. Foerster et al., arXiv, 2016.

, V. Mnih et al., arXiv, 2016.

, D. Silver et al., Nature, 2016.

, M. G. Bellemare et al., AAAI, 2016.

, V. François-Lavet et al., NIPS Workshop, 2015.

, A. Tampuu et al., arXiv, 2015.

, S. Sukhbaatar et al., arXiv, 2016.

, Z. Wang et al., arXiv, 2015.

, Y. Tian et al., ICLR, 2016.

, E. Parisotto, et al., ICLR, 2016.

, A. A. Rusu et at., ICLR, 2016.

, T. Schaul et al., ICLR, 2016.

, J. He et al., arXiv, 2015.

, M. Hausknecht et al., ICLR, 2016.

, S. Mohamed and D. J. Rezende, arXiv, 2015.

, H. van Hasselt et al., arXiv, 2015.

, T. P. Lillicrap et al., ICLR, 2016.

, K. Narasimhan et al., EMNLP, 2015.

, M. Lai, arXiv, 2015.

, J. Oh et al., NIPS, 2015.

, M. Hausknecht and P. Stone, arXiv, 2015.

, B. C. Stadie et al., arXiv, 2015.

, T. Schaul et al., ICML, 2015.

, A. Nair et al., ICML Workshop, 2015.

, J. Schulman et al., ICML, 2015.

, V. Mnih et al., Nature, 2015.

, X. Guo et al., NIPS, 2014.

, V. Mnih et al., NIPS Workshop, 2013.

Monte-Carlo Tree Search

, D. Silver et al., Nature, 2016.

, Y. Tian et al., ICLR, 2016.

, X. Guo et al., NIPS, 2014.

Inverse Reinforcement Learning

, C. Finn et al., arXiv, 2016.

, M. Wulfmeier et al., arXiv, 2015.

Multi-Task and Transfer Learning

, E. Parisotto, et al., ICLR, 2016.

, A. A. Rusu et at., ICLR, 2016.

, J. Rajendran et al., arXiv, 2015.

, T. Schaul et al., ICML, 2015.

Improving Exploration

, M. G. Bellemare et al., arXiv, 2016.

, R. Houthooft et al., arXiv, 2016.

, T. D. Kulkarni et al., arXiv, 2016.

, I. Osband et al., arXiv, 2016.

, J. Oh et al., NIPS, 2015.

, B. C. Stadie et al., arXiv, 2015.

Multi-Agent

, J. N. Foerster et al., arXiv, 2016.

, A. Tampuu et al., arXiv, 2015.

Hierarchical Learning

- , T. D. Kulkarni et al., arXiv, 2016.
- , R. Krishnamurthy et al., arXiv, 2016.
- , T. D. Kulkarni et al., arXiv, 2016.

转载地址：http://xrzjm.baihongyu.com/

你可能感兴趣的文章

grep及正则表达式

查看>>

【提问】sqlite中插入特殊字符的方法和接收到处理方法

vmware Horizon View 5.2初体验（四）——view agent与remote experience agent

查看>>

js获取url中的参数,并保证获取到的参数不乱码

MS UC 2013-0-虚拟机-标准化-部署-2-模板机-制作-2-设置-虚拟机

JavaScript 中 arguments，callee，caller，arguments[0] 的理解