Deep Reinforcement Learning Papers
A list of recent papers regarding deep reinforcement learning.
The papers are organized based on manually-defined bookmarks. They are sorted by time to see the recent papers first. Any suggestions and pull requests are welcome.Bookmarks
All Papers
- , C. Blundell et al., arXiv, 2016.
- , R. Munos et al., arXiv, 2016.
- , T. D. Kulkarni et al., arXiv, 2016.
- , M. G. Bellemare et al., arXiv, 2016.
- , R. Houthooft et al., arXiv, 2016.
- , J. Oh et al., ICML, 2016.
- , A. S. Lakshminarayanan et al., IJCAI Deep RL Workshop, 2016.
- , R. Krishnamurthy et al., arXiv, 2016.
- , Y. Duan et al., ICML, 2016.
- , T. D. Kulkarni et al., arXiv, 2016.
- , S. Levine et al., arXiv, 2016.
- , S. Gu et al., ICML, 2016.
- , C. Finn et al., arXiv, 2016.
- , I. Osband et al., arXiv, 2016.
- , A. Tamar et al., arXiv, 2016.
- , J. N. Foerster et al., arXiv, 2016.
- , V. Mnih et al., arXiv, 2016.
- , D. Silver et al., Nature, 2016.
- , M. G. Bellemare et al., AAAI, 2016.
- , N. Heess et al., NIPS Workshop, 2015.
- , V. François-Lavet et al., NIPS Workshop, 2015.
- , A. Tampuu et al., arXiv, 2015.
- , H. Cuayáhuitl et al., NIPS Workshop, 2015.
- , S. Sukhbaatar et al., arXiv, 2016.
- , W. Zaremba et al., arXiv, 2015.
- , Z. Wang et al., arXiv, 2015.
- , E. Parisotto, et al., ICLR, 2016.
- , Y. Tian et al., ICLR, 2016.
- , A. A. Rusu et at., ICLR, 2016.
- , T. Schaul et al., ICLR, 2016.
- , J. He et al., arXiv, 2015.
- , M. Hausknecht et al., ICLR, 2016.
- , F. Zhang et al., arXiv, 2015.
- , H. Guo, arXiv, 2015.
- , J. Rajendran et al., arXiv, 2015.
- , S. Mohamed and D. J. Rezende, arXiv, 2015.
- , H. van Hasselt et al., arXiv, 2015.
- , X. Li et al., arXiv, 2015.
- , T. P. Lillicrap et al., ICLR, 2016.
- , K. Narasimhan et al., EMNLP, 2015.
- , M. Lai, arXiv, 2015.
- , J. Oh et al., NIPS, 2015.
- , N. Heess et al., NIPS, 2015.
- , M. Zhang et al., arXiv, 2015.
- , M. Hausknecht and P. Stone, arXiv, 2015.
- , H. Mei et al., arXiv, 2015.
- , B. C. Stadie et al., arXiv, 2015.
- , M. Wulfmeier et al., arXiv, 2015.
- , J. Schulman et al., ICLR, 2016.
- , S. Levine et al., arXiv, 2015.
- , I. Lenz, et al., RSS, 2015.
- , T. Schaul et al., ICML, 2015.
- , D. Silver et al., ICML, 2015.
- , A. Nair et al., ICML Workshop, 2015.
- , J. Schulman et al., ICML, 2015.
- , V. Mnih et al., Nature, 2015.
- , X. Guo et al., NIPS, 2014.
- , V. Mnih et al., NIPS Workshop, 2013.
Value
- , C. Blundell et al., arXiv, 2016.
- , R. Munos et al., arXiv, 2016.
- , T. D. Kulkarni et al., arXiv, 2016.
- , M. G. Bellemare et al., arXiv, 2016.
- , J. Oh et al., ICML, 2016.
- , A. S. Lakshminarayanan et al., IJCAI Deep RL Workshop, 2016.
- , R. Krishnamurthy et al., arXiv, 2016.
- , T. D. Kulkarni et al., arXiv, 2016.
- , S. Gu et al., ICML, 2016.
- , I. Osband et al., arXiv, 2016.
- , A. Tamar et al., arXiv, 2016.
- , J. N. Foerster et al., arXiv, 2016.
- , V. Mnih et al., arXiv, 2016.
- , D. Silver et al., Nature, 2016.
- , M. G. Bellemare et al., AAAI, 2016.
- , V. François-Lavet et al., NIPS Workshop, 2015.
- , A. Tampuu et al., arXiv, 2015.
- , H. Cuayáhuitl et al., NIPS Workshop, 2015.
- , W. Zaremba et al., arXiv, 2015.
- , Z. Wang et al., arXiv, 2015.
- , T. Schaul et al., ICLR, 2016.
- , J. He et al., arXiv, 2015.
- , M. Hausknecht et al., ICLR, 2016.
- , F. Zhang et al., arXiv, 2015.
- , H. Guo, arXiv, 2015.
- , H. van Hasselt et al., arXiv, 2015.
- , X. Li et al., arXiv, 2015.
- , T. P. Lillicrap et al., ICLR, 2016.
- , K. Narasimhan et al., EMNLP, 2015.
- , J. Oh et al., NIPS, 2015.
- , M. Hausknecht and P. Stone, arXiv, 2015.
- , B. C. Stadie et al., arXiv, 2015.
- , A. Nair et al., ICML Workshop, 2015.
- , V. Mnih et al., Nature, 2015.
- , V. Mnih et al., NIPS Workshop, 2013.
Policy
- , R. Houthooft et al., arXiv, 2016.
- , Y. Duan et al., ICML, 2016.
- , S. Levine et al., arXiv, 2016.
- , C. Finn et al., arXiv, 2016.
- , V. Mnih et al., arXiv, 2016.
- , D. Silver et al., Nature, 2016.
- , N. Heess et al., NIPS Workshop, 2015.
- , S. Sukhbaatar et al., arXiv, 2016.
- , J. Rajendran et al., arXiv, 2015.
- , T. P. Lillicrap et al., ICLR, 2016.
- , N. Heess et al., NIPS, 2015.
- , J. Schulman et al., ICLR, 2016.
- , S. Levine et al., arXiv, 2015.
- , D. Silver et al., ICML, 2015.
- , J. Schulman et al., ICML, 2015.
Discrete Control
- , C. Blundell et al., arXiv, 2016.
- , R. Munos et al., arXiv, 2016.
- , T. D. Kulkarni et al., arXiv, 2016.
- , M. G. Bellemare et al., arXiv, 2016.
- , J. Oh et al., ICML, 2016.
- , A. S. Lakshminarayanan et al., IJCAI Deep RL Workshop, 2016.
- , R. Krishnamurthy et al., arXiv, 2016.
- , T. D. Kulkarni et al., arXiv, 2016.
- , I. Osband et al., arXiv, 2016.
- , A. Tamar et al., arXiv, 2016.
- , J. N. Foerster et al., arXiv, 2016.
- , V. Mnih et al., arXiv, 2016.
- , D. Silver et al., Nature, 2016.
- , M. G. Bellemare et al., AAAI, 2016.
- , V. François-Lavet et al., NIPS Workshop, 2015.
- , A. Tampuu et al., arXiv, 2015.
- , H. Cuayáhuitl et al., NIPS Workshop, 2015.
- , W. Zaremba et al., arXiv, 2015.
- , Z. Wang et al., arXiv, 2015.
- , Y. Tian et al., ICLR, 2016.
- , E. Parisotto, et al., ICLR, 2016.
- , A. A. Rusu et at., ICLR, 2016.
- , T. Schaul et al., ICLR, 2016.
- , J. He et al., arXiv, 2015.
- , M. Hausknecht et al., ICLR, 2016.
- , F. Zhang et al., arXiv, 2015.
- , H. Guo, arXiv, 2015.
- , J. Rajendran et al., arXiv, 2015.
- , S. Mohamed and D. J. Rezende, arXiv, 2015.
- , H. van Hasselt et al., arXiv, 2015.
- , X. Li et al., arXiv, 2015.
- , K. Narasimhan et al., EMNLP, 2015.
- , M. Lai, arXiv, 2015.
- , J. Oh et al., NIPS, 2015.
- , M. Hausknecht and P. Stone, arXiv, 2015.
- , H. Mei et al., arXiv, 2015.
- , B. C. Stadie et al., arXiv, 2015.
- , T. Schaul et al., ICML, 2015.
- , A. Nair et al., ICML Workshop, 2015.
- , V. Mnih et al., Nature, 2015.
- , X. Guo et al., NIPS, 2014.
- , V. Mnih et al., NIPS Workshop, 2013.
Continuous Control
- , R. Houthooft et al., arXiv, 2016.
- , Y. Duan et al., ICML, 2016.
- , S. Levine et al., arXiv, 2016.
- , S. Gu et al., ICML, 2016.
- , C. Finn et al., arXiv, 2016.
- , V. Mnih et al., arXiv, 2016.
- , N. Heess et al., NIPS Workshop, 2015.
- , S. Mohamed and D. J. Rezende, arXiv, 2015.
- , T. P. Lillicrap et al., ICLR, 2016.
- , N. Heess et al., NIPS, 2015.
- , M. Zhang et al., arXiv, 2015.
- , J. Schulman et al., ICLR, 2016.
- , S. Levine et al., arXiv, 2015.
- , I. Lenz, et al., RSS, 2015.
- , D. Silver et al., ICML, 2015.
- , J. Schulman et al., ICML, 2015.
Text Domain
- , H. Cuayáhuitl et al., NIPS Workshop, 2015.
- , S. Sukhbaatar et al., arXiv, 2016.
- , J. He et al., arXiv, 2015.
- , H. Guo, arXiv, 2015.
- , K. Narasimhan et al., EMNLP, 2015.
- , H. Mei et al., arXiv, 2015.
Visual Domain
- , C. Blundell et al., arXiv, 2016.
- , T. D. Kulkarni et al., arXiv, 2016.
- , M. G. Bellemare et al., arXiv, 2016.
- , J. Oh et al., ICML, 2016.
- , A. S. Lakshminarayanan et al., IJCAI Deep RL Workshop, 2016.
- , R. Krishnamurthy et al., arXiv, 2016.
- , T. D. Kulkarni et al., arXiv, 2016.
- , S. Levine et al., arXiv, 2016.
- , I. Osband et al., arXiv, 2016.
- , A. Tamar et al., arXiv, 2016.
- , V. Mnih et al., arXiv, 2016.
- , D. Silver et al., Nature, 2016.
- , M. G. Bellemare et al., AAAI, 2016.
- , N. Heess et al., NIPS Workshop, 2015.
- , V. François-Lavet et al., NIPS Workshop, 2015.
- , A. Tampuu et al., arXiv, 2015.
- , Z. Wang et al., arXiv, 2015.
- , E. Parisotto, et al., ICLR, 2016.
- , Y. Tian et al., ICLR, 2016.
- , A. A. Rusu et at., ICLR, 2016.
- , T. Schaul et al., ICLR, 2016.
- , M. Hausknecht et al., ICLR, 2016.
- , F. Zhang et al., arXiv, 2015.
- , S. Mohamed and D. J. Rezende, arXiv, 2015.
- , H. van Hasselt et al., arXiv, 2015.
- , T. P. Lillicrap et al., ICLR, 2016.
- , M. Lai, arXiv, 2015.
- , J. Oh et al., NIPS, 2015.
- , N. Heess et al., NIPS, 2015.
- , M. Hausknecht and P. Stone, arXiv, 2015.
- , B. C. Stadie et al., arXiv, 2015.
- , J. Schulman et al., ICLR, 2016.
- , S. Levine et al., arXiv, 2015.
- , T. Schaul et al., ICML, 2015.
- , A. Nair et al., ICML Workshop, 2015.
- , J. Schulman et al., ICML, 2015.
- , V. Mnih et al., Nature, 2015.
- , X. Guo et al., NIPS, 2014.
- , V. Mnih et al., NIPS Workshop, 2013.
Robotics
- , R. Houthooft et al., arXiv, 2016.
- , Y. Duan et al., ICML, 2016.
- , S. Levine et al., arXiv, 2016.
- , S. Gu et al., ICML, 2016.
- , C. Finn et al., arXiv, 2016.
- , V. Mnih et al., arXiv, 2016.
- , N. Heess et al., NIPS Workshop, 2015.
- , F. Zhang et al., arXiv, 2015.
- , N. Heess et al., NIPS, 2015.
- , M. Zhang et al., arXiv, 2015.
- , J. Schulman et al., ICLR, 2016.
- , S. Levine et al., arXiv, 2015.
- , I. Lenz, et al., RSS, 2015.
- , J. Schulman et al., ICML, 2015.
Games
- , C. Blundell et al., arXiv, 2016.
- , R. Munos et al., arXiv, 2016.
- , T. D. Kulkarni et al., arXiv, 2016.
- , M. G. Bellemare et al., arXiv, 2016.
- , J. Oh et al., ICML, 2016.
- , A. S. Lakshminarayanan et al., IJCAI Deep RL Workshop, 2016.
- , R. Krishnamurthy et al., arXiv, 2016.
- , T. D. Kulkarni et al., arXiv, 2016.
- , I. Osband et al., arXiv, 2016.
- , J. N. Foerster et al., arXiv, 2016.
- , V. Mnih et al., arXiv, 2016.
- , D. Silver et al., Nature, 2016.
- , M. G. Bellemare et al., AAAI, 2016.
- , V. François-Lavet et al., NIPS Workshop, 2015.
- , A. Tampuu et al., arXiv, 2015.
- , S. Sukhbaatar et al., arXiv, 2016.
- , Z. Wang et al., arXiv, 2015.
- , Y. Tian et al., ICLR, 2016.
- , E. Parisotto, et al., ICLR, 2016.
- , A. A. Rusu et at., ICLR, 2016.
- , T. Schaul et al., ICLR, 2016.
- , J. He et al., arXiv, 2015.
- , M. Hausknecht et al., ICLR, 2016.
- , S. Mohamed and D. J. Rezende, arXiv, 2015.
- , H. van Hasselt et al., arXiv, 2015.
- , T. P. Lillicrap et al., ICLR, 2016.
- , K. Narasimhan et al., EMNLP, 2015.
- , M. Lai, arXiv, 2015.
- , J. Oh et al., NIPS, 2015.
- , M. Hausknecht and P. Stone, arXiv, 2015.
- , B. C. Stadie et al., arXiv, 2015.
- , T. Schaul et al., ICML, 2015.
- , A. Nair et al., ICML Workshop, 2015.
- , J. Schulman et al., ICML, 2015.
- , V. Mnih et al., Nature, 2015.
- , X. Guo et al., NIPS, 2014.
- , V. Mnih et al., NIPS Workshop, 2013.
Monte-Carlo Tree Search
- , D. Silver et al., Nature, 2016.
- , Y. Tian et al., ICLR, 2016.
- , X. Guo et al., NIPS, 2014.
Inverse Reinforcement Learning
- , C. Finn et al., arXiv, 2016.
- , M. Wulfmeier et al., arXiv, 2015.
Multi-Task and Transfer Learning
- , E. Parisotto, et al., ICLR, 2016.
- , A. A. Rusu et at., ICLR, 2016.
- , J. Rajendran et al., arXiv, 2015.
- , T. Schaul et al., ICML, 2015.
Improving Exploration
- , M. G. Bellemare et al., arXiv, 2016.
- , R. Houthooft et al., arXiv, 2016.
- , T. D. Kulkarni et al., arXiv, 2016.
- , I. Osband et al., arXiv, 2016.
- , J. Oh et al., NIPS, 2015.
- , B. C. Stadie et al., arXiv, 2015.
Multi-Agent
- , J. N. Foerster et al., arXiv, 2016.
- , A. Tampuu et al., arXiv, 2015.
Hierarchical Learning
-
- , T. D. Kulkarni et al., arXiv, 2016.
- , R. Krishnamurthy et al., arXiv, 2016.
- , T. D. Kulkarni et al., arXiv, 2016.