博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
(zhuan) Deep Reinforcement Learning Papers
阅读量:7281 次
发布时间:2019-06-30

本文共 10370 字,大约阅读时间需要 34 分钟。

 

Deep Reinforcement Learning Papers

 

A list of recent papers regarding deep reinforcement learning. 

The papers are organized based on manually-defined bookmarks. 
They are sorted by time to see the recent papers first. 
Any suggestions and pull requests are welcome.

Bookmarks

All Papers

  • , C. Blundell et al., arXiv, 2016.
  • , R. Munos et al., arXiv, 2016.
  • , T. D. Kulkarni et al., arXiv, 2016.
  • , M. G. Bellemare et al., arXiv, 2016.
  • , R. Houthooft et al., arXiv, 2016.
  • , J. Oh et al., ICML, 2016.
  • , A. S. Lakshminarayanan et al., IJCAI Deep RL Workshop, 2016.
  • , R. Krishnamurthy et al., arXiv, 2016.
  • , Y. Duan et al., ICML, 2016.
  • , T. D. Kulkarni et al., arXiv, 2016.
  • , S. Levine et al., arXiv, 2016.
  • , S. Gu et al., ICML, 2016.
  • , C. Finn et al., arXiv, 2016.
  • , I. Osband et al., arXiv, 2016.
  • , A. Tamar et al., arXiv, 2016.
  • , J. N. Foerster et al., arXiv, 2016.
  • , V. Mnih et al., arXiv, 2016.
  • , D. Silver et al., Nature, 2016.
  • , M. G. Bellemare et al., AAAI, 2016.
  • , N. Heess et al., NIPS Workshop, 2015.
  • , V. François-Lavet et al., NIPS Workshop, 2015.
  • , A. Tampuu et al., arXiv, 2015.
  • , H. Cuayáhuitl et al., NIPS Workshop, 2015.
  • , S. Sukhbaatar et al., arXiv, 2016.
  • , W. Zaremba et al., arXiv, 2015.
  • , Z. Wang et al., arXiv, 2015.
  • , E. Parisotto, et al., ICLR, 2016.
  • , Y. Tian et al., ICLR, 2016.
  • , A. A. Rusu et at., ICLR, 2016.
  • , T. Schaul et al., ICLR, 2016.
  • , J. He et al., arXiv, 2015.
  • , M. Hausknecht et al., ICLR, 2016.
  • , F. Zhang et al., arXiv, 2015.
  • , H. Guo, arXiv, 2015.
  • , J. Rajendran et al., arXiv, 2015.
  • , S. Mohamed and D. J. Rezende, arXiv, 2015.
  • , H. van Hasselt et al., arXiv, 2015.
  • , X. Li et al., arXiv, 2015.
  • , T. P. Lillicrap et al., ICLR, 2016.
  • , K. Narasimhan et al., EMNLP, 2015.
  • , M. Lai, arXiv, 2015.
  • , J. Oh et al., NIPS, 2015.
  • , N. Heess et al., NIPS, 2015.
  • , M. Zhang et al., arXiv, 2015.
  • , M. Hausknecht and P. Stone, arXiv, 2015.
  • , H. Mei et al., arXiv, 2015.
  • , B. C. Stadie et al., arXiv, 2015.
  • , M. Wulfmeier et al., arXiv, 2015.
  • , J. Schulman et al., ICLR, 2016.
  • , S. Levine et al., arXiv, 2015.
  • , I. Lenz, et al., RSS, 2015.
  • , T. Schaul et al., ICML, 2015.
  • , D. Silver et al., ICML, 2015.
  • , A. Nair et al., ICML Workshop, 2015.
  • , J. Schulman et al., ICML, 2015.
  • , V. Mnih et al., Nature, 2015.
  • , X. Guo et al., NIPS, 2014.
  • , V. Mnih et al., NIPS Workshop, 2013.

Value

  • , C. Blundell et al., arXiv, 2016.
  • , R. Munos et al., arXiv, 2016.
  • , T. D. Kulkarni et al., arXiv, 2016.
  • , M. G. Bellemare et al., arXiv, 2016.
  • , J. Oh et al., ICML, 2016.
  • , A. S. Lakshminarayanan et al., IJCAI Deep RL Workshop, 2016.
  • , R. Krishnamurthy et al., arXiv, 2016.
  • , T. D. Kulkarni et al., arXiv, 2016.
  • , S. Gu et al., ICML, 2016.
  • , I. Osband et al., arXiv, 2016.
  • , A. Tamar et al., arXiv, 2016.
  • , J. N. Foerster et al., arXiv, 2016.
  • , V. Mnih et al., arXiv, 2016.
  • , D. Silver et al., Nature, 2016.
  • , M. G. Bellemare et al., AAAI, 2016.
  • , V. François-Lavet et al., NIPS Workshop, 2015.
  • , A. Tampuu et al., arXiv, 2015.
  • , H. Cuayáhuitl et al., NIPS Workshop, 2015.
  • , W. Zaremba et al., arXiv, 2015.
  • , Z. Wang et al., arXiv, 2015.
  • , T. Schaul et al., ICLR, 2016.
  • , J. He et al., arXiv, 2015.
  • , M. Hausknecht et al., ICLR, 2016.
  • , F. Zhang et al., arXiv, 2015.
  • , H. Guo, arXiv, 2015.
  • , H. van Hasselt et al., arXiv, 2015.
  • , X. Li et al., arXiv, 2015.
  • , T. P. Lillicrap et al., ICLR, 2016.
  • , K. Narasimhan et al., EMNLP, 2015.
  • , J. Oh et al., NIPS, 2015.
  • , M. Hausknecht and P. Stone, arXiv, 2015.
  • , B. C. Stadie et al., arXiv, 2015.
  • , A. Nair et al., ICML Workshop, 2015.
  • , V. Mnih et al., Nature, 2015.
  • , V. Mnih et al., NIPS Workshop, 2013.

Policy

  • , R. Houthooft et al., arXiv, 2016.
  • , Y. Duan et al., ICML, 2016.
  • , S. Levine et al., arXiv, 2016.
  • , C. Finn et al., arXiv, 2016.
  • , V. Mnih et al., arXiv, 2016.
  • , D. Silver et al., Nature, 2016.
  • , N. Heess et al., NIPS Workshop, 2015.
  • , S. Sukhbaatar et al., arXiv, 2016.
  • , J. Rajendran et al., arXiv, 2015.
  • , T. P. Lillicrap et al., ICLR, 2016.
  • , N. Heess et al., NIPS, 2015.
  • , J. Schulman et al., ICLR, 2016.
  • , S. Levine et al., arXiv, 2015.
  • , D. Silver et al., ICML, 2015.
  • , J. Schulman et al., ICML, 2015.

Discrete Control

  • , C. Blundell et al., arXiv, 2016.
  • , R. Munos et al., arXiv, 2016.
  • , T. D. Kulkarni et al., arXiv, 2016.
  • , M. G. Bellemare et al., arXiv, 2016.
  • , J. Oh et al., ICML, 2016.
  • , A. S. Lakshminarayanan et al., IJCAI Deep RL Workshop, 2016.
  • , R. Krishnamurthy et al., arXiv, 2016.
  • , T. D. Kulkarni et al., arXiv, 2016.
  • , I. Osband et al., arXiv, 2016.
  • , A. Tamar et al., arXiv, 2016.
  • , J. N. Foerster et al., arXiv, 2016.
  • , V. Mnih et al., arXiv, 2016.
  • , D. Silver et al., Nature, 2016.
  • , M. G. Bellemare et al., AAAI, 2016.
  • , V. François-Lavet et al., NIPS Workshop, 2015.
  • , A. Tampuu et al., arXiv, 2015.
  • , H. Cuayáhuitl et al., NIPS Workshop, 2015.
  • , W. Zaremba et al., arXiv, 2015.
  • , Z. Wang et al., arXiv, 2015.
  • , Y. Tian et al., ICLR, 2016.
  • , E. Parisotto, et al., ICLR, 2016.
  • , A. A. Rusu et at., ICLR, 2016.
  • , T. Schaul et al., ICLR, 2016.
  • , J. He et al., arXiv, 2015.
  • , M. Hausknecht et al., ICLR, 2016.
  • , F. Zhang et al., arXiv, 2015.
  • , H. Guo, arXiv, 2015.
  • , J. Rajendran et al., arXiv, 2015.
  • , S. Mohamed and D. J. Rezende, arXiv, 2015.
  • , H. van Hasselt et al., arXiv, 2015.
  • , X. Li et al., arXiv, 2015.
  • , K. Narasimhan et al., EMNLP, 2015.
  • , M. Lai, arXiv, 2015.
  • , J. Oh et al., NIPS, 2015.
  • , M. Hausknecht and P. Stone, arXiv, 2015.
  • , H. Mei et al., arXiv, 2015.
  • , B. C. Stadie et al., arXiv, 2015.
  • , T. Schaul et al., ICML, 2015.
  • , A. Nair et al., ICML Workshop, 2015.
  • , V. Mnih et al., Nature, 2015.
  • , X. Guo et al., NIPS, 2014.
  • , V. Mnih et al., NIPS Workshop, 2013.

Continuous Control

  • , R. Houthooft et al., arXiv, 2016.
  • , Y. Duan et al., ICML, 2016.
  • , S. Levine et al., arXiv, 2016.
  • , S. Gu et al., ICML, 2016.
  • , C. Finn et al., arXiv, 2016.
  • , V. Mnih et al., arXiv, 2016.
  • , N. Heess et al., NIPS Workshop, 2015.
  • , S. Mohamed and D. J. Rezende, arXiv, 2015.
  • , T. P. Lillicrap et al., ICLR, 2016.
  • , N. Heess et al., NIPS, 2015.
  • , M. Zhang et al., arXiv, 2015.
  • , J. Schulman et al., ICLR, 2016.
  • , S. Levine et al., arXiv, 2015.
  • , I. Lenz, et al., RSS, 2015.
  • , D. Silver et al., ICML, 2015.
  • , J. Schulman et al., ICML, 2015.

Text Domain

  • , H. Cuayáhuitl et al., NIPS Workshop, 2015.
  • , S. Sukhbaatar et al., arXiv, 2016.
  • , J. He et al., arXiv, 2015.
  • , H. Guo, arXiv, 2015.
  • , K. Narasimhan et al., EMNLP, 2015.
  • , H. Mei et al., arXiv, 2015.

Visual Domain

  • , C. Blundell et al., arXiv, 2016.
  • , T. D. Kulkarni et al., arXiv, 2016.
  • , M. G. Bellemare et al., arXiv, 2016.
  • , J. Oh et al., ICML, 2016.
  • , A. S. Lakshminarayanan et al., IJCAI Deep RL Workshop, 2016.
  • , R. Krishnamurthy et al., arXiv, 2016.
  • , T. D. Kulkarni et al., arXiv, 2016.
  • , S. Levine et al., arXiv, 2016.
  • , I. Osband et al., arXiv, 2016.
  • , A. Tamar et al., arXiv, 2016.
  • , V. Mnih et al., arXiv, 2016.
  • , D. Silver et al., Nature, 2016.
  • , M. G. Bellemare et al., AAAI, 2016.
  • , N. Heess et al., NIPS Workshop, 2015.
  • , V. François-Lavet et al., NIPS Workshop, 2015.
  • , A. Tampuu et al., arXiv, 2015.
  • , Z. Wang et al., arXiv, 2015.
  • , E. Parisotto, et al., ICLR, 2016.
  • , Y. Tian et al., ICLR, 2016.
  • , A. A. Rusu et at., ICLR, 2016.
  • , T. Schaul et al., ICLR, 2016.
  • , M. Hausknecht et al., ICLR, 2016.
  • , F. Zhang et al., arXiv, 2015.
  • , S. Mohamed and D. J. Rezende, arXiv, 2015.
  • , H. van Hasselt et al., arXiv, 2015.
  • , T. P. Lillicrap et al., ICLR, 2016.
  • , M. Lai, arXiv, 2015.
  • , J. Oh et al., NIPS, 2015.
  • , N. Heess et al., NIPS, 2015.
  • , M. Hausknecht and P. Stone, arXiv, 2015.
  • , B. C. Stadie et al., arXiv, 2015.
  • , J. Schulman et al., ICLR, 2016.
  • , S. Levine et al., arXiv, 2015.
  • , T. Schaul et al., ICML, 2015.
  • , A. Nair et al., ICML Workshop, 2015.
  • , J. Schulman et al., ICML, 2015.
  • , V. Mnih et al., Nature, 2015.
  • , X. Guo et al., NIPS, 2014.
  • , V. Mnih et al., NIPS Workshop, 2013.

Robotics

  • , R. Houthooft et al., arXiv, 2016.
  • , Y. Duan et al., ICML, 2016.
  • , S. Levine et al., arXiv, 2016.
  • , S. Gu et al., ICML, 2016.
  • , C. Finn et al., arXiv, 2016.
  • , V. Mnih et al., arXiv, 2016.
  • , N. Heess et al., NIPS Workshop, 2015.
  • , F. Zhang et al., arXiv, 2015.
  • , N. Heess et al., NIPS, 2015.
  • , M. Zhang et al., arXiv, 2015.
  • , J. Schulman et al., ICLR, 2016.
  • , S. Levine et al., arXiv, 2015.
  • , I. Lenz, et al., RSS, 2015.
  • , J. Schulman et al., ICML, 2015.

Games

  • , C. Blundell et al., arXiv, 2016.
  • , R. Munos et al., arXiv, 2016.
  • , T. D. Kulkarni et al., arXiv, 2016.
  • , M. G. Bellemare et al., arXiv, 2016.
  • , J. Oh et al., ICML, 2016.
  • , A. S. Lakshminarayanan et al., IJCAI Deep RL Workshop, 2016.
  • , R. Krishnamurthy et al., arXiv, 2016.
  • , T. D. Kulkarni et al., arXiv, 2016.
  • , I. Osband et al., arXiv, 2016.
  • , J. N. Foerster et al., arXiv, 2016.
  • , V. Mnih et al., arXiv, 2016.
  • , D. Silver et al., Nature, 2016.
  • , M. G. Bellemare et al., AAAI, 2016.
  • , V. François-Lavet et al., NIPS Workshop, 2015.
  • , A. Tampuu et al., arXiv, 2015.
  • , S. Sukhbaatar et al., arXiv, 2016.
  • , Z. Wang et al., arXiv, 2015.
  • , Y. Tian et al., ICLR, 2016.
  • , E. Parisotto, et al., ICLR, 2016.
  • , A. A. Rusu et at., ICLR, 2016.
  • , T. Schaul et al., ICLR, 2016.
  • , J. He et al., arXiv, 2015.
  • , M. Hausknecht et al., ICLR, 2016.
  • , S. Mohamed and D. J. Rezende, arXiv, 2015.
  • , H. van Hasselt et al., arXiv, 2015.
  • , T. P. Lillicrap et al., ICLR, 2016.
  • , K. Narasimhan et al., EMNLP, 2015.
  • , M. Lai, arXiv, 2015.
  • , J. Oh et al., NIPS, 2015.
  • , M. Hausknecht and P. Stone, arXiv, 2015.
  • , B. C. Stadie et al., arXiv, 2015.
  • , T. Schaul et al., ICML, 2015.
  • , A. Nair et al., ICML Workshop, 2015.
  • , J. Schulman et al., ICML, 2015.
  • , V. Mnih et al., Nature, 2015.
  • , X. Guo et al., NIPS, 2014.
  • , V. Mnih et al., NIPS Workshop, 2013.

Monte-Carlo Tree Search

  • , D. Silver et al., Nature, 2016.
  • , Y. Tian et al., ICLR, 2016.
  • , X. Guo et al., NIPS, 2014.

Inverse Reinforcement Learning

  • , C. Finn et al., arXiv, 2016.
  • , M. Wulfmeier et al., arXiv, 2015.

Multi-Task and Transfer Learning

  • , E. Parisotto, et al., ICLR, 2016.
  • , A. A. Rusu et at., ICLR, 2016.
  • , J. Rajendran et al., arXiv, 2015.
  • , T. Schaul et al., ICML, 2015.

Improving Exploration

  • , M. G. Bellemare et al., arXiv, 2016.
  • , R. Houthooft et al., arXiv, 2016.
  • , T. D. Kulkarni et al., arXiv, 2016.
  • , I. Osband et al., arXiv, 2016.
  • , J. Oh et al., NIPS, 2015.
  • , B. C. Stadie et al., arXiv, 2015.

Multi-Agent

  • , J. N. Foerster et al., arXiv, 2016.
  • , A. Tampuu et al., arXiv, 2015.

Hierarchical Learning

    • , T. D. Kulkarni et al., arXiv, 2016.
    • , R. Krishnamurthy et al., arXiv, 2016.
    • , T. D. Kulkarni et al., arXiv, 2016.

转载地址:http://xrzjm.baihongyu.com/

你可能感兴趣的文章
grep及正则表达式
查看>>
【提问】sqlite中插入特殊字符的方法和接收到处理方法
查看>>
linux 系统磁盘管理
查看>>
awk数组
查看>>
PHP树形列表互相转换函数
查看>>
无线AP2600如何选择胖和瘦
查看>>
vmware Horizon View 5.2初体验(四)——view agent与remote experience agent
查看>>
js获取url中的参数,并保证获取到的参数不乱码
查看>>
东进数字语音卡(SS1)通用封装与实现
查看>>
15类存储卡品种和特点介绍
查看>>
MS UC 2013-0-虚拟机-标准化-部署-2-模板机-制作-2-设置-虚拟机
查看>>
KVM虚拟化性能优化
查看>>
Rsync、Unison及DRBD的比较
查看>>
SecureCRT中文显示乱码
查看>>
JavaScript 中 arguments,callee,caller,arguments[0] 的理解
查看>>
Lua4.0 编译器其它
查看>>
常回“家”看看
查看>>
EL 运算符——小记
查看>>
slf4j查看
查看>>
Java算法之 费氏搜寻法
查看>>