中国优质的IT技术网站
专业IT技术创作平台
IT职业在线教育平台
强化学习算法的快速原型研究框架。Dopamine是基于TensorFlow的研究框架,用于快速学习强化学习算法的原型。它旨在满足对小型,易处理的代码库的需求,用户可以在其中自由地试验荒诞的想法(推测性研究)。
微信扫码分享