‍‍d6723d8025de77b8b7db3363183df4b3.png

今天要给大家介绍的书是深度强化学习落地指南,本书是海康威视研究院任算法专家工作总结,对强化学习落地实践中的工程经验和相关方法进行了系统归纳。

本书内容

本书一共分为7章,包括强化学习的需求分析和算法选择的方法,动作空间、状态空间和回报函数设计的理念,训练调试和性能冲刺的技巧等。

7653ece36783c7ad1c47b6b2add9a5aa.png

第1章:需求分析,介绍了强化学习的基本概念,为什么要使用强化学习,以及强化学习可以做的事情。

63e8432405d0d1aff9d824450d7ace75.png

第2章:动作空间设计,包括动作空间的完备性,动作空间的高效性,动作空间的合法性。

0be3e10080e165aee991d2315274b6a3.png

第3章:状态空间设计,包括状态空间设计的四个步骤划分,状态空间设计的两种常见误区,与动作空间和回报函数的协同设计 。

8eeee805ec8737865b6949a700deef6b.png

第4章:回报函数设计包括回报函数的基本设计,回报函数设计的常见陷阱,基于学习的回报函数。

ffc227ca651b6c73fe508ae7324efcae.png

第5章:算法选择,介绍包括DQN,DDPG,A3C等经典算法,以及TD3,SAC,PPO等更新的算法。

249154b0177cd0ef39c5a8ff43b89b9f.png

第6章:训练调试,包括训练前的准备工作,如数据预处理 ,训练过程中的超参数调节,如何监控训练状态。

252b7b1420eb879e0a21a84dc7ed6cae.png

第7章:性能冲刺,包括课程学习,额外监督信号的使用,进化策略方案。

b516243ab02ef21cad2f09d70bad6a62.png

作者简介

魏宁:本科和硕士分别毕业于西安交通大学和中国科学院大学计算机专业,在国际顶级会议和期刊上发表多篇学术论文,曾就职于德国KUKA Robotics从事协作机器人智能应用研发工作,目前在海康威视研究院任算法专家,负责深度学习、强化学习等领域的创新研究和落地应用,同时也是互联网社区“深度强化学习实验室”核心成员。

本书特点

本书从工业界一线算法工作者的视角,对深度强化学习落地实践中的工程经验和相关方法论做出了深度思考和系统归纳。本书跳出了原理介绍加应用案例的传统叙述模式,转而在横向上对深度强化学习落地过程中的核心环节进行了完整复盘。主要内容包括需求分析和算法选择的方法,动作空间、状态空间和回报函数设计的理念,训练调试和性能冲刺的技巧等。

赠书

接下来是福利时间,本次我们赠送出3本书籍(前5次获得赠书的朋友不能再参与本次赠书活动),想要获得书籍的同学,在本公众号下方留言,根据点赞数的高低,下周二晚上(9.28)22:00统计出获奖读者并进行公示,届时联系有三微信Longlongtogo即可。

如果没有获得赠书,也可以在京东和当当购买,链接如下:

57aca588aab582ea81187a4d56594168.png

f74f42f400ac2d500c1bf217f05e8f00.png

8386e5c228d2f65978244156a34af348.png

往期相关

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐