【赠书】深度强化学习落地指南，来自一线工程师的经验！

‍‍今天要给大家介绍的书是深度强化学习落地指南，本书是海康威视研究院任算法专家工作总结，对强化学习落地实践中的工程经验和相关方法进行了系统归纳。本书内容本书一共分为7章，包括强化学习的需求...

言有三

669人浏览 · 2021-09-25 22:39:35

言有三 · 2021-09-25 22:39:35 发布

‍‍

今天要给大家介绍的书是深度强化学习落地指南，本书是海康威视研究院任算法专家工作总结，对强化学习落地实践中的工程经验和相关方法进行了系统归纳。

本书内容

本书一共分为7章，包括强化学习的需求分析和算法选择的方法，动作空间、状态空间和回报函数设计的理念，训练调试和性能冲刺的技巧等。

第1章：需求分析，介绍了强化学习的基本概念，为什么要使用强化学习，以及强化学习可以做的事情。

第2章：动作空间设计，包括动作空间的完备性，动作空间的高效性，动作空间的合法性。

第3章：状态空间设计，包括状态空间设计的四个步骤划分，状态空间设计的两种常见误区，与动作空间和回报函数的协同设计。

第4章：回报函数设计，包括回报函数的基本设计，回报函数设计的常见陷阱，基于学习的回报函数。

第5章：算法选择，介绍包括DQN，DDPG，A3C等经典算法，以及TD3，SAC，PPO等更新的算法。

第6章：训练调试，包括训练前的准备工作，如数据预处理，训练过程中的超参数调节，如何监控训练状态。

第7章：性能冲刺，包括课程学习，额外监督信号的使用，进化策略方案。

作者简介

魏宁：本科和硕士分别毕业于西安交通大学和中国科学院大学计算机专业，在国际顶级会议和期刊上发表多篇学术论文，曾就职于德国KUKA Robotics从事协作机器人智能应用研发工作，目前在海康威视研究院任算法专家，负责深度学习、强化学习等领域的创新研究和落地应用，同时也是互联网社区“深度强化学习实验室”核心成员。

本书特点

本书从工业界一线算法工作者的视角，对深度强化学习落地实践中的工程经验和相关方法论做出了深度思考和系统归纳。本书跳出了原理介绍加应用案例的传统叙述模式，转而在横向上对深度强化学习落地过程中的核心环节进行了完整复盘。主要内容包括需求分析和算法选择的方法，动作空间、状态空间和回报函数设计的理念，训练调试和性能冲刺的技巧等。

赠书

接下来是福利时间，本次我们赠送出3本书籍（前5次获得赠书的朋友不能再参与本次赠书活动），想要获得书籍的同学，在本公众号下方留言，根据点赞数的高低，下周二晚上（9.28）22:00统计出获奖读者并进行公示，届时联系有三微信Longlongtogo即可。

如果没有获得赠书，也可以在京东和当当购买，链接如下：

往期相关

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

【计算机视觉】Pixel逐像素分类&Mask掩码分类理解摘要

魔乐社区

计算机视觉（opencv）实战三十二——CascadeClassifier 人脸微笑检测（摄像头）

本文从原理到实现，详细介绍了基于 OpenCV Haar 分类器的人脸与微笑检测：讲解了 Haar 特征和级联检测原理。对代码逐行拆解并解释参数含义。画出完整流程图，帮助理解执行过程。给出了常见问题和优化建议，甚至扩展到深度学习方法。这种方法简单、轻量、实时性好，非常适合入门和小型应用项目。但如果需要更高准确率和更强鲁棒性，建议使用深度学习检测器替代 Haar 分类器。