【读邹伟等著强化学习】第1章~第7章
在阅读邹伟老师的书的时候的思考和疑问
·
ISBN: 9787302538295
第二章
p21
这个矩阵运算与p18下方的值函数自迭代公式相比,似乎少了对于a的求和号。因此我认为只有在确定性策略下这个式子才成立。
第三章
p29
策略评估中,书中说由于其他未知量已知,因此该方法的反复迭代终将收敛。这个说服力不足够。
p29
倒数第二行,类似p21的问题。另外sigma号固然可以如此安放,但是没有限定求和范围的括号。
p30
倒数第五行缺括号
p37
\pi * 那行缺括号
第四章
p53
p53p59
第六章
p113

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)