在这里插入图片描述

强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。

该论文集共收录101篇论文,最高引用数是34689,来自谷歌DeepMind及伦敦大学学院的David Silver在该领域发表了14篇论文,在所有学者中最多。

论文集地址:https://www.aminer.cn/topic/5e7d9a78ea0348b7e22edd95

订阅了解更多论文信息,定制您的个人科研动态信息流:https://www.aminer.cn/user/notification

在这里插入图片描述

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐