本文探讨了利用深度强化学习玩星际争霸2的可能性。作者首先指出,传统的人类玩家需要投入大量时间和精力来学习游戏策略和操作技巧,而程序员则可以通过Python代码来操控游戏。然而,即使是利用代码,也需要掌握大量的游戏策略。

作者提出,是否可以利用深度强化学习来直接操控游戏。为了实现这一目标,需要定义模型的输入和输出。输入可以是游戏画面、图形化表示或数值向量,而输出则是模型可以执行的动作,例如扩展基地、攻击敌人等。

作者认为,小地图是模型输入的最佳选择。他建议构建一个包含关键信息的自定义小地图,并使用颜色亮度来表示资源数量、建筑和单位的生命值等信息。作者展示了初步的自定义小地图,其中矿物资源的亮度与数量相关,敌人的起始位置用红色标记。

文章最后提到,作者计划使用类似的策略来标记敌方单位,并进一步完善自定义小地图。总体而言,文章简要介绍了利用深度强化学习玩星际争霸2的思路,并展示了自定义小地图的初步设计。

通过 Stable Baselines 3 和星际争霸 2 探索强化学习。代码和模型:https://github.com/Sentdex/SC2RLStable Baselines 3 教程:https://pythonprogramming.net/introduction-reinforcement-learning-stable-baselines-3-tutorial/从零开始的神经网络书籍:https://nnfs.io

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐