【强化学习入门】OOXX / tic tac toe / 井字棋通过基于Error的学习法结合epsilon-greedy方法进行训练（含代码）

强化学习-井字棋的解决方案

Jayetchellot · 2023-03-05 16:28:12 发布

代码里注释地很清楚了
第一次敲关于强化学习的代码
代码见：github项目地址

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

工业物联网时序数据库选型指南：Apache IoTDB 技术架构与实战解析

面向未来的工业大数据架构：时序数据库（TSDB）选型避坑指南和国产化思考

宇树G1-D：人形机器人下一步方向！

查看更多评论

已为社区贡献2条内容

【强化学习入门】OOXX / tic tac toe / 井字棋 通过基于Error的学习法结合epsilon-greedy方法进行训练（含代码）