1. 关于评测的三个问题

2. 为什么需要评测

3. 需要评测什么

4. 如何评测大模型

5. 主流大模型评测框架

6. 大模型评测领域的挑战

7. 动手实践

7.1 环境安装

直接git clone会有网络问题,解决办法:

7.2 数据准备

7.3 启动评测

跑了好久,终于跑完

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐