书生浦语大模型实战营第六次课笔记-OpenCompass大模型评测
2. 为什么需要评测3. 需要评测什么4. 如何评测大模型5. 主流大模型评测框架6. 大模型评测领域的挑战
·

1. 关于评测的三个问题

2. 为什么需要评测


3. 需要评测什么


4. 如何评测大模型




5. 主流大模型评测框架









6. 大模型评测领域的挑战

7. 动手实践
7.1 环境安装
直接git clone会有网络问题,解决办法:



7.2 数据准备
略
7.3 启动评测

跑了好久,终于跑完

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐


所有评论(0)