DataWhale AI夏令营-大模型微调-学习笔记1

从零入门大模型微调是 Datawhale 2024 年 AI 夏令营第四期的学习活动（“大模型技术”方向），基于讯飞开放平台“星火大模型驱动阅读理解题库构建挑战赛”开展的实践学习。学习内容：基于讯飞大模型定制训练平台和spark-13b微调模型，生成高考语文现代文阅读和英语阅读问题QA对。

dieyuanzhan

701人浏览 · 2024-08-11 22:46:29

dieyuanzhan · 2024-08-11 22:46:29 发布

Task1：从零入门大模型微调

一、问题概述

从零入门大模型微调 是 Datawhale 2024 年 AI 夏令营第四期的学习活动（“大模型技术”方向），基于讯飞开放平台“星火大模型驱动阅读理解题库构建挑战赛”开展的实践学习。学习内容：基于讯飞大模型定制训练平台和spark-13b微调模型，生成高考语文现代文阅读和英语阅读问题QA对。

二、操作步骤

Task 1 从零入门大模型微调

可以根据上面链接的步骤顺利地跑通baseline，对大模型的微调有一个初步的了解。如果创建数据集时出现错误，我们可以尝试刷新或更换浏览器的方式来解决这个问题。按照步骤一步一步地来应该没有什么太大的问题。

还有就是我们创建自己的模型的时候要注意，框起来的这几个位置要记得保存一下。

因为回到我们的notebook里面需要我们填（下面红框这里），将刚才保存的那5个填到想应的位置即可。一一对应地填，因为有的位置可能和我们保存的那个位置有差别。

我按照上面的步骤跑完baseline时的可以达到65.83333，如果想要进一步提高分数，我们可以通过优化我们的数据集、更改学习率、基于我们仅有的数据集适当地提高训练轮次等。如果训练轮次太大容易发生过拟合。我将之前的学习率 lr=0.00008减小为0.00006，训练轮次调整为17，我的分数提升到68.125。