如果你对MindSpore感兴趣,可以关注昇思MindSpore社区

在这里插入图片描述

在这里插入图片描述

大模型平台

平台说明

昇思大模型平台旨在为AI学习者和开发者提供在线学习的项目、模型、大模型体验和数据集的平台。我们也添加了各领域的经典数据集来帮助学习者解决AI学习过程中的一系列难题, 如高质量的数据集不易获得,以及本地难以使用大体量数据集进行模型训练等。为用户提供多种业务场景的支持。

本文将引导用户对该平台的基础功能进行一个快速浏览, 以便用户了解该平台的主要功能。

快速开始

我们的平台提供了四大模块,分别是:

项目模块:覆盖多领域任务,体验全流程开发,支持用户在线训练和推理可视化,可创建自己的项目空间。

模型模块:覆盖全领域主流模型,可体验MindSpore大模型推理API,用户既可下载公开的预训练模型,也可以上传自行训练的模型文件。

大模型模块:在线体验预训练超大模型任务。

数据集模块:在数据集仓库中,你既可以下载公开的数据集,也可以上传合规的数据集。

鼠标点击头像栏按钮即可快速进入个人中心:

平台内容

平台主要有项目、模型、数据集、三大部分,

  • 项目:覆盖多领域任务,体验全流程开发,支持用户在线训练和推理可视化,可创建自己的项目空间。
  • 模型:覆盖全领域主流模型,可体验MindSpore大模型推理API,用户既可下载公开的预训练模型,也可以上传自行训练的模型文件。
  • 大模型:在线体验预训练超大模型任务。
  • 数据集:在数据集仓库中,你既可以下载公开的数据集,也可以上传合规的数据集。

昇思大模型平台为使用者预置华为AI Mindspore深度学习开发框架点击即可配置开发环境。

昇思大模型平台:让AI学习更简单!

登录昇思大模型平台:https://xihe.mindspore.cn/projects ,选择在线编程进行体验

启动Ascend

进入后左侧有相关目录可以进行学习参考

进入LLM原理和实践,可以查看到很多应用案例

应用体验

点击运行该案例,会逐步往下运行,运行结果需要等待 

安装mindspore等包 

模型与数据集加载

本案例对roberta-large模型基于GLUE基准数据集进行prompt tuning。

prompt tuning配置,任务类型选为"SEQ_CLS", 即序列分类。

加载tokenizer。如模型为GPT、OPT或BLOOM类模型,从序列左侧添加padding,其他情况下从序列右侧添加padding。

打印训练集

加载模型这里需要花较长时间,需耐心等待,警告可忽略,0.29%参数参与

模型微调(prompt tuning)

指定优化器和学习率调整策略

按照如下步骤定义训练逻辑:

1、构建正向计算函数

2、函数变换,获取微分函数

3、定义训练一个step的逻辑

4、遍历训练数据集进行模型训练,同时每一个epoch后,遍历验证数据集获取当前的评价指标(accuracy、f1 score)

最后得出训练20轮后的评价指标

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐