1、FLUE数据集

GLUE包含九项自然语言理解任务(NLU)数据集,均为英语。

数据集 Train Test 简介
CoLA 8.5k 1k 单句子分类任务,二分类,判断句子是否合法。
SST-2 67k 1.8k 单句子分类任务,二分类,判断句子情感极性。
MRPC 3.7k 1.7k 每个样例是两个句子,判断句子对是否是相同意思,二分类。
STSB 7k 1.4k 判断句子对相似性,分数为1~5。
QQP 364k 391k 判定句子对是否等效,等效、不等效两种情况,二分类任务。
MNLI 393k 20k 句子对,一个前提,一个是假设。前提和假设的关系有三种情况:蕴含(entailment),矛盾(contradiction),中立(neutral)。句子对三分类问题。
QNLI 105k 5.4k 判断问题(question)和句子(sentence)是否蕴含,蕴含和不蕴含,二分类。
RTE 2.5k 3k 判断句子对是否蕴含,句子1和句子2是否互为蕴含,二分类任务。
WNLI 634 146 判断句子对是否相关,蕴含和不蕴含,二分类任务。
Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐