GLUE 数据集
1、FLUE数据集GLUE包含九项自然语言理解任务(NLU)数据集,均为英语。数据集TrainTest简介CoLA8.5k1k单句子分类任务,二分类,判断句子是否合法。SST-267k1.8k单句子分类任务,二分类,判断句子情感极性。MRPC3.7k1.7k每个样例是两个句子,判断句子对是否是相同意思,二分类。STSB7k1.4k判断句子对相似性,分数为1~5。QQP364k391k判定句子对是否
·
1、FLUE数据集
GLUE包含九项自然语言理解任务(NLU)数据集,均为英语。
| 数据集 | Train | Test | 简介 |
|---|---|---|---|
| CoLA | 8.5k | 1k | 单句子分类任务,二分类,判断句子是否合法。 |
| SST-2 | 67k | 1.8k | 单句子分类任务,二分类,判断句子情感极性。 |
| MRPC | 3.7k | 1.7k | 每个样例是两个句子,判断句子对是否是相同意思,二分类。 |
| STSB | 7k | 1.4k | 判断句子对相似性,分数为1~5。 |
| QQP | 364k | 391k | 判定句子对是否等效,等效、不等效两种情况,二分类任务。 |
| MNLI | 393k | 20k | 句子对,一个前提,一个是假设。前提和假设的关系有三种情况:蕴含(entailment),矛盾(contradiction),中立(neutral)。句子对三分类问题。 |
| QNLI | 105k | 5.4k | 判断问题(question)和句子(sentence)是否蕴含,蕴含和不蕴含,二分类。 |
| RTE | 2.5k | 3k | 判断句子对是否蕴含,句子1和句子2是否互为蕴含,二分类任务。 |
| WNLI | 634 | 146 | 判断句子对是否相关,蕴含和不蕴含,二分类任务。 |
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐



所有评论(0)