细粒度用户评论情感分析数据集(2018-AI-challenger)介绍
·
细粒度用户评论情感分析数据集(2018-AI-challenger)介绍
数据集概述
本数据集是针对细粒度用户评论情感分析的研究任务而构建的,包含了2018年AI挑战者比赛的情感分析数据。数据集涵盖6大类别的情感分析,共计20个细粒度要素,旨在帮助研究者和开发人员理解和分析用户评论中的深层次情感倾向。
数据集结构
数据集被划分为四个部分:训练集、验证集、测试A集和测试B集。以下是每个部分的简要说明:
- 训练集:用于模型训练的数据,提供了丰富的样本以便算法学习识别细粒度情感倾向。
- 验证集:用于模型验证的数据,帮助评估模型在未知数据上的表现。
- 测试A集:用于模型测试的数据,旨在评估模型的泛化能力。
- 测试B集:与测试A集相同,用于进一步验证模型的性能。
数据特点
- 评价对象的层次划分:数据集中的评价对象分为两个层次,粗粒度层次包含评论文本中提到的总体评价对象,如服务、位置等;细粒度层次则关注具体情感对象,如服务人员的态度、排队等候时间等。
- 情感倾向的状态:每个细粒度要素都标记有四种情感倾向状态,包括正向、中性、负向以及未提及,为情感分析提供了明确的标注基准。
使用说明
在利用本数据集进行研究和开发时,请确保遵守数据使用的相关伦理和隐私政策,尊重数据版权,不得用于任何商业用途。
我们期待通过这个数据集,能够促进细粒度情感分析技术的发展,并为相关领域的研究提供有力支持。
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐


所有评论(0)