细粒度用户评论情感分析数据集(2018-AI-challenger)介绍

史剑咪Nessa

929人浏览 · 2025-04-18 14:19:36

史剑咪Nessa · 2025-04-18 14:19:36 发布

细粒度用户评论情感分析数据集(2018-AI-challenger)介绍

【下载地址】细粒度用户评论情感分析数据集2018-AI-challenger介绍这个开源项目提供了一个专门用于细粒度用户评论情感分析的高质量数据集，源自2018年AI挑战者比赛。数据集涵盖六大类别和二十个细粒度要素，深入分析用户评论中的情感倾向。数据分为训练集、验证集和两个测试集，支持模型训练、验证和性能评估。每个细粒度要素标记了四种情感状态，包括正向、中性、负向和未提及，为研究提供了明确的标注基准。该数据集不仅适用于学术研究，还能为开发人员提供宝贵资源，推动细粒度情感分析技术的进步。使用数据时请遵守相关伦理和隐私政策，确保数据仅用于非商业用途。项目地址: https://gitcode.com/Universal-Tool/c721a

数据集概述

本数据集是针对细粒度用户评论情感分析的研究任务而构建的，包含了2018年AI挑战者比赛的情感分析数据。数据集涵盖6大类别的情感分析，共计20个细粒度要素，旨在帮助研究者和开发人员理解和分析用户评论中的深层次情感倾向。

数据集结构

数据集被划分为四个部分：训练集、验证集、测试A集和测试B集。以下是每个部分的简要说明：

训练集：用于模型训练的数据，提供了丰富的样本以便算法学习识别细粒度情感倾向。
验证集：用于模型验证的数据，帮助评估模型在未知数据上的表现。
测试A集：用于模型测试的数据，旨在评估模型的泛化能力。
测试B集：与测试A集相同，用于进一步验证模型的性能。

数据特点

评价对象的层次划分：数据集中的评价对象分为两个层次，粗粒度层次包含评论文本中提到的总体评价对象，如服务、位置等；细粒度层次则关注具体情感对象，如服务人员的态度、排队等候时间等。
情感倾向的状态：每个细粒度要素都标记有四种情感倾向状态，包括正向、中性、负向以及未提及，为情感分析提供了明确的标注基准。

使用说明

在利用本数据集进行研究和开发时，请确保遵守数据使用的相关伦理和隐私政策，尊重数据版权，不得用于任何商业用途。

我们期待通过这个数据集，能够促进细粒度情感分析技术的发展，并为相关领域的研究提供有力支持。

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

小参数・大码力・易部署 | Qwen3.6-27B上线魔乐社区，基于昇腾的部署教程来了

继一周前模型开源发布后，千问再度开源Qwen3.6-27B —— 一个拥有270亿参数的稠密多模态模型，也是社区呼声最高的模型规格。Qwen3.6-27B 依然支持多模态思考与非思考模式，在智能体编程方面达到了旗舰级表现，全面超越前代开源旗舰 Qwen3.5-397B-A17B（总参数397B / 激活参数17B的MoE模型）。作为稠密架构，它无需MoE路由即可部署，是开发者在实用、可广泛部署规模