项目地址:(但基本无法下载)
https://github.com/mhjabreel/CharCNN/tree/master/data/ag_news_csv 

AG是由ComeToMyHead超过一年的努力,从2000多不同的新闻来源搜集的超过1百万的新闻文章
ComeToMyHead是一个学术新闻搜索引擎,开始于2004年7月

csv的数据

每一条数据有三列,第一列为标签,第二列为title,第三列为content:

AG News Dataset 拥有超过 100 万篇新闻文章,其中包含 496,835 条 AG 新闻语料库中超过 2000 个新闻源的文章,该数据集仅采用了标题和描述字段,每种类别均拥有 30,000 个训练样本和 1900 个测试样本。

下载地址:https://hyper.ai/datasets/5475

智一面算法工程师的面试题提供在线GPU加速训练可直接使用数据集

 

 

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐