假新闻检测数据集·Fake-News-Detection-dataset
标题:Fake-News-Detection-dataset源地址: https://huggingface.co/datasets/Pulk17/Fake-News-Detection-dataset下载方式1:https://pan.quark.cn/s/5515900a3f39下载方式2:https://pan.baidu.com/s/1CyzsshM2fpKsNEtw5VBszg?pwd=
·
一、来源和下载
标题:Fake-News-Detection-dataset
源地址: https://huggingface.co/datasets/Pulk17/Fake-News-Detection-dataset
下载方式1:https://pan.quark.cn/s/5515900a3f39
下载方式2:https://pan.baidu.com/s/1CyzsshM2fpKsNEtw5VBszg?pwd=rf5t 提取码: rf5t
二、数据集核心信息
(一)基本属性
| 属性 | 详情 |
|---|---|
| 数据集创建者 | Pulk17 |
| 数据集名称 | Fake-News-Detection-dataset |
| 点赞数 | 11 |
| 数据形式 | 模态(Modalities):表格(Tabular)、文本(Text);格式(Formats):csv;支持库(Libraries):Datasets、pandas |
| 数据规模 | 10K - 100K量级,具体包含30,000行数据 |
| 数据文件大小 | 下载的数据集文件大小78.4 MB,自动转换的Parquet文件大小48.3 MB |
(二)数据结构
- 子集(Subset):仅1个默认子集,含30k行数据
- 数据拆分(Split):仅1个训练集(train),含30k行数据
- 字段说明:
- Unnamed: 0:数据编号,类型为int64,取值范围0 - 23.5k
- title:新闻标题,类型为string,长度范围8 - 279
- text:新闻正文,类型为string,长度范围5 - 51.8k
- subject:新闻主题,类型为string,包含8类取值(如politicsNews、Government News、worldnews等)
- date:新闻日期,类型为string,长度范围9 - 145,时间跨度主要在2015 - 2017年
- label:新闻标签(0表示假新闻,1表示真新闻),类型为int64,取值0或1
三、数据预览与示例
页面展示了多条新闻数据示例,涵盖真、假新闻,涉及政治、政府、国际等多个主题,以下为部分典型示例:
- 真新闻示例(label=1):
- 标题:Ex-CIA head says Trump remarks on Russia interference ‘disgraceful’
- 主题:politicsNews
- 日期:July 22, 2017
- 内容:前中情局局长约翰·布伦南批评特朗普淡化美国情报机构关于俄罗斯干预2016年美国大选评估的言论“可耻”,同时提及相关调查及其他前官员的批评观点
- 假新闻示例(label=0):
- 标题:YOU WON’T BELIEVE HIS PUNISHMENT! HISPANIC STORE OWNER Swindles Tax Payers Out Of $1,116,924.27 In Latest Food Stamp Scam
- 主题:Government News
- 日期:Jun 19, 2017
- 内容:声称一名西班牙裔商店店主通过食品券欺诈骗取美国纳税人111万多美元,却仅面临最高5年监禁,文中存在煽动性表述且缺乏权威信源支撑
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐



所有评论(0)