一、来源和下载

标题:Fake-News-Detection-dataset
源地址: https://huggingface.co/datasets/Pulk17/Fake-News-Detection-dataset
下载方式1https://pan.quark.cn/s/5515900a3f39
下载方式2https://pan.baidu.com/s/1CyzsshM2fpKsNEtw5VBszg?pwd=rf5t 提取码: rf5t

二、数据集核心信息

(一)基本属性

属性 详情
数据集创建者 Pulk17
数据集名称 Fake-News-Detection-dataset
点赞数 11
数据形式 模态(Modalities):表格(Tabular)、文本(Text);格式(Formats):csv;支持库(Libraries):Datasets、pandas
数据规模 10K - 100K量级,具体包含30,000行数据
数据文件大小 下载的数据集文件大小78.4 MB,自动转换的Parquet文件大小48.3 MB

(二)数据结构

  • 子集(Subset):仅1个默认子集,含30k行数据
  • 数据拆分(Split):仅1个训练集(train),含30k行数据
  • 字段说明
    • Unnamed: 0:数据编号,类型为int64,取值范围0 - 23.5k
    • title:新闻标题,类型为string,长度范围8 - 279
    • text:新闻正文,类型为string,长度范围5 - 51.8k
    • subject:新闻主题,类型为string,包含8类取值(如politicsNews、Government News、worldnews等)
    • date:新闻日期,类型为string,长度范围9 - 145,时间跨度主要在2015 - 2017年
    • label:新闻标签(0表示假新闻,1表示真新闻),类型为int64,取值0或1

三、数据预览与示例

页面展示了多条新闻数据示例,涵盖真、假新闻,涉及政治、政府、国际等多个主题,以下为部分典型示例:

  1. 真新闻示例(label=1)
    • 标题:Ex-CIA head says Trump remarks on Russia interference ‘disgraceful’
    • 主题:politicsNews
    • 日期:July 22, 2017
    • 内容:前中情局局长约翰·布伦南批评特朗普淡化美国情报机构关于俄罗斯干预2016年美国大选评估的言论“可耻”,同时提及相关调查及其他前官员的批评观点
  2. 假新闻示例(label=0)
    • 标题:YOU WON’T BELIEVE HIS PUNISHMENT! HISPANIC STORE OWNER Swindles Tax Payers Out Of $1,116,924.27 In Latest Food Stamp Scam
    • 主题:Government News
    • 日期:Jun 19, 2017
    • 内容:声称一名西班牙裔商店店主通过食品券欺诈骗取美国纳税人111万多美元,却仅面临最高5年监禁,文中存在煽动性表述且缺乏权威信源支撑
Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐