ICDAR2019数据集下载与使用

官网下载

Github地址

ICDAR 2019(cTDaR)将评估表检测(TRACK A)和表识别(TRACK B)方法的性能。对于第一个轨迹,提供包含一个或多个表的文档图像。对于轨迹B,存在两个子轨迹:第一个子轨迹(B.1)提供表格区域。因此,只需执行表结构识别。第二个子轨迹(B.2)不提供先验信息。这意味着必须进行表区域和表结构检测。

重要提示:

  • 对于现代数据集,没有可用于轨迹B的训练数据。请注意,现代数据集具有不同的注释(内容的边界框描述的是与历史数据集不同的单元格区域,而单元格区域由单元格区域描述),因此请求的输出也不同。
  • 现代数据集的样本前缀为“cTDaR_t1”,历史数据集的样本以“cTDaR_t0”开头。

更新说明:

发布了一个补充数据集版本ICDAR2019数据集补充,在邻接关系方面是一个有用的子集,来自中国科学院自动化研究所刘成林教授组 .

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐