知识图谱(二)之doccano的使用
Doccano是一款开源文本标注工具,支持命名实体识别、文本分类等任务。在文本分类任务中,用户可创建数据集并导入TextFile、CSV、JSON等多种格式数据。操作流程包括:创建标签、选择标注员(如"小明")、进行数据标注,最后导出标注结果。该工具为文本标注提供了便捷的解决方案。
·
一:doccano简介
Doccano(多卡诺)是一种用于文本标注的开源工具,支持多种常见的文本标注任务,如命名实体识别、文本分类、关系抽取等。

二:doccano之文本分类任务
2.1创建数据集
2.1.1支持的数据集类型
TextFile:把整个文件当做对象
TextLine:文件的每一行当做一个对象
CSV
fastText
JSON:把整个json当做一个对象
JSONL:把json中的每一行当做一个对象
2.1.2导入数据的方法


2.2创建标签

2.3创建成员
选择小明作为标注员

2.4数据标注

2.5标注数据导出

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐


所有评论(0)