知识图谱之NELL数据集简介
1 NELL数据集简介来源:NELL1.1 目录结构train_tasks.jsondev_tasks.jsontest_tasks.jsonent2idsrelation2idspath_graphe1rel_e2.jsonrel2candidates.json1.2 对应文件的解释训练集:每个关系所在的三元组的数量在50到500之间51个关系验证集:每个关系所在的三元组的数量在50到500之间
·
1 NELL数据集简介
来源:NELL
1.1 目录结构
- train_tasks.json
- dev_tasks.json
- test_tasks.json
- ent2ids
- relation2ids
- path_graph
- e1rel_e2.json
- rel2candidates.json
1.2 对应文件的解释
- 训练集:每个关系所在的三元组的数量在50到500之间 51个关系
- 验证集:每个关系所在的三元组的数量在50到500之间 5个关系
- 测试集:每个关系所在的三元组的数量在50到500之间 11个关系
- 所有实体对应id
- 除了训练集、验证集和测试集所有关系的关系所对应的id
- 除了训练集、验证集和测试集所有关系的关系所包含的三元组
- 存在于训练集、验证集和测试集中的所有关系对应的正确三元组
- 存在于训练集、验证集和测试集中的所有关系对应候选实体(根据实体类型的约束得到的)
1.3 数据探索
-
读取文件
train_tasks = json.load(open("FAAN/NELL/train_tasks.json")) print(len(train_tasks)) # 51 ent2id = json.load(open('FAAN/NELL/ent2ids')) print(len(ent2id)) # 68544
2 Wiki数据集简介
来源:Wiki
未完待续~~~

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)