neo4j-python-pandas-py2neo-v3

利用pandas将excel中数据抽取,以三元组形式加载到neo4j数据库中构建相关知识图谱

Neo4j知识图谱构建

iObQkn.png

1.运行环境:

python3.6.5
windows10
具体包依赖可以参考文件requirements.txt

pip install -r requirements.txt

2.Pandas抽取excel数据

Excel数据结构如下

iObTc8.png

通过函数data_extraction和函数relation_extrantion分别抽取构建知识图谱所需要的节点数据以及联系数据,构建三元组。
数据提取主要采用pandas将excel数据转换成dataframe类型
invoice_neo4j.py
iOb4ht.png

3.建立知识图谱所需节点和边数据

DataToNeo4jClass.py
iXk6iV.png

Enjoy it!

详细内容请到github上下载 项目地址

数据驱动变革-云将 个人博客地址

转载于:https://www.cnblogs.com/skyell/p/10063407.html

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐