【什么是知识图谱？】

知识图谱是一种以图结构（节点+边）组织和表达知识的方法，包含实体、关系和属性。其构建涉及数据收集、知识抽取、融合与存储，应用覆盖搜索、问答、推荐等多个领域。知识图谱可与RAG（检索增强生成）结合，通过语义扩展和逻辑推理提升大模型回答的准确性与可解释性。核心流程包括数据来源→知识构建→存储管理→应用交互，最终实现结构化知识的系统化利用。

严文文-Chris

1031人浏览 · 2025-08-25 11:34:40

严文文-Chris · 2025-08-25 11:34:40 发布

一、什么是知识图谱？

定义：知识图谱（Knowledge Graph, KG）是一种用 图结构（节点+边）来组织和表达知识的方法。
- 节点（实体）：人、事物、概念等
- 边（关系）：实体之间的语义联系
- 属性：描述实体特征的信息

简单理解：它是“关系型百科全书”，不仅告诉你“是什么”，还告诉你“它与什么有关”。

二、系统化（与知识图谱相关但在其外部的元素）

数据来源环境：数据库、文本、网页、传感器、日志
计算支撑环境：自然语言处理（NLP）、知识抽取、图数据库
应用交互环境：搜索引擎、问答系统、推荐系统、智能助理
设计约束：实时性、可扩展性、数据质量、知识更新

👉 这些外部条件决定了知识图谱能否落地，以及以什么方式落地。

三、全局化（组成知识图谱的核心元素，按维度展开）

1. 数据维度

结构化数据（如数据库中的表）
半结构化数据（如JSON、XML）
非结构化数据（如文本、文档、网页、对话记录）

2. 知识构建维度

实体识别（从文本中找到人、地、物）
关系抽取（发现实体间的语义关系）
知识融合（解决不同来源的歧义、同义）
知识推理（基于已知关系推出新知识）

3. 存储与管理维度

图数据库（Neo4j、JanusGraph）
RDF 三元组存储（subject-predicate-object）
SPARQL 等查询语言

4. 应用维度

语义搜索（理解“语义”而不是关键词匹配）
智能问答（像百科式对话）
推荐系统（基于知识图谱的关联推荐）
风控、金融、医疗、政务等垂直行业应用

四、结构化（元素之间的关系）

数据来源 → 知识抽取 → 知识图谱存储 → 应用
实体 ↔ 关系 ↔ 属性 三元组结构构成知识图谱的核心。
知识图谱 ↔ RAG：图谱提供结构化知识，RAG 提供灵活的自然语言生成。

五、知识图谱的构建、保存与使用

生成（构建）
- 数据收集 → 文本清洗
- 实体识别（NER）
- 关系抽取（RE）
- 构建三元组（实体–关系–实体）
- 知识融合（统一命名、消歧义）
- 知识推理（补充缺失关系）
保存
- 存储在图数据库（Neo4j、TigerGraph）
- 使用 RDF/OWL 格式进行语义存储
- 支持 SPARQL/Gremlin 等查询
使用
- 查询（SPARQL）
- 语义搜索（增强信息检索）
- 驱动推荐、QA、决策系统
- 与大模型结合进行问答和推理

六、知识图谱与 RAG 的结合

RAG（检索增强生成）的流程是：

用户提问
系统从知识库中检索相关信息
把检索到的信息作为上下文提供给大模型
大模型生成更精准的回答

结合方式

传统 RAG：检索基于向量数据库（语义相似度）
知识图谱增强 RAG：
1. 检索阶段 → 不仅用语义相似度，还用知识图谱中的“关系路径”进行语义扩展。
  - 例：用户问“爱因斯坦的学生有哪些？” → KG 能沿着“师生关系”找到答案
2. 提示阶段 → 把知识图谱三元组作为补充上下文输入大模型
3. 推理阶段 → 结合 KG 的逻辑关系，避免模型编造（hallucination）

👉 好处：减少幻觉，回答更可解释。

七、总结一句话

知识图谱 = 有关系的百科
场景 = 搜索、问答、推荐、风控、医疗、金融等
构建流程 = 数据收集 → 知识抽取 → 融合 → 存储 → 使用
与 RAG 结合 = 用图谱做语义补充和逻辑推理，让大模型更准确、更可控

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

cover

量化挑战赛冠军专访：4小时啃下W4A8量化，我靠的是这些经验

cover

「极限压缩量化未来」Modelers GeekDay上海站圆满落幕

cover

替你试过了，消费级显卡可以跑的开源文生图SOTA模型，顶级渲染、高密度文本绘图

所有评论(0)

查看更多评论

严文文-Chris

@yanwenwennihao

已为社区贡献4条内容