Skip to main content
Version: DEV

构建知识图谱

为您的知识库生成知识图谱。


为了增强多跳问答,RAGFlow 在数据提取和索引之间添加了知识图谱构建步骤,如下所示。此步骤从您指定的分块方法生成的现有分块中创建额外的分块。

Image

从 v0.16.0 开始,RAGFlow 支持在知识库上构建知识图谱,允许您在知识库内的多个文件之间构建统一的图谱。当新上传的文件开始解析时,生成的图谱将自动更新。

警告

构建知识图谱需要大量内存、计算资源和令牌。

使用场景

知识图谱对于涉及嵌套逻辑的多跳问答特别有用。当您在具有复杂实体和关系的书籍或作品上进行问答时,它们优于传统的提取方法。

注意

RAPTOR(树组织检索的递归抽象处理)也可用于多跳问答任务。详细信息请参见启用 RAPTOR。您可以使用任一方法或两者都使用,但请确保了解所涉及的内存、计算和令牌成本。

先决条件

系统使用默认聊天模型来生成知识图谱。在继续之前,请确保您已正确配置聊天模型:

Set default models

配置

实体类型(必需

从知识库中提取的实体类型。默认类型为:组织人员事件类别。添加或删除类型以适应您的特定知识库。

方法

用于构建知识图谱的方法:

  • 通用:使用 GraphRAG 提供的提示词来提取实体和关系。
  • 轻量:(默认)使用 LightRAG 提供的提示词来提取实体和关系。此选项消耗更少的令牌、内存和计算资源。

实体解析

是否启用实体解析。您可以将其视为实体去重开关。启用后,LLM 将合并相似的实体 - 例如 '2025' 和 '2025年',或 'IT' 和 '信息技术' - 以构建更有效的图谱。

  • (默认)禁用实体解析。
  • 启用实体解析。此选项消耗更多令牌。

社区报告生成

在知识图谱中,社区是由关系链接的实体集群。您可以让 LLM 为每个社区生成摘要,称为社区报告。更多信息请参见此处。这表示是否生成社区报告:

  • 生成社区报告。此选项消耗更多令牌。
  • (默认)不生成社区报告。

操作步骤

  1. 在知识库的配置页面上,打开提取知识图谱或根据需要调整其设置,然后点击保存确认您的更改。

    • 知识库的默认知识图谱配置现已设置,从此点上传的文件将在解析期间自动使用这些设置。
    • 在此更新之前解析的文件将保留其原始知识图谱设置。
  2. 知识库的知识图谱不会自动更新,直到新上传的文件被解析。

    一旦创建知识图谱,知识图谱条目将出现在配置下。

  3. 点击知识图谱查看生成图谱的详细信息。

  4. 要使用创建的知识图谱,请执行以下任一操作:

    • 在聊天应用的聊天设置面板中,打开使用知识图谱切换开关。
    • 如果您使用的是 Agent,请点击检索Agent 组件来指定知识库并打开使用知识图谱切换开关。

常见问题

我可以为知识库中的不同文件设置不同的知识图谱设置吗?

是的,您可以。每个知识库只生成一个图谱。在图谱提取过程结束时,您文件的较小图谱将合并为一个大的统一图谱。

当我删除相关文件时,知识图谱会自动更新吗?

不会。知识图谱不会自动更新,直到新上传的文档被解析。

如何删除生成的知识图谱?

要删除生成的知识图谱,请删除知识库中的所有相关文件。虽然知识图谱条目仍然可见,但图谱实际上已被删除。

创建的知识图谱存储在哪里?

创建的知识图谱的所有分块都存储在 RAGFlow 的文档引擎中:Elasticsearch 或 Infinity

如何导出创建的知识图谱?

不支持。不支持导出创建的知识图谱。如果您仍然认为此功能很重要,请提出问题说明您的使用案例及其重要性。