Skip to main content
Version: DEV

启用 RAPTOR

一种用于长上下文知识检索和摘要的递归抽象方法,平衡了广泛的语义理解与精细细节。


RAPTOR(树组织检索的递归抽象处理)是在2024年论文中引入的增强文档预处理技术。旨在解决多跳问答问题,RAPTOR 对文档分块执行递归聚类和摘要,构建分层树结构。这使得在长文档中能够进行更具上下文感知的检索。RAGFlow v0.6.0 将 RAPTOR 集成用于文档聚类,作为数据提取和索引之间数据预处理管道的一部分,如下所示。

document_clustering

我们使用这种新方法的测试在需要复杂多步推理的问答任务上展示了最先进的(SOTA)结果。通过将 RAPTOR 检索与我们内置的分块方法和/或其他检索增强生成(RAG)方法相结合,您可以进一步提高问答准确性。

警告

启用 RAPTOR 需要大量内存、计算资源和令牌。

基本原理

原始文档被分割成分块后,分块通过语义相似性而不是它们在文本中的原始顺序进行聚类。然后,集群通过您系统的默认聊天模型被摘要为更高级别的分块。这个过程递归地应用,形成从下到上具有各种摘要级别的树结构。如下图所示,初始分块形成叶节点(以蓝色显示)并递归地摘要为根节点(以橙色显示)。

raptor

递归聚类和摘要捕获了多跳问答所需的广泛理解(通过根节点)以及精细细节(通过叶节点)。

使用场景

对于涉及复杂多步推理的多跳问答任务,问题和答案之间通常存在语义差距。因此,使用问题搜索往往无法检索到有助于正确答案的相关分块。RAPTOR 通过为聊天模型提供更丰富、更具上下文感知和相关性的分块进行摘要来解决这一挑战,实现整体理解而不丢失细节。

注意

知识图谱也可用于多跳问答任务。详细信息请参见构建知识图谱。您可以使用任一方法或两者都使用,但请确保了解所涉及的内存、计算和令牌成本。

先决条件

系统使用默认聊天模型来摘要聚类内容。在继续之前,请确保您已正确配置聊天模型:

Set default models

配置

RAPTOR 功能默认禁用。要启用它,请在知识库的配置页面上手动打开使用 RAPTOR 增强检索切换开关。

提示词

以下提示词将递归地应用于集群摘要,{cluster_content} 作为内部参数。我们建议您现在保持原样。设计将在适当时候更新。

请总结以下段落...段落如下:
{cluster_content}
以上是您需要总结的内容。

最大令牌数

每个生成的摘要分块的最大令牌数。默认为 256,最大限制为 2048。

阈值

在 RAPTOR 中,分块通过语义相似性进行聚类。阈值参数设置分块分组在一起所需的最小相似性。

默认为 0.1,最大限制为 1。较高的阈值意味着每个集群中的分块较少,而较低的阈值意味着更多。

最大集群数

要创建的最大集群数。默认为 64,最大限制为 1024。

随机种子

随机种子。点击+更改种子值。