发布说明
最新版本中的关键功能、改进和错误修复。
每个 RAGFlow 版本都提供两个版本:
- 精简版:不包含内置嵌入模型,版本名称后添加 -slim 后缀。例如:
infiniflow/ragflow:v0.20.5-slim - 完整版:包含内置嵌入模型,版本名称后无后缀。例如:
infiniflow/ragflow:v0.20.5
完整版中包含的嵌入模型有:
- BAAI/bge-large-zh-v1.5
- maidalun1020/bce-embedding-base_v1
这两个嵌入模型专门针对英语和中文进行了优化,因此如果您使用它们来嵌入其他语言的文档,性能可能会受到影响。
v0.20.5
发布于 2025 年 9 月 10 日。
改进
- Agent:
- Agent 性能优化:提高了简单任务的规划和反思速度;优化了可并行场景的并发工具调用,显著减少整体响应时间。
- 在系统提示部分提供四个框架级提示块,支持在框架级别自定义和覆盖提示,从而增强灵活性和控制力。请参阅此处。
- 执行 SQL 组件增强:将原始变量引用组件替换为文本输入字段,允许用户编写自由格式的 SQL 查询并引用变量。
- 聊天:重新启用推理和跨语言搜索。
新增模型
- 美团 LongCat
- Kimi:kimi-k2-turbo-preview 和 kimi-k2-0905-preview
- Qwen:qwen3-max-preview
- SiliconFlow:DeepSeek V3.1
修复问题
- 知识库:已删除的文件仍然可搜索。
- 聊天:无法与 Ollama 模型聊天。
- Agent:
- 引用切换失败。
- 任务模式下的 Agent 仍需要对话来触发。
- 多轮对话中的重复回答。
- 并行执行结果的重复总结。
API 变更
HTTP API
Python API
v0.20.4
发布于 2025 年 8 月 27 日。
改进
- Agent 组件:完成 Agent 组件的中文本地化。
- 引入
ENABLE_TIMEOUT_ASSERTION环境变量,用于启用或禁用文件解析任务的超时断言。 - 知识库:
- 改进 Markdown 文件解析,支持 AST 以避免意外的分块。
- 增强 HTML 解析,支持基于 bs4 的 HTML 标签遍历。
新增模型
ZHIPU GLM-4.5
新增 Agent 模板
电商客服工作流:一个专门设计的模板,用于处理产品功能查询和多产品比较(使用内部知识库),以及管理安装预约预订。
修复问题
- 知识库:
- 无法与团队共享资源。
- 对上传文件数量和大小的不当限制。
- 聊天:
- 无法预览响应中引用的文件。
- 文件上传后无法发送消息。
- OAuth2 认证失败。
- 知识库中多条件元数据搜索的逻辑错误。
- 多轮对话中引用无限增加。
v0.20.3
发布于 2025 年 8 月 20 日。
改进
- 重新设计了知识库、聊天和搜索页面的用户界面。
- 搜索和聊天:引入文档级元数据过滤,支持在聊天或搜索期间进行自动或手动过滤。
- 搜索:支持创建适合各种业务场景的搜索应用。
- 聊天:支持在单个聊天页面上比较最多三个聊天模型设置的答案性能。
- Agent:
- 在 Agent 组件中实现切换开关,用于启用或禁用引用。
- 引入拖拽方法创建组件。
- 文档:修正了 API 参考中的不准确之处。
新增 Agent 模板
- 报告 Agent:一个用于在内部问答场景中生成摘要报告的模板,支持显示表格和公式。#9427
修复问题
- v0.20.0 中引入的超时机制导致 GraphRAG 等任务停止。
- Agent 组件中预定义的开场问候语在对话中缺失。
- 提示编辑器中的自动换行问题。
- PyPDF 导致的内存泄漏问题。#9469
API 变更
已弃用
v0.20.1
发布于 2025 年 8 月 8 日。
新功能
- 检索组件现在支持使用变量动态指定知识库名称。
- 用户界面现在包含法语选项。
新增模型
- GPT-5
- Claude 4.1
新增 Agent 模板(工作流和 Agent 模式)
- SQL 助手工作流:使非技术团队(如运营、产品)能够独立查询业务数据。
- 选择您的知识库工作流:让用户在对话期间选择要查询的知识库。#9325
- 选择您的知识库 Agent:提供更高质量的响应,延长推理时间,适合复杂查询。#9325
修复问题
- Agent 组件无法调用通过 vLLM 安装的模型。
- Agent 无法与团队共享。
- 将 Agent 嵌入网页功能不正常。
v0.20.0
发布于 2025 年 8 月 4 日。
兼容性变更
从 v0.20.0 开始,Agent 不再与早期版本兼容,所有来自以前版本的现有 Agent 必须在升级后重新构建。
新功能
- 统一编排 Agent 和工作流。
- Agent 的全面重构,大大增强了其功能和可用性,支持多 Agent 配置、规划和反思以及可视化功能。
- 完全实现 MCP 功能,支持 MCP 服务器导入、Agent 作为 MCP 客户端运行,以及 RAGFlow 本身作为 MCP 服务器运行。
- 访问 Agent 的运行时日志。
- 通过管理面板提供与 Agent 的聊天历史记录。
- 集成更强大的 Infinity 新版本,以 Infinity 作为底层文档引擎启用自动标记功能。
- 支持文件引用信息的 OpenAI 兼容 API。
- 支持新模型,包括 Kimi K2、Grok 4 和 Voyage 嵌入。
- RAGFlow 的代码库现在在 Gitee 上镜像。
- 引入新的模型提供商 Gitee AI。
引入的新 Agent 模板
- 基于多 Agent 的深度研究:由主导 Agent 和多个子 Agent 协作的团队合作,不同于传统的工作流编排。
- 利用内部知识库的智能问答聊天机器人,专为客服和培训场景设计。
- RAGFlow 团队用于筛选、分析和记录候选人信息的简历分析模板。
- 将原始想法转化为 SEO 友好博客内容的博客生成工作流。
- 智能客服工作流。
- 通过语义分析将用户反馈引导到适当团队的用户反馈分析模板。
- 旅行规划器:使用网络搜索和地图 MCP 服务器协助旅行规划。
- 图像语言:翻译上传照片中的内容。
- 从内部知识库和网络检索答案的信息搜索助手。
v0.19.1
发布于 2025 年 6 月 23 日。
修复问题
- 高并发请求期间的内存泄漏问题。
- 启用 GraphRAG 实体解析时大文件解析冻结。#8223
- 在独立模式下使用沙箱时发生的上下文错误。#8340
- Ollama 导致的 CPU 使用率过高问题。#8216
- 代码组件中的错误。#7949
- 通过 API 创建知识库时添加了对通过 Ollama 或 VLLM 安装的模型的支持。#8069
- 为 S3 存储桶访问启用了基于角色的身份验证。#8149
新增模型
v0.19.0
发布于 2025 年 5 月 26 日。
新功能
- 在知识和聊天模块中支持跨语言搜索,增强了多语言环境(如中英知识库)中的搜索准确性和用户体验。
- Agent 组件:新的代码组件支持 Python 和 JavaScript 脚本,使开发者能够处理更复杂的任务,如动态数据处理。
- 增强的图像显示:聊天和搜索中的图像现在直接在响应中渲染,而不是作为外部引用。知识检索测试可以直接检索图像,而不是从图像中提取的文本。
- Claude 4 和 ChatGPT o3:开发者现在可以使用新发布的最先进的 Claude 模型和 OpenAI 最新的 ChatGPT o3 推理模型。
以下功能由我们的社区贡献:
- Agent 组件:在生成组件中启用工具调用。感谢 notsyncing。
- Markdown 渲染:Markdown 文件中的图像引用可以在分块后显示。感谢 Woody-Hu。
- 文档引擎支持:OpenSearch 现在可以用作 RAGFlow 的文档引擎。感谢 pyyuhao。
文档
新增文档
v0.18.0
发布于 2025 年 4 月 23 日。
兼容性变更
从本版本开始,内置重排序模型已被移除,因为它们对检索率的影响很小,但会显著增加检索时间。
新功能
- MCP 服务器:通过 MCP 启用对 RAGFlow 知识库的访问。
- DeepDoc 支持在文档布局识别期间采用 VLM 模型作为处理管道,实现对 PDF 和 DOCX 文件中图像的深入分析。
- OpenAI 兼容 API:Agent 可以通过 OpenAI 兼容 API 调用。
- 用户注册控制:管理员可以通过环境变量启用或禁用用户注册。
- 团队协作:Agent 可以与团队成员共享。
- Agent 版本控制:所有更新都会持续记录,可以通过导出回滚到以前的版本。

改进
- 增强的答案引用:生成响应中的引用准确性得 到改善。
- 增强的问答体验:用户现在可以在对话期间手动停止流式输出。
文档
新增文档
v0.17.2
发布于 2025 年 3 月 13 日。
兼容性变更
- 从聊天配置中移除 Max_tokens 设置。
- 从生成、重写、分类、关键词 Agent 组件中移除 Max_tokens 设置。
从本版本开始,如果您仍然看到 RAGFlow 的响应被截断,请检查您的模型提供商的 Max_tokens 设置。
改进
- 添加 OpenAI 兼容 API。
- 引入德语用户界面。
- 加速知识图谱提取。
- 在检索 Agent 组件中启用基于 Tavily 的网络搜索。
- 添加通义千问 QwQ 模型(OpenAI 兼容)。
- 在通用分块方法中支持 CSV 文件。
修复问题
- 无法通过 Ollama/Xinference 添加模型,这是 v0.17.1 中引入的问题。
API 变更
HTTP API
Python API
v0.17.1
发布于 2025 年 3 月 11 日。
改进
- 改善英语分词质量。
- 改善 Markdown 文档解析中的表格提取逻辑。
- 更新 SiliconFlow 的模型列表。
- 支持解析 XLS 文件(Excel 97-2003),并改进了相应的错误处理。
- 支持 Huggingface 重排序模型。
- 在聊天助手和重写 Agent 组件中启用相对时间表达式("现在"、"昨天"、"上周"、"明年"等)。
修复问题
- 重复的知识图谱提取问题。
- API 调用问题。
- PDF 解析器(即文档解析器)下拉菜单中的选项缺失。
- Tavily 网络搜索问题。
- 无法在 AI 聊天中预览图表或图像。
文档
新增文档
v0.17.0
发布于 2025 年 3 月 3 日。
新功能
- AI 聊天:实现深度研究以进行 Agent 推理。要激活此功能,请在聊天助手对话的提示引擎标签下启用推理切换开关。
- AI 聊天:利用基于 Tavily 的网络搜索来增强 Agent 推理中的上下文。要激活此功能,请在聊天助手对话的助手设置标签下输入正确的 Tavily API 密钥。
- AI 聊天:支持在不指定知识库的情况下开始聊天。
- AI 聊天:除了 PDF 文件外,HTML 文件也可以预览和引用。
- 知识库:在知识库配置中添加PDF 解析器(即文档解析器)下拉菜单。这包括一个耗时的 DeepDoc 模型选项、一个更快的朴素选项(纯文本),跳过 DLA(文档布局分析)、OCR(光学字符识别)和 TSR(表格结构识别)任务,以及几个目前实验性的大模型选项。请参阅此处。
- Agent 组件:在生成或模板组件的系统提示字段中,可以使用 (x) 或正斜杠
/来插入可用的键(变量)。 - 对象存储:支持使用阿里云 OSS(对象存储服务)作为文件存储选项。
- 模型:更新通义千问(Qwen)的支持模型列表,添加 DeepSeek 特定模型;添加 ModelScope 作为模型提供商。
- API:可以通过 API 更新文档元数据。
以下图表说明了 RAGFlow 深度研究的工作流程:
以下是集成深度研究的对话截图:
API 变更
HTTP API
为更新文档方法添加了 "meta_fields" 请求体参数。
Python API
为更新文档方法添加了 "meta_fields" 键选项。
文档
新增文档
v0.16.0
发布于 2025 年 2 月 6 日。
新功能
- 支持 DeepSeek R1 和 DeepSeek V3。
- GraphRAG 重构:知识图谱在整个知识库(知识库)上动态构建,而不是在单个文件上,并在新上传的文件开始解析时自动更新。请参阅此处。
- 添加迭代 Agent 组件和研究报告生成器 Agent 模板。请参阅此处。
- 新 UI 语言:葡萄牙语。
- 允许为知识库中的特定文件设置元数据,以增强 AI 驱动的聊天。请参阅此处。
- 将 RAGFlow 的文档引擎 Infinity 升级到 v0.6.0.dev3。
- 支持 DeepDoc 的 GPU 加速(请参阅 docker-compose-gpu.yml)。
- 支持创建和引用标签知识库,作为弥合查询和响应之间语义差距的关键里程碑。
标签知识库功能在 Infinity 文档引擎上不可用。
文档
新增文档
v0.15.1
发布于 2024 年 12 月 25 日。
升级
- 将 RAGFlow 的文档引擎 Infinity 升级到 v0.5.2。
- 增强文档解析状态的日志显示。
修复问题
本版本修复了以下问题:
- Infinity 返回的
SCORE not found和position_int错误。 - 一旦特定知识库中的嵌入模型被更改,其他知识库中的嵌入模型就无法再更改。
- 由于重复加载嵌入模型导致问答和 AI 搜索响应缓慢。
- 使用 RAPTOR 解析文档失败。
- 使用表格解析方法导致信息丢失。
- 各种 API 问题。
API 变更
HTTP API
为以下 API 添加了可选的 "user_id" 参数:
v0.15.0
发布于 2024 年 12 月 18 日。
新功能
- 引入额外的 Agent 特定 API。
- 支持使用页面排名分数来改善跨多个知识库搜索时的检索性能。
- 在聊天和 Agent 中提供 iframe,便于将 RAGFlow 集成到您的网页中。
- 添加用于在 Kubernetes 上部署 RAGFlow 的 Helm 图表。
- 支持以 JSON 格式导入或导出 Agent。
- 支持 Agent 组件/工具的步骤运行。
- 添加新的 UI 语言:日语。
- 支持从失败中恢复 GraphRAG 和 RAPTOR,增强任务管理弹性。
- 添加更多 Mistral 模型。
- 为 UI 添加暗黑模式,允许用户在浅色和深色主题之间切换。
改进
- 升级 DeepDoc 中的文档布局分析模型。
- 使用 Infinity 作为文档引擎时显著增强检索性能。
API 变更
HTTP API
Python API
v0.14.1
发布于 2024 年 11 月 29 日。
改进
添加 Infinity 的配置文件 以促进 Infinity 作为文档引擎的集成和自定义。从本版本开始,可以在 RAGFlow 内直接更新 Infinity 的配置,使用 docker compose 重启 RAGFlow 后立即生效。#3715
修复问题
本版本修复了以下问题:
- 点击后无法显示或编辑分块内容。
- Elasticsearch 中的
'Not found'错误。 - 解析过程中中文文本出现乱码。
- 与 Polars 的兼容性问题。
- Infinity 和 GraphRAG 之间的兼容性问题。
v0.14.0
发布于 2024 年 11 月 26 日。
新功能
- 支持 Infinity 或 Elasticsearch(默认)作为向量存储和全文索引的文档引擎。#2894
- 通过为 Agent 添加更多变量并实现自动保存来增强用户体验。
- 添加三步翻译 Agent 模板,灵感来自 Andrew Ng 的翻译 Agent。
- 添加 SEO 优化的博客写作 Agent 模板。
- 提供用于与 Agent 对话的 HTTP 和 Python API。
- 支持在检索过程中使用英语同义词。
- 优化术语权重计算,将检索时间减少 50%。
- 通过额外的性能指标改善任务执行器监控。
- 用 Valkey 替换 Redis。
- 添加三种新的 UI 语言(由社区贡献):印尼语、西班牙语和越南语。
兼容性变更
从本版本开始,service_config.yaml.template 替换 service_config.yaml 用于配置后端服务。Docker 容器启动时,此模板文件中定义的环境变量会自动填充,并从中自动生成 service_config.yaml。#3341
这种方法消除了在更改 .env 后手动更新 service_config.yaml 的需要,便于动态环境配置。
在尝试这种新方法之前,请确保您将代码和 Docker 镜像都升级到此版本。
API 变更
HTTP API
Python API
文档
新增文档
v0.13.0
发布于 2024 年 10 月 31 日。
新功能
- 为所有用户添加团队管理功能。
- 更新 Agent UI 以提高可用性。
- 在通用分块方法中添加对 Markdown 分块的支持。
- 在 Agent UI 中引入调用工具。
- 集成对 Dify 知识库 API 的支持。
- 添加对 GLM4-9B 和 Yi-Lightning 模型的支持。
- 引入用于知识库管理、知识库内文件管理和聊天助手管理的 HTTP 和 Python API。
要下载 RAGFlow 的 Python SDK:
pip install ragflow-sdk==0.13.0
文档
新增文档
v0.12.0
发布于 2024 年 9 月 30 日。
新功能
- 提供 RAGFlow Docker 镜像的精简版,不包含内置的 BGE/BCE 嵌入或重排序模型。
- 改善多轮对话的结果。
- 允许用户移除已添加的 LLM 供应商。
- 添加对 OpenTTS 和 SparkTTS 模型的支持。
- 在通用分块方法中实现Excel 转 HTML切换开关,允许用户将电子表格解析为 HTML 表格或按行的键值对。
- 添加 Agent 工具 YahooFinance 和 Jin10。
- 添加投资顾问 Agent 模板。
兼容性变更
从本版本开始,RAGFlow 提供 Docker 镜像的精简版,以改善网络访问受限用户的体验。RAGFlow Docker 镜像的精简版不包含内置的 BGE/BCE 嵌入模型,大小约为 1GB;RAGFlow 的完整版约为 9GB,包含内置嵌入模型和您在 RAGFlow UI 中选择后才会下载的嵌入模型。
默认的 Docker 镜像版本是 nightly-slim。以下列表阐明了各种版本之间的差异:
nightly-slim:最新测试 Docker 镜像的精简版。v0.12.0-slim:最新正式发布 Docker 镜像的精简版。nightly:最新测试 Docker 镜像的完整版。v0.12.0:最新正式发布 Docker 镜像的完整版。
有关升级说明,请参阅升级 RAGFlow。
文档
新增文档
v0.11.0
发布于 2024 年 9 月 14 日。
新功能
- 在 RAGFlow UI 中引入 AI 搜索界面。
- 支持通过 FishAudio 或 通义千问 TTS 进行音频输出。
- 除了 MySQL 外,还允许使用 Postgres 进行元数据存储。
- 支持使用 S3 或 Azure Blob 的对象存储选项。
- 支持模型供应商:Anthropic、Voyage AI 和 Google Cloud。
- 支持使用腾讯云 ASR 进行音频内容识别。
- 添加金融特定的 Agent 组件:文财、AkShare、YahooFinance 和 TuShare。
- 添加医疗顾问 Agent 模板。
- 支持在以下知识库上运行检索基准测试:
v0.10.0
发布于 2024 年 8 月 26 日。
新功能
- 在 Agent UI 中引入文本到 SQL 模板。
- 实现 Agent API。
- 为任务执行器添加监控。
- 引入 Agent 工具 GitHub、DeepL、百度翻译、和风天气和 GoogleScholar。
- 支持 EML 文件的分块。
- 支持更多 LLM 或模型服务:GPT-4o-mini、PerfXCloud、TogetherAI、Upstage、Novita AI、01.AI、SiliconFlow、PPIO、讯飞星 火、百度文心和腾讯混元。
v0.9.0
发布于 2024 年 8 月 6 日。
新功能
- 支持 GraphRAG 作为分块方法。
- 引入 Agent 组件关键词和搜索工具,包括百度、DuckDuckGo、PubMed、Wikipedia、Bing 和 Google。
- 支持音频文件的语音到文本识别。
- 支持模型供应商 Gemini 和 Groq。
- 支持推理框架、引擎和服务,包括 LM studio、OpenRouter、LocalAI 和 Nvidia API。
- 支持在 Xinference 中使用重排序模型。
v0.8.0
发布于 2024 年 7 月 8 日。
新功能
- 支持 Agentic RAG,为 RAG 和 Agent 启用基于图的工作流构建。
- 支持模型供应商 Mistral、MiniMax、Bedrock 和 Azure OpenAI。
- 在 MANUAL 分块方法中支持 DOCX 文件。
- 在 Q&A 分块方法中支持 DOCX、MD 和 PDF 文件。
v0.7.0
发布于 2024 年 5 月 31 日。
新功能
- 支持使用重排序模型。
- 集成重排序和嵌入模型:BCE、BGE 和 Jina。
- 支持 LLM 百川和 VolcanoArk。
- 实现 RAPTOR 以改善文本检索。
- 在 GENERAL 分块方法中支持 HTML 文件。
- 提供用于按 ID 删除文档的 HTTP 和 Python API。
- 支持 ARM64 平台。
虽然我们也在 ARM64 平台上测试 RAGFlow,但我们不维护 ARM 的 RAGFlow Docker 镜像。
如果您在 ARM 平台上,请按照此指南构建 RAGFlow Docker 镜像。
API 变更
HTTP API
Python API
v0.6.0
发布于 2024 年 5 月 21 日。
新功能
- 支持流式输出。
- 提供用于检索文档分块的 HTTP 和 Python API。
- 支持系统组件监控,包括 Elasticsearch、MySQL、Redis 和 MinIO。
- 支持在 GENERAL 分块方法中禁用布局识别以减少文件分块时间。
API 变更
HTTP API
Python API
v0.5.0
发布于 2024 年 5 月 8 日。
新功能
- 支持 LLM DeepSeek。