常见问题
关于通用功能、故障排除、使用说明等问题的答案。
- 通用功能
- RAGFlow 与其他 RAG 产品相比有什么独特之处?
- RAGFlow 完整版和 RAGFlow 精简版有什么区别?
- 哪些嵌入模型可以本地部署?
- 在哪里可以找到 RAGFlow 的版本?如何解读版本号?
- 为什么不使用其他开源向量数据库作为文档引擎?
- demo.ragflow.io 和本地部署的开源 RAGFlow 服务有什么区别?
- 为什么 RAGFlow 解析文档比 LangChain 需要更长时间?
- 为什么 RAGFlow 比其他项目需要更多资源?
- RAGFlow 支持哪些架构或设备?
- 您是否提供与第三方应用程序集成的 API?
- 您是否支持流式输出?
- 您是否支持通过 URL 分享对话?
- 您是否支持多轮对话,将之前的对话作为当前查询的上下文?
- AI 搜索和聊天之间的主要区别是什么?
- 故障排除
- 如何从零开始构建 RAGFlow 镜像?
- 无法访问 https://huggingface.co
MaxRetryError: HTTPSConnectionPool(host='hf-mirror.com', port=443)WARNING: can't find /raglof/rag/res/borker.tmnetwork anomaly There is an abnormality in your network and you cannot connect to the server.Realtime synonym is disabled, since no redis connection- 为什么我的文档解析在不到 1% 时停滞?
- 为什么我的 PDF 解析在接近完成时停滞,而日志没有显示任何错误?
Index failure- 如何检查 RAGFlow 的日志?
- 如何检查 RAGFlow 中每个组件的状态?
Exception: Can't connect to ES cluster- 无法启动 ES 容器并出现
Elasticsearch did not exit normally {"data":null,"code":100,"message":"<NotFound '404: Not Found'>"}Ollama - Mistral instance running at 127.0.0.1:11434 but cannot add Ollama as model in RagFlow- 您是否提供使用 DeepDoc 解析 PDF 或其他文件的示例?
FileNotFoundError: [Errno 2] No such file or directory
- 使用说明
通用功能
RAGFlow 与其他 RAG 产品相比有什么独特之处?
尽管大语言模型(LLM)在自然语言处理(NLP)方面取得了显著进展,但"垃圾进垃圾出"的现状仍未改变。作为回应,RAGFlow 相比其他检索增强生成(RAG)产品引入了两个独特功能。
- 细粒度文档解析:文档解析涉及图像和表格,您可以灵活地根据需要介入。
- 可追溯的答案,减少幻觉:您可以信任 RAGFlow 的响应 ,因为您可以查看支持它们的引用和参考文献。
RAGFlow 完整版和 RAGFlow 精简版有什么区别?
每个 RAGFlow 版本都提供两个版本:
- 精简版:不包含内置嵌入模型,在版本名称后添加 -slim 后缀标识。例如:
infiniflow/ragflow:v0.20.5-slim - 完整版:包含内置嵌入模型,版本名称后不添加后缀。例如:
infiniflow/ragflow:v0.20.5
哪些嵌入模型可以本地部署?
RAGFlow 提供两个 Docker 镜像版本:v0.20.5-slim 和 v0.20.5:
infiniflow/ragflow:v0.20.5-slim(默认):不包含嵌入模型的 RAGFlow Docker 镜像。infiniflow/ragflow:v0.20.5:包含嵌入模型的 RAGFlow Docker 镜像,包括:- 内置嵌入模型:
BAAI/bge-large-zh-v1.5maidalun1020/bce-embedding-base_v1
- 在 RAGFlow UI 中选择后才会下载的嵌入模型:
BAAI/bge-base-en-v1.5BAAI/bge-large-en-v1.5BAAI/bge-small-en-v1.5BAAI/bge-small-zh-v1.5jinaai/jina-embeddings-v2-base-enjinaai/jina-embeddings-v2-small-ennomic-ai/nomic-embed-text-v1.5sentence-transformers/all-MiniLM-L6-v2
- 内置嵌入模型:
在哪里可以找到 RAGFlow 的版本?如何解读版本号?
您可以在 UI 的系统页面找到 RAGFlow 版本号:
如果您从源码构建 RAGFlow,版本号也会在系统日志中显示:
____ ___ ______ ______ __
/ __ \ / | / ____// ____// /____ _ __
/ /_/ // /| | / / __ / /_ / // __ \| | /| / /
/ _, _// ___ |/ /_/ // __/ / // /_/ /| |/ |/ /
/_/ |_|/_/ |_|\____//_/ /_/ \____/ |__/|__/
2025-02-18 10:10:43,835 INFO 1445658 RAGFlow version: v0.15.0-50-g6daae7f2 full
其中:
v0.15.0:正式发布的版本。50:自正式发布以来的 git 提交次数。g6daae7f2:g是前缀,6daae7f2是当前提交 ID 的前七个字符。full/slim:RAGFlow 版本。full:RAGFlow 完整版。slim:不包含嵌入模型和 Python 包的 RAGFlow 版本。
为什么不使用其他开源向量数据库作为文档引擎?
目前,只有 Elasticsearch 和 Infinity 满足 RAGFlow 的混合搜索要求。大多数开源向量数据库对全文搜索的支持有限,稀疏嵌入无法替代全文搜索。此外,这些向量数据库缺乏 RAGFlow 必需的关键功能,如短语搜索和高级排序功能。
这些限制促使我们从零开始开发 Infinity,这是一个 AI 原生数据库。
demo.ragflow.io 和本地部署的开源 RAGFlow 服务有什么区别?
demo.ragflow.io 展示了 RAGFlow Enterprise 的功能。其 DeepDoc 模型使用专有数据进行预训练,并提供更复杂的团队权限控制。本质上,demo.ragflow.io 是 RAGFlow 即将推出的 SaaS(软件即服务)产品的预览。
您可以部署开源 RAGFlow 服务并通过 Python 客户端或 RESTful API 调用它。但是,这在 demo.ragflow.io 上不受支持。
为什么 RAGFlow 解析文档比 LangChain 需要更长时间?
我们在文档预处理任务上投入了大量精力,如使用我们的视觉模型进行布局分析、表格结构识别和 OCR(光学字符识别)。这导致了额外的时间需求。
为什么 RAGFlow 比其他项目需要更多资源?
RAGFlow 有许多用于文档结构解析的内置模型,这解释了额外的计算资源需求。
RAGFlow 支持哪些架构或设备?
我们官方支持 x86 CPU 和 nvidia GPU。虽然我们也在 ARM64 平台上测试 RAGFlow,但我们不维护 ARM 的 RAGFlow Docker 镜像。如果您在 ARM 平台上,请按照此指南构建 RAGFlow Docker 镜像。
您是否提供与第三方应用程序集成的 API?
相应的 API 现已可用。有关更多信息,请参阅 RAGFlow HTTP API 参考 或 RAGFlow Python API 参考。