开始 AI 聊天
使用配置的聊天助手启动 AI 驱动的聊天。
知识库、无幻觉聊天和文件管理是 RAGFlow 的三大支柱。RAGFlow 中的聊天基于特定的知识库或多个知识库。一旦您创建了知识库、完成了文件解析并运行了检索测试,您就可以开始 AI 对话了。
开始 AI 聊天
您通过创建助手来开始 AI 对话。
-
点击页面中上方的聊天标签 > 创建助手以显示聊天配置对话框*(用于您的下一个对话)*。
RAGFlow 为您提供了为每个对话选择不同聊天模型的灵活性,同时允许您在系统模型设置中设置默认模型。
-
更新助手设置:
- 助手名称是您的聊天助手的名称。每个助手对应一个具有独特的知识库、提示词、混合搜索配置和大模型设置组合的对话。
- 空响应:
- 如果您希望限制 RAGFlow 的答案仅来自您的知识库,请在此处留下响应。然后,当它无法检索到答案时,它会统一使用您在此处设置的内容进行响应。
- 如果您希望 RAGFlow 在无法从知识库检索到答案时即兴发挥,请留空,这可能会产生幻觉。
- 显示引用:这是 RAGFlow 的关键功能,默认启用。RAGFlow 不像黑盒那样工作。相反,它清楚地显示其响应所基于的信息来源。
- 选择相应的知识库。您可以选择一个或多个知识库,但请确保它们使用相同的嵌入模型,否则会出现错误。
-
更新提示词引擎:
- 在系统中,您填写 LLM 的提示词,您也可以在一开始保持默认提示词不变。
- 相似度阈值为每个文本分块设置相似度"门槛"。默认为 0.2。相似度分数较低的文本分块将从最终响应中过滤掉。
- 关键词相似度权重默认设置为 0.7。RAGFlow 使用混合分数系统来评估不同文本分块的相关性。此值设置混合分数中关键词相似性组件的权重。
- 如果重排序模型留空,混合分数系统使用关键词相似性和向量相似性,分配给向量相似性组件的默认权重为 1-0.7=0.3。
- 如果选择了重排序模型,混合分数系统使用关键词相似性和重排序器分数,分配给重排序器分数的默认权重为 1-0.7=0.3。
- Top N 确定提供给 LLM 的最大分块数量。换句话说,即使检索到更多分块,也只会提供前 N 个分块作为输入。
- 多轮优化使用多轮对话中的现有上下文增强用户查询。默认启用。启用后,它将消耗额外的 LLM 令牌并显著增加生成答案的时间。
- 使用知识图谱指示在检索过程中是否使用指定知识库中的知识图谱进行多跳问答。启用后,这将涉及跨实体、关系和社区报告分块的迭代搜索,大大增加检索时间。
- 推理指示是否通过推理过程(如 Deepseek-R1/OpenAI o1)生成答案。一旦启用,聊天模型在遇到未知主题时会在问答过程中自主集成深度研究。这涉及聊天模型动态搜索外部知识并通过 推理生成最终答案。
- 重排序模型设置要使用的重排序器模型。默认留空。
- 如果重排序模型留空,混合分数系统使用关键词相似性和向量相似性,分配给向量相似性组件的默认权重为 1-0.7=0.3。
- 如果选择了重排序模型,混合分数系统使用关键词相似性和重排序器分数,分配给重排序器分数的默认权重为 1-0.7=0.3。
- 跨语言搜索:可选
从下拉菜单中选择一个或多个目标语言。然后,系统的默认聊天模型将把您的查询翻译成选定的目标语言。此翻译确保跨语言的准确语义匹配,允许您检索相关结果,无论语言差异如何。- 选择目标语言时,请确保这些语言在知识库中存在,以保证有效的搜索。
- 如果未选择目标语言,系统将仅在您查询的语言中搜索,这可能导致错过其他语言中的相关信息。
- 变量指的是要在系统提示词中使用的变量(键)。
{knowledge}是保留变量。点击添加为系统提示词添加更多变量。
-
更新模型设置:
- 在模型中:您选择聊天模型。尽管您已在系统模型设置中选择了默认聊天模型,RAGFlow 允许 您为对话选择替代聊天模型。
- 自由度:温度、Top P、存在惩罚和频率惩罚设置的快捷方式,表示模型的自由度级别。从即兴、精确到平衡,每个预设配置对应温度、Top P、存在惩罚和频率惩罚的独特组合。
此参数有三个选项:- 即兴:产生更具创造性的响应。
- 精确:(默认)产生更保守的响应。
- 平衡:即兴和精确之间的中间地带。
- 温度:模型输出的随机性级别。
默认为 0.1。- 较低的值导致更确定性和可预测的输出。
- 较高的值导致更具创造性和多样化的输出。
- 温度为零时,相同提示会产生相同的输出。
- Top P:核采样。
- 通过设置阈值 P 并将采样限制为累积概率超过 P 的令牌,减少生成重复或不自然文本的可能性。
- 默认为 0.3。
- 存在惩罚:鼓励模型在响应中包含更多样化的令牌。
- 较高的存在惩罚值导致模型更可能生成尚未包含在生成文本中的令牌。
- 默认为 0.4。
- 频率惩罚:阻止模型在生成的文本中过于频繁地重复相同的单词或短语。
- 较高的频率惩罚值导致模型在使用重复令牌时更加保守。
- 默认为 0.7。
-
现在,让我们开始表演:

注意
- 点击答案上方的灯泡图标查看展开的系统提示词:

灯泡图标仅对当前对话可用。
- 向下滚动展开的提示词以查看每个任务消耗的时间:

更新现有聊天助手的设置

将聊天功能集成到您的应用程序或网页中
RAGFlow 提供 HTTP 和 Python API,让您将 RAGFlow 的功能集成到您的应用程序中。阅读以下文档了解更多信息:
您可以使用 iframe 将创建的聊天助手嵌入到第三方网页中:
-
在继续之前,您必须获取 API 密钥;否则会出现错误消息。
-
将鼠标悬停在目标聊天助手上 > 编辑以显示iframe窗口:

-
复制 iframe 并将其嵌入到您的网页中。
