Skip to main content

Version: DEV

加速问答

加速问答的检查清单。

请注意，您的一些设置可能会消耗大量时间。如果您经常发现问答很耗时，这里有一个检查清单供您考虑：

在聊天配置对话框的提示词引擎标签中，禁用多轮优化将减少从 LLM 获取答案所需的时间。
在聊天配置对话框的提示词引擎标签中，将重排序模型字段留空将显著减少检索时间。
使用重排序模型时，确保您有 GPU 进行加速；否则，重排序过程将极其缓慢。

注意

请注意，重排序模型在某些场景中是必不可少的。速度和性能之间总是存在权衡；您必须根据具体情况权衡利弊。

在聊天配置对话框的助手设置标签中，禁用关键词分析将减少从 LLM 接收答案的时间。
与聊天助手聊天时，点击当前对话上方的灯泡图标，向下滚动弹出窗口以查看每个任务所花费的时间：

<APITable>

项目名称	描述
总计	此轮对话花费的总时间，包括分块检索和答案生成。
检查 LLM	验证指定 LLM 的时间。
创建检索器	创建分块检索器的时间。
绑定嵌入	初始化嵌入模型实例的时间。
绑定 LLM	初始化 LLM 实例的时间。
调优问题	使用多轮对话上下文优化用户查询的时间。
绑定重排序器	为分块检索初始化重排序器模型实例的时间。
生成关键词	从用户查询中提取关键词的时间。
检索	检索分块的时间。
生成答案	生成答案的时间。

</APITable>