2、对话设置

“对话设置”是智能体应用配置流程中的核心模块，该模块主要用于定义智能体与终端用户交互时的前端表现形式、对话上下文的记忆逻辑、底层大模型的 Token 资源消耗限制，以及系统的安全风控边界。通过科学的对话设置，开发者不仅能提供更友好的用户引导体验，还能有效控制算力成本并规避内容合规风险。

2.1 开场白

用于自定义用户首次进入该对话会话时，智能体主动发送的欢迎文案（例如：“操作步骤记不住？我是车间助手……”）。

支持为用户预设多个高频或具有代表性的提问示例，开发者可编辑具体的问题文本（如“这台机器开机前要检查哪几个阀门？”）

并可通过右侧的“垃圾桶”图标删除单条推荐问，或点击底部的“+ 添加更多推荐问”动态新增气泡。

该功能负责底层上下文管理与 Token（算力消耗单位）的精确分配。

包含的配置功能点如下：

长上下文历史 (Context)：
- 用于设定大语言模型在当前会话中“记住”的历史消息条数（如图中设置为 3 条历史消息）。
- 功能价值：合理的上下文长度能确保多轮对话的连贯性，避免模型“遗忘”前序指令；同时，限制条数可以有效防止历史消息过长导致的 Token 资源浪费及响应延迟。

Token 限制 (Limit)：
- 提供手动分配 Input（输入）与 Output（输出）Token 配额的高级开关（支持一键开启/关闭）。
- 阈值设定（图2）：开启后，支持精细化配置三大核心指标：
  - 最小 Token 数（如图示 20000）：保障应用基础运行的预留算力下限。
  - 最大 Token 数（如图示 30000）：限制该应用可消耗的全局算力上限，防止因异常调用导致的资源熔断或计费超标。
  - 每条 Token 数（如图示 8000）：限制单次交互请求/响应的文本长度上限。

该功能保障应用内容合规与运行稳定的重要防线。

包含的配置功能点如下：

最大对话轮数限制 (Max Turns)：
- 用于强制设定单一会话周期内允许发生的最大对话交互次数（如图中设置为 20 轮/会话）。
- 功能价值：有效防止恶意用户或自动化脚本发起无限循环对话，阻断潜在的拒绝服务攻击（DoS）或算力恶意消耗行为。

敏感词过滤 (Sensitive Filter)：
- 提供自定义的违禁词汇自动检测与替换机制开关。
- 规则配置：开启后，开发者可设置匹配规则。左侧输入“敏感词”，右侧输入指定的“替换内容”。当用户的输入文本中命中敏感词时，系统将在处理请求前自动进行无感替换。
- 动态扩展：支持通过点击“+ 新增过滤条件”按钮，不断扩充风控词库；同时也提供删除按钮以移除不再适用的规则。
- 功能价值：确保输入输出内容的合法合规，降低平台的安全审核风险。