2、对话设置
“对话设置”是智能体应用配置流程中的核心模块,该模块主要用于定义智能体与终端用户交互时的前端表现形式、对话上下文的记忆逻辑、底层大模型的 Token 资源消耗限制,以及系统的安全风控边界。通过科学的对话设置,开发者不仅能提供更友好的用户引导体验,还能有效控制算力成本并规避内容合规风险。

2.1 开场白
用于自定义用户首次进入该对话会话时,智能体主动发送的欢迎文案(例如:“操作步骤记不住?我是车间助手……”)。
- 功能价值:明确智能体的人设定位,并向用户提供清晰的提问引导与功能说明。

2.2 推荐问题
支持为用户预设多个高频或具有代表性的提问示例,开发者可编辑具体的问题文本(如“这台机器开机前要检查哪几个阀门?”)

并可通过右侧的“垃圾桶”图标删除单条推荐问,或点击底部的“+ 添加更多推荐问”动态新增气泡。

- 功能价值:在前端界面以可点击的气泡形式展示,用户无需手动输入即可一键发起对话,极大提升交互效率的“冷启动”体验。
2.3 对话配置
该功能负责底层上下文管理与 Token(算力消耗单位)的精确分配。

包含的配置功能点如下:
- 长上下文历史 (Context):
- 用于设定大语言模型在当前会话中“记住”的历史消息条数(如图中设置为 3 条历史消息)。
- 功能价值:合理的上下文长度能确保多轮对话的连贯性,避免模型“遗忘”前序指令;同时,限制条数可以有效防止历史消息过长导致的 Token 资源浪费及响应延迟。

- Token 限制 (Limit):
- 提供手动分配 Input(输入)与 Output(输出)Token 配额的高级开关(支持一键开启/关闭)。
- 阈值设定(图2):开启后,支持精细化配置三大核心指标:
- 最小 Token 数(如图示 20000):保障应用基础运行的预留算力下限。
- 最大 Token 数(如图示 30000):限制该应用可消耗的全局算力上限,防止因异常调用导致的资源熔断或计费超标。
- 每条 Token 数(如图示 8000):限制单次交互请求/响应的文本长度上限。

2.4 安全与边界
该功能保障应用内容合规与运行稳定的重要防线。

包含的配置功能点如下:
- 最大对话轮数限制 (Max Turns):
- 用于强制设定单一会话周期内允许发生的最大对话交互次数(如图中设置为 20 轮/会话)。
- 功能价值:有效防止恶意用户或自动化脚本发起无限循环对话,阻断潜在的拒绝服务攻击(DoS)或算力恶意消耗行为。

- 敏感词过滤 (Sensitive Filter):
- 提供自定义的违禁词汇自动检测与替换机制开关。
- 规则配置:开启后,开发者可设置匹配规则。左侧输入“敏感词”,右侧输入指定的“替换内容”。当用户的输入文本中命中敏感词时,系统将在处理请求前自动进行无感替换。
- 动态扩展:支持通过点击“+ 新增过滤条件”按钮,不断扩充风控词库;同时也提供删除按钮以移除不再适用的规则。
- 功能价值:确保输入输出内容的合法合规,降低平台的安全审核风险。

