从试点到平台 — 分步推进
三个阶段:验证价值、自动化一线、全渠道全角色规模化。
在您的数据与单一场景上,验证可量化的自动化率。
- 1 个知识库,从您的历史会话挖掘意图
- Base + RAG + QA 模块
- S 套餐 token,云端沙箱
- Pipeline Trace、自动测试、指标报告
高负载下的一线自动化。包含集成与转接。
- Base + RAG + CLS + QA 模块
- M 套餐 token,模型路由与回退
- Webim 兼容协议,带上下文的人工转接
- RBAC、行级权限、PII 过滤、提示词审计
完整平台:外部动作、坐席助手、本地化部署。
- 额外:AGENT(CRM/计费动作)与 SUFLER(坐席实时提示)
- L/XL token 套餐或自带 LLM 提供方
- 本地部署(Docker Compose + Ansible)
- Premium SLA,专属架构师
每个阶段包含哪些内容
每个模块可独立或组合接入。技术细节将在需求发现阶段确认。
| 模块 | 客户得到什么 | 阶段 |
|---|---|---|
| Base | LLM 咨询、FAQ、工作时间、集成协议 | Pilot |
| RAG + KB | 无需重训模型即可检索规章制度 | Pilot |
| QA 缓存 | 对高频问题给出经审核的回复,无需调用 LLM | Pilot |
| CLS | 意图分类器、路由与分析 | Production |
| AGENT | 外部 API 与 Flow:查状态、续期、取消 | Scale |
| SUFLER | 对二线坐席的实时提示 | Scale |
首次会议中常被问到的问题
«机器人还是会答错?»
每条回复都有 Pipeline Trace、测试用例与 QA 缓存 — 是可控的质量,不是黑盒。我们能看见每个回答的来由。
«我们已经在用 Webim»
我们通过 Webim 兼容协议作为外部 bot 接入 — 在现有系统之上,无需迁移。
«token 太贵»
QA 缓存对高频问题不调用 LLM。S/M/L 套餐可选。本地 LLM 为固定成本,不按 token 计费。
«不能把数据交给公有云»
本地化部署 + 本地 LLM 提供方,数据不离开客户内网。
«落地周期太长»
从历史聊天中挖掘意图,几天搭好初始知识库。单个机器人的试点 4 周完成。
«担心法律风险»
Guardrails 禁止智能体擅自给出 CRM 数据;QA 缓存使用经审核话术;提示词版本管理 = 可审计。
«LLM 供应商挂了怎么办?»
模型回退链,供应商无关架构,无需重训即可切换。
最终服务费用的形成方式
服务费用根据所选的合作模式计算,并在与客户签订的规格、账单或单独合同中确认。基本计算原则如下。
1. 试点项目
整个试点周期(4 周、1 个场景、1 个渠道)按固定价计费。包括:需求发现与意图挖掘、Base + RAG + QA 模块接入、云端沙箱部署、指标报告。具体金额在前期调研后确认,取决于意图数量、知识库规模与集成复杂度。
2. 生产上线
由两部分组成:(a) 实施固定费用(CLS/AGENT/SUFLER 模块配置、与 CRM、电话与聊天平台的集成、客户团队培训);(b) 月度订阅费,依据对话处理量、所选 token 套餐(S/M/L/XL)与模块组合计算。基础费率在合同中确认,可变部分按实际使用量结算。
3. 本地化部署
「向量」平台年度许可的固定费用,加上年度技术支持(按 SLA 等级 Standard / Premium / Enterprise,起步为许可费用的 15%)。基础设施、GPU 资源与第三方 LLM 提供商费用不在许可范围内,由客户直接向供应商支付。
4. 定制研发
按工时与材料(T&M:工程师小时费率乘以认可的工作量计划)或固定价(基于核准技术任务书的固定报价)模式计算。具体模式与费率在合同与规格中确认。
每个项目的具体金额在需求发现后单独确定,并在商务建议书与合同中确认。所有结算以俄罗斯卢布、非现金方式进行。
准备在您的数字上做一次测算吗?
发一份简短的任务说明,我们将在 1–2 个工作日内回复报价与试点计划。