落地模式

从试点到平台 — 分步推进

三个阶段:验证价值、自动化一线、全渠道全角色规模化。

试点

1 个智能体 · 1 个渠道 · 4 周

约 450 000 ₽ 起

4 周试点周期固定价,不含增值税

在您的数据与单一场景上,验证可量化的自动化率。

1 个知识库,从您的历史会话挖掘意图
Base + RAG + QA 模块
S 套餐 token,云端沙箱
Pipeline Trace、自动测试、指标报告

启动试点

最受欢迎

生产

一线 · 2–3 个知识库 · 标准支持

约 250 000 ₽ / 月起

按对话量与模块组合计算,不含增值税

高负载下的一线自动化。包含集成与转接。

Base + RAG + CLS + QA 模块
M 套餐 token,模型路由与回退
Webim 兼容协议,带上下文的人工转接
RBAC、行级权限、PII 过滤、提示词审计

索取报价

规模

全渠道与角色 · Premium / Enterprise SLA

约 600 000 ₽ / 月起

按部署规模与 SLA 等级单独核算,不含增值税

完整平台:外部动作、坐席助手、本地化部署。

额外:AGENT(CRM/计费动作)与 SUFLER(坐席实时提示)
L/XL token 套餐或自带 LLM 提供方
本地部署(Docker Compose + Ansible)
Premium SLA,专属架构师

联系我们

模块

每个阶段包含哪些内容

每个模块可独立或组合接入。技术细节将在需求发现阶段确认。

模块	客户得到什么	阶段
Base	LLM 咨询、FAQ、工作时间、集成协议	Pilot
RAG + KB	无需重训模型即可检索规章制度	Pilot
QA 缓存	对高频问题给出经审核的回复,无需调用 LLM	Pilot
CLS	意图分类器、路由与分析	Production
AGENT	外部 API 与 Flow:查状态、续期、取消	Scale
SUFLER	对二线坐席的实时提示	Scale

常见质疑与回答

首次会议中常被问到的问题

«机器人还是会答错?»

每条回复都有 Pipeline Trace、测试用例与 QA 缓存 — 是可控的质量,不是黑盒。我们能看见每个回答的来由。

«我们已经在用 Webim»

我们通过 Webim 兼容协议作为外部 bot 接入 — 在现有系统之上,无需迁移。

«token 太贵»

QA 缓存对高频问题不调用 LLM。S/M/L 套餐可选。本地 LLM 为固定成本,不按 token 计费。

«不能把数据交给公有云»

本地化部署 + 本地 LLM 提供方,数据不离开客户内网。

«落地周期太长»

从历史聊天中挖掘意图,几天搭好初始知识库。单个机器人的试点 4 周完成。

«担心法律风险»

Guardrails 禁止智能体擅自给出 CRM 数据;QA 缓存使用经审核话术;提示词版本管理 = 可审计。

«LLM 供应商挂了怎么办?»

模型回退链,供应商无关架构,无需重训即可切换。

费用计算规则

最终服务费用的形成方式

服务费用根据所选的合作模式计算,并在与客户签订的规格、账单或单独合同中确认。基本计算原则如下。

1. 试点项目
整个试点周期(4 周、1 个场景、1 个渠道)按固定价计费。包括:需求发现与意图挖掘、Base + RAG + QA 模块接入、云端沙箱部署、指标报告。具体金额在前期调研后确认,取决于意图数量、知识库规模与集成复杂度。
2. 生产上线
由两部分组成:(a) 实施固定费用(CLS/AGENT/SUFLER 模块配置、与 CRM、电话与聊天平台的集成、客户团队培训);(b) 月度订阅费,依据对话处理量、所选 token 套餐(S/M/L/XL)与模块组合计算。基础费率在合同中确认,可变部分按实际使用量结算。
3. 本地化部署
「向量」平台年度许可的固定费用,加上年度技术支持(按 SLA 等级 Standard / Premium / Enterprise,起步为许可费用的 15%)。基础设施、GPU 资源与第三方 LLM 提供商费用不在许可范围内,由客户直接向供应商支付。
4. 定制研发
按工时与材料(T&M:工程师小时费率乘以认可的工作量计划)或固定价(基于核准技术任务书的固定报价)模式计算。具体模式与费率在合同与规格中确认。

每个项目的具体金额在需求发现后单独确定,并在商务建议书与合同中确认。所有结算以俄罗斯卢布、非现金方式进行。

准备在您的数字上做一次测算吗?

发一份简短的任务说明,我们将在 1–2 个工作日内回复报价与试点计划。