跳到主要内容
参考

术语表

人工智能、AI 智能体、语音与文本分析、LLM 网关相关术语。

A

4 项术语
AI Agent / AI 智能体
基于 LLM 的自主软件实体,能自行规划步骤、调用工具,并把任务推进到结果。
AI Gateway / AI 网关
面向多家 LLM 供应商的统一入口:路由、限速、计费、日志、容错。
AI Guardrails
限定模型行为的规则与过滤器:屏蔽话题、防泄露、强制输出格式。
Augmented Generation
在生成时融入额外上下文(RAG、工具、外部 API)的回复策略。

B

2 项术语
Base Model / 基座模型
未做指令微调的预训练模型,是后续微调的基础。
BYOK
Bring Your Own Key — 客户在服务中使用自有的 LLM 供应商 API 密钥。

C

3 项术语
Chain of Thought / 思维链
让模型先逐步推理再给出最终答案,提升逻辑题的准确率。
Context Window / 上下文窗口
模型一次请求中能容纳的最大文本量(以 token 计)。
Conversational AI
对话式系统:聊天机器人、语音助手、客服 AI 智能体。

F

3 项术语
Fallback Routing / 回退路由
主模型或供应商不可用时,自动切换到备用线路。
Fine-tuning / 微调
在自有数据上对基座模型进行二次训练,适配领域与语气。
Function Calling / 函数调用
让模型以结构化参数调用既定函数(API、工具)。

H

2 项术语
Hallucinations / 幻觉
LLM 看似自信却事实错误的回答,通过 RAG 与校验可降低。
Human-in-the-Loop
关键节点由人工对 AI 决策进行确认或修正的模式。

L

2 项术语
LLM / 大语言模型
在海量文本上训练的大型语言模型(GPT、Claude、Llama、GigaChat、YandexGPT)。
LLM Routing / 模型路由
依据成本、质量、速度与合规要求,把请求在多模型之间分发。

O

1 项术语
On-premise LLM
在客户内网部署语言模型,数据不离开客户边界。

P

3 项术语
PII Filter / 个人数据过滤
自动识别并掩码姓名、电话、证件号等敏感信息。
Prompt Engineering / 提示工程
通过设计提示词提升模型回复的稳定性与质量。
Prompt Injection / 提示词注入
恶意输入改变模型行为、绕过 guardrails 的攻击。

R

2 项术语
RAG
Retrieval-Augmented Generation — 在回答前先从向量库召回相关片段。
RBAC
基于角色的访问控制:谁能看到哪些项目、提示词、日志与分析。

S

3 项术语
Speech Analytics / 语音分析
对通话录音的转写、主题、情绪、合规与诉求分析。
Streaming API
按 token 生成进度逐步返回响应,提升聊天场景的体感速度。
Structured Output / 结构化输出
强制模型按严格格式(JSON Schema)输出,便于业务系统集成。

T

3 项术语
Temperature / 温度
生成的随机性参数,低则确定、高则发散。
Token
模型处理文本的最小单位,通常 2–4 个字符。
Tool Calling / 工具调用
智能体调用外部工具(搜索、数据库、CRM)以完成任务。

V

1 项术语
Vector Database / 向量数据库
嵌入向量的近邻检索存储,是 RAG 的基础(pgvector、Milvus、Qdrant)。