参考
术语表
人工智能、AI 智能体、语音与文本分析、LLM 网关相关术语。
A
4 项术语- AI Agent / AI 智能体
- 基于 LLM 的自主软件实体,能自行规划步骤、调用工具,并把任务推进到结果。
- AI Gateway / AI 网关
- 面向多家 LLM 供应商的统一入口:路由、限速、计费、日志、容错。
- AI Guardrails
- 限定模型行为的规则与过滤器:屏蔽话题、防泄露、强制输出格式。
- Augmented Generation
- 在生成时融入额外上下文(RAG、工具、外部 API)的回复策略。
B
2 项术语- Base Model / 基座模型
- 未做指令微调的预训练模型,是后续微调的基础。
- BYOK
- Bring Your Own Key — 客户在服务中使用自有的 LLM 供应商 API 密钥。
C
3 项术语- Chain of Thought / 思维链
- 让模型先逐步推理再给出最终答案,提升逻辑题的准确率。
- Context Window / 上下文窗口
- 模型一次请求中能容纳的最大文本量(以 token 计)。
- Conversational AI
- 对话式系统:聊天机器人、语音助手、客服 AI 智能体。
F
3 项术语- Fallback Routing / 回退路由
- 主模型或供应商不可用时,自动切换到备用线路。
- Fine-tuning / 微调
- 在自有数据上对基座模型进行二次训练,适配领域与语气。
- Function Calling / 函数调用
- 让模型以结构化参数调用既定函数(API、工具)。
H
2 项术语- Hallucinations / 幻觉
- LLM 看似自信却事实错误的回答,通过 RAG 与校验可降低。
- Human-in-the-Loop
- 关键节点由人工对 AI 决策进行确认或修正的模式。
L
2 项术语- LLM / 大语言模型
- 在海量文本上训练的大型语言模型(GPT、Claude、Llama、GigaChat、YandexGPT)。
- LLM Routing / 模型路由
- 依据成本、质量、速度与合规要求,把请求在多模型之间分发。
O
1 项术语- On-premise LLM
- 在客户内网部署语言模型,数据不离开客户边界。
P
3 项术语- PII Filter / 个人数据过滤
- 自动识别并掩码姓名、电话、证件号等敏感信息。
- Prompt Engineering / 提示工程
- 通过设计提示词提升模型回复的稳定性与质量。
- Prompt Injection / 提示词注入
- 恶意输入改变模型行为、绕过 guardrails 的攻击。
R
2 项术语- RAG
- Retrieval-Augmented Generation — 在回答前先从向量库召回相关片段。
- RBAC
- 基于角色的访问控制:谁能看到哪些项目、提示词、日志与分析。
S
3 项术语- Speech Analytics / 语音分析
- 对通话录音的转写、主题、情绪、合规与诉求分析。
- Streaming API
- 按 token 生成进度逐步返回响应,提升聊天场景的体感速度。
- Structured Output / 结构化输出
- 强制模型按严格格式(JSON Schema)输出,便于业务系统集成。
T
3 项术语- Temperature / 温度
- 生成的随机性参数,低则确定、高则发散。
- Token
- 模型处理文本的最小单位,通常 2–4 个字符。
- Tool Calling / 工具调用
- 智能体调用外部工具(搜索、数据库、CRM)以完成任务。
V
1 项术语- Vector Database / 向量数据库
- 嵌入向量的近邻检索存储,是 RAG 的基础(pgvector、Milvus、Qdrant)。