智能向量 / Интеллектуальный вектор

参考

术语表

人工智能、AI 智能体、语音与文本分析、LLM 网关相关术语。

A

4 项术语

AI Agent / AI 智能体: 基于 LLM 的自主软件实体,能自行规划步骤、调用工具,并把任务推进到结果。
AI Gateway / AI 网关: 面向多家 LLM 供应商的统一入口:路由、限速、计费、日志、容错。
AI Guardrails: 限定模型行为的规则与过滤器:屏蔽话题、防泄露、强制输出格式。
Augmented Generation: 在生成时融入额外上下文(RAG、工具、外部 API)的回复策略。

B

2 项术语

Base Model / 基座模型: 未做指令微调的预训练模型,是后续微调的基础。
BYOK: Bring Your Own Key — 客户在服务中使用自有的 LLM 供应商 API 密钥。

C

3 项术语

Chain of Thought / 思维链: 让模型先逐步推理再给出最终答案,提升逻辑题的准确率。
Context Window / 上下文窗口: 模型一次请求中能容纳的最大文本量(以 token 计)。
Conversational AI: 对话式系统:聊天机器人、语音助手、客服 AI 智能体。

F

3 项术语

Fallback Routing / 回退路由: 主模型或供应商不可用时,自动切换到备用线路。
Fine-tuning / 微调: 在自有数据上对基座模型进行二次训练,适配领域与语气。
Function Calling / 函数调用: 让模型以结构化参数调用既定函数(API、工具)。

H

2 项术语

Hallucinations / 幻觉: LLM 看似自信却事实错误的回答,通过 RAG 与校验可降低。
Human-in-the-Loop: 关键节点由人工对 AI 决策进行确认或修正的模式。

L

2 项术语

LLM / 大语言模型: 在海量文本上训练的大型语言模型(GPT、Claude、Llama、GigaChat、YandexGPT)。
LLM Routing / 模型路由: 依据成本、质量、速度与合规要求,把请求在多模型之间分发。

O

1 项术语

On-premise LLM: 在客户内网部署语言模型,数据不离开客户边界。

P

3 项术语

PII Filter / 个人数据过滤: 自动识别并掩码姓名、电话、证件号等敏感信息。
Prompt Engineering / 提示工程: 通过设计提示词提升模型回复的稳定性与质量。
Prompt Injection / 提示词注入: 恶意输入改变模型行为、绕过 guardrails 的攻击。

R

2 项术语

RAG: Retrieval-Augmented Generation — 在回答前先从向量库召回相关片段。
RBAC: 基于角色的访问控制:谁能看到哪些项目、提示词、日志与分析。

S

3 项术语

Speech Analytics / 语音分析: 对通话录音的转写、主题、情绪、合规与诉求分析。
Streaming API: 按 token 生成进度逐步返回响应,提升聊天场景的体感速度。
Structured Output / 结构化输出: 强制模型按严格格式(JSON Schema)输出,便于业务系统集成。

T

3 项术语

Temperature / 温度: 生成的随机性参数,低则确定、高则发散。
Token: 模型处理文本的最小单位,通常 2–4 个字符。
Tool Calling / 工具调用: 智能体调用外部工具(搜索、数据库、CRM)以完成任务。

V

1 项术语

Vector Database / 向量数据库: 嵌入向量的近邻检索存储,是 RAG 的基础(pgvector、Milvus、Qdrant)。