附录B:术语中英对照
江湖黑话多如麻,一字差池两样夸。
此表专治名词乱,读完不怕换说法。
本附录做三件事:
- 给出中文主译名与常见英文写法
- 标注缩写/别名,减少“同物异名”带来的误读
- 对齐本书用法:同一个概念尽量在全书保持同一译法
1. 读表方法
- “本书用法”列写的是:正文默认采用哪个译名与口径
- “别名/近邻”列写的是:你在论文或博客里可能遇到的别称
- 个别术语在不同子领域含义略有漂移,以“本书语境”为准(尤其是 Agent、Workflow、Reasoning 等词)
2. 核心术语(全书贯穿)
| 中文 | 英文 | 缩写 | 别名/近邻 | 本书用法 |
|---|
| 大语言模型 | Large Language Model | LLM | 基座模型(base model) | 以文本/多模态 token 序列为主的生成式模型 |
| 预训练 | pretraining | - | 自监督学习 | 在大规模语料上做“下一 token 预测”等训练 |
| 监督微调 | Supervised Fine-Tuning | SFT | instruction tuning | 用高质量示范数据把模型拉到可用起跑线 |
| 人类反馈强化学习 | Reinforcement Learning from Human Feedback | RLHF | alignment training | 以人类偏好为信号,训练奖励/或直接优化策略 |
| 奖励模型 | reward model | RM | preference model | 把偏好转成可计算分数的模型 |
| 偏好优化 | preference optimization | - | preference learning | 学“更喜欢哪个回答”的训练范式统称 |
| 直接偏好优化 | Direct Preference Optimization | DPO | - | 用成对偏好直接更新策略,绕开显式 RM+PPO 流水线的一部分 |
| 身份策略优化 | Identity Policy Optimization | IPO | - | 与 DPO 相邻的一类偏好优化方法口径 |
| 前景理论优化 | Kahneman-Tversky Optimization | KTO | prospect-theoretic optimization | 用前景理论刻画偏好权重的一类对齐方法 |
| 近端策略优化 | Proximal Policy Optimization | PPO | - | RLHF 常用的“稳更新”策略优化算法 |
| 置信域策略优化 | Trust Region Policy Optimization | TRPO | - | PPO 的重要前身,用作理解“别跑太远” |
| 慢思考 | slow thinking | - | System 2 | 强调多步、回看、自校验的推理形态 |
| 测试时计算 | test-time compute | TTC | inference-time compute | 把算力从训练挪一部分到回答时,用于搜索/自检/多样采样 |
| 思维链 | chain-of-thought | CoT | reasoning trace | 本书更强调“可验证的过程”,不把长链条当等价推理 |
| 幻觉 | hallucination | - | confabulation | 生成内容不被证据支撑或事实错误的统称 |
| 忠实度 | faithfulness | - | groundedness | 回答是否被给定证据支撑 |
| 引用/归因 | attribution | - | citation correctness | 引用是否指到真实支撑片段 |
| 中文 | 英文 | 缩写 | 别名/近邻 | 本书用法 |
|---|
| 注意力机制 | attention | - | self-attention | 用相似度做加权汇总的核心结构 |
| 多头注意力 | multi-head attention | MHA | - | 多个并行子空间的注意力汇总 |
| 线性注意力 | linear attention | - | efficient attention | 将注意力复杂度从 O(N2) 降到更接近线性的思路总称 |
| 混合专家 | Mixture of Experts | MoE | sparse MoE | 只激活部分专家子网络以提升效率 |
| 状态空间模型 | State Space Model | SSM | - | 用状态递推刻画长序列依赖的模型族 |
| Mamba | Mamba | - | selective SSM | 选择性扫描的 SSM 架构代表 |
| FlashAttention | FlashAttention | - | - | 面向硬件的高效注意力实现路线 |
| 长上下文 | long context | - | long sequence | 以更长 token 窗口承载证据与过程 |
4. 检索增强生成(RAG)与知识工程
| 中文 | 英文 | 缩写 | 别名/近邻 | 本书用法 |
|---|
| 检索增强生成 | Retrieval-Augmented Generation | RAG | grounded generation | 先检索证据再生成回答的范式 |
| 稠密检索 | dense retrieval | - | embedding retrieval | 用向量相似度做检索 |
| 关键词检索 | keyword retrieval | - | sparse retrieval | 以 BM25 等为代表 |
| BM25 | BM25 | - | Okapi BM25 | 经典关键词相关性打分 |
| 重排 | reranking | - | re-ranker | 在召回候选上做更精细排序 |
| 查询变换 | query transformation | - | rewriting/expansion | 让问题更像“好检索的查询” |
| HyDE | Hypothetical Document Embeddings | HyDE | - | 先生成“假文档”再去检索真实证据 |
| 纠错式 RAG | Corrective RAG | CRAG | - | 评估检索结果质量,不够就改写再检索 |
| 模块化 RAG | modular RAG | - | routed RAG | 路由+策略+记账的可控流水线 |
| Agentic RAG | agentic RAG | - | workflow RAG | 把规划/反思/工具嵌进检索循环 |
| 知识图谱 | knowledge graph | KG | - | 用实体-关系-实体组织知识 |
| 三元组 | triple | - | (h,r,t) | KG 的基本事实单元 |
| 图检索增强生成 | Graph Retrieval-Augmented Generation | GraphRAG | RAG with graphs | 将检索/聚合建立在图结构之上 |
| 知识图谱构建 | knowledge graph construction | KGC | KG construction | 从文本抽取并规范化为三元组与 schema |
| 知识图谱嵌入 | knowledge graph embedding | KGE | - | 把实体/关系映射为向量以便计算与预测 |
5. 智能体、工作流与多智能体
| 中文 | 英文 | 缩写 | 别名/近邻 | 本书用法 |
|---|
| 智能体 | agent | - | tool-using LM | 具备“计划-行动-观察-反思”循环的系统 |
| 工具调用 | tool use | - | function calling | 用外部 API/工具扩展能力与可验证性 |
| 工作流 | workflow | - | orchestration | 把步骤写成可执行节点并可回放审计 |
| 状态机 | state machine | - | finite-state machine | 用离散状态约束流程,降低跑偏 |
| 多智能体系统 | multi-agent system | MAS | agent swarms | 多个角色分工协作完成任务 |
| 对齐/协同失配 | (mis)alignment | - | goal conflict | 代理之间目标不一致导致失败 |
6. 机械可解释性与安全(第五篇主轴)
| 中文 | 英文 | 缩写 | 别名/近邻 | 本书用法 |
|---|
| 机械可解释性 | mechanistic interpretability | - | mech interp | 用可验证机制解释内部表示与行为 |
| 稀疏自编码器 | sparse autoencoder | SAE | dictionary learning | 用稀疏字典拆解激活,做特征发现 |
| 特征 | feature | - | direction | 表示空间中的可命名方向/模式 |
| 特征转向 | feature steering | - | activation steering | 在推理时沿特征方向拨动激活 |
| 表征工程 | representation engineering | ReprE | steering | 用训练外手段直接操控内部表示 |
| 消融 | ablation | - | knockout/suppression | 把某些特征或通路压低/屏蔽以看因果 |
| 红队 | red teaming | - | adversarial testing | 系统化找安全漏洞的测试 |
| 安全护栏 | safety guardrails | - | policy layer | 拒答/过滤/审计等系统性约束 |
7. 全书译名对齐约定(简版)
- “忠实度”优先对应 faithfulness;“扎根性/可追溯性”不做正文默认译名。
- “归因/引用”优先对应 attribution(含 citation correctness 的语境)。
- “工作流”用于强调可执行节点与审计;“智能体”用于强调闭环决策与工具使用。
- “表征工程”作为总称;“特征转向/激活操控”作为具体手法。