附录B:术语中英对照

江湖黑话多如麻,一字差池两样夸。
此表专治名词乱,读完不怕换说法。

本附录做三件事:

  • 给出中文主译名与常见英文写法
  • 标注缩写/别名,减少“同物异名”带来的误读
  • 对齐本书用法:同一个概念尽量在全书保持同一译法

1. 读表方法

  • “本书用法”列写的是:正文默认采用哪个译名与口径
  • “别名/近邻”列写的是:你在论文或博客里可能遇到的别称
  • 个别术语在不同子领域含义略有漂移,以“本书语境”为准(尤其是 Agent、Workflow、Reasoning 等词)

2. 核心术语(全书贯穿)

中文英文缩写别名/近邻本书用法
大语言模型Large Language ModelLLM基座模型(base model)以文本/多模态 token 序列为主的生成式模型
预训练pretraining-自监督学习在大规模语料上做“下一 token 预测”等训练
监督微调Supervised Fine-TuningSFTinstruction tuning用高质量示范数据把模型拉到可用起跑线
人类反馈强化学习Reinforcement Learning from Human FeedbackRLHFalignment training以人类偏好为信号,训练奖励/或直接优化策略
奖励模型reward modelRMpreference model把偏好转成可计算分数的模型
偏好优化preference optimization-preference learning学“更喜欢哪个回答”的训练范式统称
直接偏好优化Direct Preference OptimizationDPO-用成对偏好直接更新策略,绕开显式 RM+PPO 流水线的一部分
身份策略优化Identity Policy OptimizationIPO-与 DPO 相邻的一类偏好优化方法口径
前景理论优化Kahneman-Tversky OptimizationKTOprospect-theoretic optimization用前景理论刻画偏好权重的一类对齐方法
近端策略优化Proximal Policy OptimizationPPO-RLHF 常用的“稳更新”策略优化算法
置信域策略优化Trust Region Policy OptimizationTRPO-PPO 的重要前身,用作理解“别跑太远”
慢思考slow thinking-System 2强调多步、回看、自校验的推理形态
测试时计算test-time computeTTCinference-time compute把算力从训练挪一部分到回答时,用于搜索/自检/多样采样
思维链chain-of-thoughtCoTreasoning trace本书更强调“可验证的过程”,不把长链条当等价推理
幻觉hallucination-confabulation生成内容不被证据支撑或事实错误的统称
忠实度faithfulness-groundedness回答是否被给定证据支撑
引用/归因attribution-citation correctness引用是否指到真实支撑片段

3. Transformer 与高效推理相关

中文英文缩写别名/近邻本书用法
注意力机制attention-self-attention用相似度做加权汇总的核心结构
多头注意力multi-head attentionMHA-多个并行子空间的注意力汇总
线性注意力linear attention-efficient attention将注意力复杂度从 O(N2)O(N^2) 降到更接近线性的思路总称
混合专家Mixture of ExpertsMoEsparse MoE只激活部分专家子网络以提升效率
状态空间模型State Space ModelSSM-用状态递推刻画长序列依赖的模型族
MambaMamba-selective SSM选择性扫描的 SSM 架构代表
FlashAttentionFlashAttention--面向硬件的高效注意力实现路线
长上下文long context-long sequence以更长 token 窗口承载证据与过程

4. 检索增强生成(RAG)与知识工程

中文英文缩写别名/近邻本书用法
检索增强生成Retrieval-Augmented GenerationRAGgrounded generation先检索证据再生成回答的范式
稠密检索dense retrieval-embedding retrieval用向量相似度做检索
关键词检索keyword retrieval-sparse retrieval以 BM25 等为代表
BM25BM25-Okapi BM25经典关键词相关性打分
重排reranking-re-ranker在召回候选上做更精细排序
查询变换query transformation-rewriting/expansion让问题更像“好检索的查询”
HyDEHypothetical Document EmbeddingsHyDE-先生成“假文档”再去检索真实证据
纠错式 RAGCorrective RAGCRAG-评估检索结果质量,不够就改写再检索
模块化 RAGmodular RAG-routed RAG路由+策略+记账的可控流水线
Agentic RAGagentic RAG-workflow RAG把规划/反思/工具嵌进检索循环
知识图谱knowledge graphKG-用实体-关系-实体组织知识
三元组triple-(h,r,t)KG 的基本事实单元
图检索增强生成Graph Retrieval-Augmented GenerationGraphRAGRAG with graphs将检索/聚合建立在图结构之上
知识图谱构建knowledge graph constructionKGCKG construction从文本抽取并规范化为三元组与 schema
知识图谱嵌入knowledge graph embeddingKGE-把实体/关系映射为向量以便计算与预测

5. 智能体、工作流与多智能体

中文英文缩写别名/近邻本书用法
智能体agent-tool-using LM具备“计划-行动-观察-反思”循环的系统
工具调用tool use-function calling用外部 API/工具扩展能力与可验证性
工作流workflow-orchestration把步骤写成可执行节点并可回放审计
状态机state machine-finite-state machine用离散状态约束流程,降低跑偏
多智能体系统multi-agent systemMASagent swarms多个角色分工协作完成任务
对齐/协同失配(mis)alignment-goal conflict代理之间目标不一致导致失败

6. 机械可解释性与安全(第五篇主轴)

中文英文缩写别名/近邻本书用法
机械可解释性mechanistic interpretability-mech interp用可验证机制解释内部表示与行为
稀疏自编码器sparse autoencoderSAEdictionary learning用稀疏字典拆解激活,做特征发现
特征feature-direction表示空间中的可命名方向/模式
特征转向feature steering-activation steering在推理时沿特征方向拨动激活
表征工程representation engineeringReprEsteering用训练外手段直接操控内部表示
消融ablation-knockout/suppression把某些特征或通路压低/屏蔽以看因果
红队red teaming-adversarial testing系统化找安全漏洞的测试
安全护栏safety guardrails-policy layer拒答/过滤/审计等系统性约束

7. 全书译名对齐约定(简版)

  • “忠实度”优先对应 faithfulness;“扎根性/可追溯性”不做正文默认译名。
  • “归因/引用”优先对应 attribution(含 citation correctness 的语境)。
  • “工作流”用于强调可执行节点与审计;“智能体”用于强调闭环决策与工具使用。
  • “表征工程”作为总称;“特征转向/激活操控”作为具体手法。