附录B：术语中英对照

Name: LingoFree
Rating: 4.9 (1000 reviews)

江湖黑话多如麻，一字差池两样夸。
此表专治名词乱，读完不怕换说法。

本附录做三件事：

给出中文主译名与常见英文写法
标注缩写/别名，减少“同物异名”带来的误读
对齐本书用法：同一个概念尽量在全书保持同一译法

1. 读表方法

“本书用法”列写的是：正文默认采用哪个译名与口径
“别名/近邻”列写的是：你在论文或博客里可能遇到的别称
个别术语在不同子领域含义略有漂移，以“本书语境”为准（尤其是 Agent、Workflow、Reasoning 等词）

2. 核心术语（全书贯穿）

中文	英文	缩写	别名/近邻	本书用法
大语言模型	Large Language Model	LLM	基座模型（base model）	以文本/多模态 token 序列为主的生成式模型
预训练	pretraining	-	自监督学习	在大规模语料上做“下一 token 预测”等训练
监督微调	Supervised Fine-Tuning	SFT	instruction tuning	用高质量示范数据把模型拉到可用起跑线
人类反馈强化学习	Reinforcement Learning from Human Feedback	RLHF	alignment training	以人类偏好为信号，训练奖励/或直接优化策略
奖励模型	reward model	RM	preference model	把偏好转成可计算分数的模型
偏好优化	preference optimization	-	preference learning	学“更喜欢哪个回答”的训练范式统称
直接偏好优化	Direct Preference Optimization	DPO	-	用成对偏好直接更新策略，绕开显式 RM+PPO 流水线的一部分
身份策略优化	Identity Policy Optimization	IPO	-	与 DPO 相邻的一类偏好优化方法口径
前景理论优化	Kahneman-Tversky Optimization	KTO	prospect-theoretic optimization	用前景理论刻画偏好权重的一类对齐方法
近端策略优化	Proximal Policy Optimization	PPO	-	RLHF 常用的“稳更新”策略优化算法
置信域策略优化	Trust Region Policy Optimization	TRPO	-	PPO 的重要前身，用作理解“别跑太远”
慢思考	slow thinking	-	System 2	强调多步、回看、自校验的推理形态
测试时计算	test-time compute	TTC	inference-time compute	把算力从训练挪一部分到回答时，用于搜索/自检/多样采样
思维链	chain-of-thought	CoT	reasoning trace	本书更强调“可验证的过程”，不把长链条当等价推理
幻觉	hallucination	-	confabulation	生成内容不被证据支撑或事实错误的统称
忠实度	faithfulness	-	groundedness	回答是否被给定证据支撑
引用/归因	attribution	-	citation correctness	引用是否指到真实支撑片段

3. Transformer 与高效推理相关

中文	英文	缩写	别名/近邻	本书用法
注意力机制	attention	-	self-attention	用相似度做加权汇总的核心结构
多头注意力	multi-head attention	MHA	-	多个并行子空间的注意力汇总
线性注意力	linear attention	-	efficient attention	将注意力复杂度从 $O(N^2)$ 降到更接近线性的思路总称
混合专家	Mixture of Experts	MoE	sparse MoE	只激活部分专家子网络以提升效率
状态空间模型	State Space Model	SSM	-	用状态递推刻画长序列依赖的模型族
Mamba	Mamba	-	selective SSM	选择性扫描的 SSM 架构代表
FlashAttention	FlashAttention	-	-	面向硬件的高效注意力实现路线
长上下文	long context	-	long sequence	以更长 token 窗口承载证据与过程

4. 检索增强生成（RAG）与知识工程

中文	英文	缩写	别名/近邻	本书用法
检索增强生成	Retrieval-Augmented Generation	RAG	grounded generation	先检索证据再生成回答的范式
稠密检索	dense retrieval	-	embedding retrieval	用向量相似度做检索
关键词检索	keyword retrieval	-	sparse retrieval	以 BM25 等为代表
BM25	BM25	-	Okapi BM25	经典关键词相关性打分
重排	reranking	-	re-ranker	在召回候选上做更精细排序
查询变换	query transformation	-	rewriting/expansion	让问题更像“好检索的查询”
HyDE	Hypothetical Document Embeddings	HyDE	-	先生成“假文档”再去检索真实证据
纠错式 RAG	Corrective RAG	CRAG	-	评估检索结果质量，不够就改写再检索
模块化 RAG	modular RAG	-	routed RAG	路由+策略+记账的可控流水线
Agentic RAG	agentic RAG	-	workflow RAG	把规划/反思/工具嵌进检索循环
知识图谱	knowledge graph	KG	-	用实体-关系-实体组织知识
三元组	triple	-	(h,r,t)	KG 的基本事实单元
图检索增强生成	Graph Retrieval-Augmented Generation	GraphRAG	RAG with graphs	将检索/聚合建立在图结构之上
知识图谱构建	knowledge graph construction	KGC	KG construction	从文本抽取并规范化为三元组与 schema
知识图谱嵌入	knowledge graph embedding	KGE	-	把实体/关系映射为向量以便计算与预测

5. 智能体、工作流与多智能体

中文	英文	缩写	别名/近邻	本书用法
智能体	agent	-	tool-using LM	具备“计划-行动-观察-反思”循环的系统
工具调用	tool use	-	function calling	用外部 API/工具扩展能力与可验证性
工作流	workflow	-	orchestration	把步骤写成可执行节点并可回放审计
状态机	state machine	-	finite-state machine	用离散状态约束流程，降低跑偏
多智能体系统	multi-agent system	MAS	agent swarms	多个角色分工协作完成任务
对齐/协同失配	(mis)alignment	-	goal conflict	代理之间目标不一致导致失败

6. 机械可解释性与安全（第五篇主轴）

中文	英文	缩写	别名/近邻	本书用法
机械可解释性	mechanistic interpretability	-	mech interp	用可验证机制解释内部表示与行为
稀疏自编码器	sparse autoencoder	SAE	dictionary learning	用稀疏字典拆解激活，做特征发现
特征	feature	-	direction	表示空间中的可命名方向/模式
特征转向	feature steering	-	activation steering	在推理时沿特征方向拨动激活
表征工程	representation engineering	ReprE	steering	用训练外手段直接操控内部表示
消融	ablation	-	knockout/suppression	把某些特征或通路压低/屏蔽以看因果
红队	red teaming	-	adversarial testing	系统化找安全漏洞的测试
安全护栏	safety guardrails	-	policy layer	拒答/过滤/审计等系统性约束

7. 全书译名对齐约定（简版）

“忠实度”优先对应 faithfulness；“扎根性/可追溯性”不做正文默认译名。
“归因/引用”优先对应 attribution（含 citation correctness 的语境）。
“工作流”用于强调可执行节点与审计；“智能体”用于强调闭环决策与工具使用。
“表征工程”作为总称；“特征转向/激活操控”作为具体手法。