附录A:符号与记号表
符号先立方便看,记号一清路不偏。
若嫌公式太拗口,此表专为省心编。
本书行文尽量用“高二可读”的直觉来讲复杂系统,所以符号不追求学界唯一标准,只求三件事:
- 同一符号尽量不多用
- 同一概念尽量不换名
- 看到符号就能回忆起“它在系统里负责哪一件事”
1. 通用记号
| 记号 | 含义 | 你可以把它想成 |
|---|
| x | 输入(问题/提示词/查询) | 你问的那句话 |
| y | 输出(回答/生成文本) | 模型给的那段话 |
| D | 数据集 | 一摞样本账本 |
| θ | 模型参数 | 武功底子(固定在体内) |
| fθ(⋅) | 参数为 θ 的模型函数 | “这一身内功”如何出招 |
| E[⋅] | 期望(平均意义) | “长期平均下来” |
| argmax | 取最大值的自变量 | “选最好的那条路” |
| softmax(⋅) | 归一化成概率分布 | “把分数变成下注比例” |
| k / Top-k | 取前 k 个 | “只挑最相关的几条” |
| KL(p∥q) | KL 散度(分布差异度量) | “新脾气离老脾气多远” |
2. 向量、矩阵与表示学习
| 记号 | 含义 | 你可以把它想成 |
|---|
| v | 向量(一般用粗体) | 一条“特征刻度尺” |
| M | 矩阵(一般用粗体大写) | 一叠向量排成的表 |
| d / dmodel | 表示维度 | “尺子有多少格” |
| emb(t) | token t 的嵌入向量 | 给一个词发的“坐标” |
| cos(a,b) | 余弦相似度 | 两根箭头夹角有多小 |
| 记号 | 含义 | 你可以把它想成 |
|---|
| Q,K,V | Query/Key/Value | 你要找什么、标签怎么写、内容是什么 |
| Attn(Q,K,V) | 注意力输出 | “按相关性加权抄笔记” |
| h | 注意力头数(multi-head) | 多个“视角/小组”并行讨论 |
| L | 上下文长度(token 数) | 这回能带多少卷宗进场 |
4. 强化学习与对齐(RLHF 等)
| 记号 | 含义 | 你可以把它想成 |
|---|
| s | 状态(state) | 走到哪一步/看到什么局面 |
| a | 动作(action) | 下一步怎么做 |
| r | 奖励(reward) | 做对给糖,做错挨打 |
| π(a∣s) | 策略(policy) | 站在 s 时如何出手的概率 |
| πref | 参考策略 | “别跑太远”的老底子 |
| V(s) | 状态价值 | 站在这一步,未来平均能拿多少分 |
| Q(s,a) | 行动价值 | 这一招出手,未来平均能拿多少分 |
| A(s,a) | 优势(advantage) | 这一招比“平常招”好多少 |
| rϕ(x,y) | 奖励模型(RM)的打分 | 老师对回答的分数 |
| β | 温度/强度系数(常见于偏好优化) | “尺子有多硬/惩罚有多重” |
5. 检索增强生成(RAG)与评估
| 记号 | 含义 | 你可以把它想成 |
|---|
| q | 查询(query) | 你要查的关键问题 |
| d | 文档/片段(document/chunk) | 卷宗里的一页 |
| c | 上下文(context) | 你准备拿来作证的材料 |
| R(q) | 检索器返回的候选集合 | 书吏给你搬来的几摞纸 |
| G(x,c) | 生成器在证据 c 下回答 | 看证据写结论 |
| Recall/Precision | 召回/精确 | 找得全不全、找得准不准 |
| Faithfulness | 忠实度 | 回答是否被证据支撑 |
| Attribution | 引用/归因准确性 | 引用是不是指到真的证据 |
6. 知识图谱、图学习与 GraphRAG
| 记号 | 含义 | 你可以把它想成 |
|---|
| G=(V,E) | 图(节点集、边集) | 人物关系网/知识网 |
| h,r,t | 三元组(头实体/关系/尾实体) | “谁-以何关系-连到谁” |
| X | 节点特征矩阵 | 每个节点的“简历” |
| A | 邻接矩阵(或边索引) | 谁跟谁相连的表 |
| GNN(⋅) | 图神经网络编码器 | 让邻居互相传话后的表示 |
7. 智能体(Agent)与工作流
| 记号 | 含义 | 你可以把它想成 |
|---|
| Tool T | 外部工具(检索/计算/数据库) | 外援/兵器 |
| o | 观察(observation) | 工具回传的结果 |
| Plan | 计划/子任务分解 | 把大案拆成小案 |
| Verify | 校验/验证 | 过第43回“三道验门” |
8. 机械可解释性与表征工程(SAE/Steering)
| 记号 | 含义 | 你可以把它想成 |
|---|
| h | 某层激活/残差流表示 | 城里此刻的“热度分布” |
| SAE | 稀疏自编码器 | 把混合香料拆成“香料字典” |
| z | 稀疏系数(特征激活) | 这次点亮了哪些“念头” |
| Steering | 激活转向/特征拨动 | 拧旋钮改变倾向 |
| Ablation | 消融/抑制 | 把某条通路暂时按住 |
9. 本书用法提醒
- 若同一概念在不同论文里符号不同,本书优先保留“读者最容易记住”的那套,必要时在正文用文字解释对齐。
- 若你在别处读到符号冲突,请以“概念定义”为准,不必纠结字母本身。