1. 项目概述:为什么你需要这份AI大模型术语指南?
在咖啡馆里听到邻桌讨论"Transformer架构"和"RLHF"时一脸茫然?被技术文档里的"MoE"和"LoRA"缩写搞得晕头转向?这份术语解析清单就是为你准备的。过去半年里,我整理了所有主流AI技术白皮书、论文和开发文档,将那些看似高深的概念拆解成普通人能听懂的语言。这不是简单的名词解释集合,而是按照技术逻辑重新编排的知识网络——从基础架构术语到前沿训练方法,甚至包含那些连很多从业者都容易混淆的相似概念对比。
2. 核心术语分类解析框架
2.1 基础架构类(15个关键术语)
Transformer架构:2017年谷歌提出的革命性模型结构,其核心是自注意力机制。想象你在阅读文章时,大脑会自动给不同词语分配不同注意力权重——比如看到"苹果"时,前文出现"手机"比出现"香蕉"更值得关注。这种动态权重分配能力使其在处理长文本时远优于传统的RNN结构。
Tokenization:把文本切分成模型能理解的"词片段"的过程。例如"unhappiness"可能被拆分为"un", "happiness"三个token。不同模型采用不同分词策略:
- BPE(Byte Pair Encoding):通过统计高频字符组合动态构建词表
- WordPiece:Google采用的改良方案,优先保留语义完整的子词
- SentencePiece:直接处理原始文本,不依赖预分词
实际应用中发现:中文分词效果直接影响生成质量。某些开源模型直接用单字作为token会导致成语、专有名词生成错乱,需要额外添加自定义词典。
2.2 训练方法类(22个关键技术)
RLHF(人类反馈强化学习):让模型从人类偏好中学习的核心技术。分三个阶段:
- 监督微调(SFT):用标注数据初步优化模型
- 奖励建模(RM):训练一个能判断回答质量的"打分模型"
- 强化学习(PPO):让主模型根据RM的反馈持续优化
LoRA(低秩适应):一种高效的微调技术。通过在原始权重旁添加低秩矩阵来调整模型行为,相比全参数微调可节省90%显存。实测在RTX 3090上,7B模型的全微调需要48GB显存,而LoRA仅需12GB。
2.3 评估指标类(8个核心标准)
困惑度(Perplexity):衡量模型预测不确定性的指标。数值越低越好,相当于"模型在做完形填空时的平均选项数"。但要注意:
- 不同tokenizer会导致数值不可比
- 与人类感知的质量不一定正相关
- 长文本评估时需要滑动窗口计算
Rouge-L:自动评估文本摘要质量的指标,通过计算最长公共子序列来匹配参考摘要。实际使用中发现其与人工评分的相关性约0.6-0.7,更适合粗筛而非最终评价。
3. 高阶概念深度剖析
3.1 混合专家系统(MoE)
谷歌提出的动态计算架构,如Switch Transformer。其核心思想是:
- 每个输入只激活部分神经网络路径(专家)
- 门控机制动态选择专家组合
- 总参数量大但计算量可控
实测显示,MoE-16B模型在保持16B参数规模时,计算消耗仅相当于稠密模型的4B参数级别。但要注意专家负载均衡问题——某些热门专家可能被过度激活。
3.2 量化压缩技术
GPTQ:后训练量化方法,可将FP16模型压缩为4bit甚至3bit。在Llama-2 13B上的测试显示:
- 4bit量化后精度损失<1%
- 推理速度提升2.3倍
- 显存占用减少75%
但首次量化需要大量计算资源,建议直接使用社区提供的预量化模型。
4. 实战避坑指南
4.1 术语应用场景对照表
| 术语 | 适用阶段 | 典型应用场景 | 常见误区 |
|---|---|---|---|
| Beam Search | 推理 | 需要确定性的文本生成 | 束宽过大导致输出雷同 |
| Temperature | 推理 | 控制创意性/严谨性 | 设为零时采样失效 |
| Grad-CAM | 可解释性分析 | 定位模型关注区域 | 对非视觉任务适配困难 |
4.2 高频混淆术语辨析
微调(FT) vs 提示工程(PE):
- FT:修改模型权重,需要训练数据和计算资源
- PE:设计输入模板,零成本但依赖技巧
- 实际建议:先用PE验证可行性,再决定是否FT
PPO vs DPO:
- PPO:基于奖励模型的传统RL方法
- DPO:直接优化人类偏好数据的新方法
- 选择依据:DPO更适合小规模高质量数据
5. 前沿术语追踪
状态空间模型(SSM):如Mamba架构,通过选择性记忆机制实现线性复杂度。在长文本处理测试中:
- 8k上下文长度下速度比Transformer快3倍
- 但短文本任务可能表现略差
- 需要特别设计的位置编码方案
多模态对比学习:如CLIP模型的核心技术。关键突破在于:
- 图像和文本共享嵌入空间
- 对比损失函数优化相似度
- 零样本迁移能力显著提升
这份术语表会持续更新在我的GitHub仓库,建议Star跟踪最新版本。刚开始接触这些概念时,我习惯用Anki制作记忆卡片——把术语写在正面,核心要点和典型示例写在背面,每天抽10分钟复习效果显著。现在看到论文里的陌生缩写时,终于不用频繁切到搜索引擎了。