01 · AI 大模型 · 内容地图
定位:P0 学习重点:Transformer 原理 / 训练微调 / Agent 系统。
子模块导航
Transformer 与注意力
原理层 · 高频考点 · 建议按下列顺序逐个补全(学完一题再进下一题)
- RNN 是什么 生疏 ← 零基础从这开始
- Transformer 是什么 生疏
- 为什么 attention 要除以 √dk 已背熟
- Transformer 为什么比 RNN 快 生疏
- 多头注意力为什么比单头好 生疏
- Decoder 的 Mask 为什么要下三角 生疏
- Self-Attention 与 Cross-Attention 的区别 生疏
待补 7. Position Encoding 的几种实现(Sinusoidal / RoPE / ALiBi) 8. LayerNorm 在 Pre-LN 和 Post-LN 里的区别
训练与微调
高频考点 · 纯应用侧最容易被戳穿
待补
- 学习率怎么选 / warmup 的意义
- loss 怎么看 / 什么是 loss 异常
- 数据集构建的关键步骤
- Instruction Tuning 和 In-Context Learning 的区别
Agent 系统
规划 · 工具 · 记忆 · 多智能体 · 与固定编排的边界 —— 子地图:index
核心原理
- Agent 的基本抽象是什么
- ReAct 的核心思想是什么
- Planning 类 Agent 有哪些模式
- Reflection 与 Self-Critique 模式
- Agent 的记忆如何分层
- Multi-Agent 有哪些协作范式
- 固定编排与 LLM Agent 的边界是什么
LangGraph 工程实现 8. 与 LangChain 的关系 9. Dify vs LangChain vs LangGraph 对比 10. LangGraph 多 Agent 的状态管理 11. LangGraph Multi-Agent:Supervisor vs Swarm 12. LangGraph 里如何接入长期记忆 13. Agent 的错误恢复与 checkpoint 怎么做
Agent 框架对比 14. AutoGen 与 CrewAI 的差异
Agent 评测 15. Agent 评测怎么做:LangSmith 与 RAGAS 16. WebArena 是什么
工具调用
Function Calling · MCP · 并发 · 失败处理
RAG 与向量检索
稠密/稀疏/混合 · 切块 · 向量库 · Rerank · 记忆 —— 子地图:index
RAG 基础
向量库选型 7. pgvector
记忆系统 8. Mem0 与 MemGPT 长期记忆思路
推理与部署
算力与线上形态;被问概率随岗位升高
待补
- 量化(INT8 / INT4 / AWQ / GPTQ)对比
- TGI / Triton / ONNX Runtime 的定位差异
多模态
VLM · VLA · 主流模型对比
具身智能
感知-决策-执行 · 大脑小脑 · Sim2Real · 工程定位
AI 编程方法论
开发范式 · 人机协作边界
本模块 P0 生疏题(自动)
TABLE file.mtime AS "最近更新", tags AS "标签"
FROM "01-AI大模型"
WHERE contains(tags, "P0") AND contains(tags, "生疏")
SORT file.mtime ASC本模块未动(催学)
LIST
FROM "01-AI大模型"
WHERE contains(tags, "未动")
SORT file.name ASC