01 · AI 大模型 · 内容地图

定位:P0 学习重点:Transformer 原理 / 训练微调 / Agent 系统。


子模块导航

Transformer 与注意力

原理层 · 高频考点 · 建议按下列顺序逐个补全(学完一题再进下一题)

  1. RNN 是什么 生疏零基础从这开始
  2. Transformer 是什么 生疏
  3. 为什么 attention 要除以 √dk 已背熟
  4. Transformer 为什么比 RNN 快 生疏
  5. 多头注意力为什么比单头好 生疏
  6. Decoder 的 Mask 为什么要下三角 生疏
  7. Self-Attention 与 Cross-Attention 的区别 生疏

待补 7. Position Encoding 的几种实现(Sinusoidal / RoPE / ALiBi) 8. LayerNorm 在 Pre-LN 和 Post-LN 里的区别


训练与微调

高频考点 · 纯应用侧最容易被戳穿

  1. LoRA 和 QLoRA 的区别
  2. DPO 的关系
  3. prompt

待补

  • 学习率怎么选 / warmup 的意义
  • loss 怎么看 / 什么是 loss 异常
  • 数据集构建的关键步骤
  • Instruction Tuning 和 In-Context Learning 的区别

Agent 系统

规划 · 工具 · 记忆 · 多智能体 · 与固定编排的边界 —— 子地图index

核心原理

  1. Agent 的基本抽象是什么
  2. ReAct 的核心思想是什么
  3. Planning 类 Agent 有哪些模式
  4. Reflection 与 Self-Critique 模式
  5. Agent 的记忆如何分层
  6. Multi-Agent 有哪些协作范式
  7. 固定编排与 LLM Agent 的边界是什么

LangGraph 工程实现 8. 与 LangChain 的关系 9. Dify vs LangChain vs LangGraph 对比 10. LangGraph 多 Agent 的状态管理 11. LangGraph Multi-Agent:Supervisor vs Swarm 12. LangGraph 里如何接入长期记忆 13. Agent 的错误恢复与 checkpoint 怎么做

Agent 框架对比 14. AutoGen 与 CrewAI 的差异

Agent 评测 15. Agent 评测怎么做:LangSmith 与 RAGAS 16. WebArena 是什么


工具调用

Function Calling · MCP · 并发 · 失败处理

  1. OpenAI Function Calling 怎么工作
  2. Parallel Tools 与并发工具调用
  3. Tool Calling 的失败处理与重试设计
  4. 与 dify_plugin 的关系

RAG 与向量检索

稠密/稀疏/混合 · 切块 · 向量库 · Rerank · 记忆 —— 子地图index

RAG 基础

  1. RAG 的基本流程与局限
  2. Chunking 有哪些常用策略
  3. Embedding 怎么选
  4. 为什么 RAG 还需要 Rerank
  5. 检索与排序效果怎么评
  6. 长上下文 vs RAG 怎么选

向量库选型 7. pgvector

记忆系统 8. Mem0 与 MemGPT 长期记忆思路


推理与部署

算力与线上形态;被问概率随岗位升高

  1. PagedAttention 解决了什么
  2. KV Cache 为什么重要
  3. Continuous Batching 的意义
  4. SGLang 与 vLLM 的差异

待补

  • 量化(INT8 / INT4 / AWQ / GPTQ)对比
  • TGI / Triton / ONNX Runtime 的定位差异

多模态

VLM · VLA · 主流模型对比

  1. VLM 与 VLA 的区别
  2. Qwen-VL 与 LLaVA 的能力差异
  3. RDT-1B 是什么

具身智能

感知-决策-执行 · 大脑小脑 · Sim2Real · 工程定位

  1. 具身智能与人形机器人的区别
  2. 大脑-小脑分层架构是什么
  3. 感知-决策-执行闭环里的工程难点
  4. 仿真到真机有哪些 gap
  5. 数据闭环的位置

AI 编程方法论

开发范式 · 人机协作边界

  1. Vibe Coding 是什么:适用场景与边界

本模块 P0 生疏题(自动)

TABLE file.mtime AS "最近更新", tags AS "标签"
FROM "01-AI大模型"
WHERE contains(tags, "P0") AND contains(tags, "生疏")
SORT file.mtime ASC

本模块未动(催学)

LIST
FROM "01-AI大模型"
WHERE contains(tags, "未动")
SORT file.name ASC

此文件夹下有9条笔记。