pengtao-tech

Home

❯

01 AI大模型

❯

10 Transformer与注意力

文件夹: 01-AI大模型/10-Transformer与注意力

此文件夹下有7条笔记。

  • 2026年5月12日

    Decoder 的 Mask 为什么要下三角

    • P0
    • 真盲区
    • AI方向
    • 生疏
  • 2026年5月12日

    RNN 是什么

    • P0
    • 真盲区
    • AI方向
    • 生疏
  • 2026年5月12日

    Self-Attention 与 Cross-Attention 的区别

    • P0
    • 真盲区
    • AI方向
    • 生疏
  • 2026年5月12日

    Transformer 为什么比 RNN 快

    • P0
    • 真盲区
    • AI方向
    • 生疏
  • 2026年5月12日

    Transformer 是什么

    • P0
    • 真盲区
    • AI方向
    • 生疏
  • 2026年5月12日

    为什么 attention 要除以 √dk

    • P0
    • 真盲区
    • AI方向
    • 已背熟
  • 2026年5月12日

    多头注意力为什么比单头好

    • P0
    • 真盲区
    • AI方向
    • 生疏

关系图谱

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community