- 01_main-chapter-code 包含了章节的主要代码。
-
02_bonus_efficient-multihead-attention 实现并比较了多头注意力的不同实现变体。
-
03_understanding-buffers 解释了 PyTorch 缓冲区的概念,这些缓冲区用于实现第三章中的因果注意力机制。
Name | Name | Last commit date | ||
---|---|---|---|---|
parent directory.. | ||||
02_bonus_efficient-multihead-attention 实现并比较了多头注意力的不同实现变体。
03_understanding-buffers 解释了 PyTorch 缓冲区的概念,这些缓冲区用于实现第三章中的因果注意力机制。