本章主要介绍不同的子词分法
注意力机制的变体
本章主要介绍几种注意力机制的变体,包括MHA、MQA、GQA等
分类任务常见指标
本章主要介绍几种分类任务常见的指标,包括Accuracy、Precision、Recall、F1-score等
混合精度
本章主要介绍不同的浮点数类型,以及混合精度训练的方法
LLM的并行优化
本章介绍LLM的并行优化,包括数据并行、流水线并行,以及DeepSpeed分布式架构的做法
Leetcode 回溯—排列篇
Leetcode刷题记录——回溯排列篇
Leetcode 回溯—子集篇
Leetcode刷题记录——回溯子集篇
Leetcode 回溯—组合篇
Leetcode刷题记录——回溯组合篇
Leetcode 回溯—分割篇
Leetcode刷题记录——回溯分割篇
Leetcode 二叉搜索树
Leetcode刷题记录——二叉搜索树