Deepseek GRPO 中的 KL Divergence,forward kl divergence or reverse kl divergence?
大语言模型与深度学习书籍推荐。
100 道 Numpy 练习题的 Numpy 和 PyTorch 解答
2024 年度总结。
2024 年对 LLM 的一些看法,我们正处于 AI 的黄金时代
介绍一个简单的做图辅助库,让 matplotlib 显示中文更加简单