图书推荐

在生成式人工智能的学习过程中,很多人的苦恼在于,他们既要学习基本原理,又要理解复杂的工程实践。面对飞速发展的生成式人工智能应用,人们一方面深感焦虑而希望快速掌握相关知识,提升 AI 使用或应用构建的能力;另一方面,又因算法与工程紧密交织的复杂体系而感到困惑,难以分清底层模型能力与周边工程实现的边界。本书着眼点就在二者之间,比如第 1 章“引言”中就概述了大语言模型的发展历史和基本概念,随后以聊天机器人为例讲解了生成式 AI 的三层架构。又比如第 2 章提到的大模型微调技术,一方面讲解了缩放定律(scaling law)和各种微调方式的原理,另一方面又在参考代码、显存消耗、成本估算等诸多细节层面展开讨论。本书的这种行文方式,为读者提供了一条快速掌握大语言模型实践的清晰路径。