大模型产品化手册:工程化方法与实践
将介绍如何制订一个LLMOps计划,帮助你将AI应用从设计顺利过渡到交付。

作者:[美] 克里斯托弗·布鲁索(Christopher Brousseau)马特·夏普(Matt Sharp)著 殷海英 译

定价:118元

印次:1-1

ISBN:9787302710530

出版日期:2026.04.01

印刷日期:2026.03.10

图书责编:王军

图书分类:零售

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

"大多数商业软件通常采用迭代开发的方式,部署后还可以进行显著的改进和调整。与此不同,大语言模型(LLM)开发成本高、修改难度大,因此需要在前期进行精心的规划、严格的数据标准控制及精准的技术实现。将LLM集成到实际产品中,会影响运营的方方面面,包括应用生命周期、数据处理流程、计算成本、安全性等。如果操作不当,可能导致高昂的失败成本。 《大模型产品化手册:工程化方法与实践》将介绍如何制订一个LLMOps计划,帮助你将AI应用从设计顺利过渡到交付。你将学习如何准备LLM数据集,掌握高效的训练技巧,如LoRA(低秩适应)和RLHF(基于人类反馈的强化学习),以及如何通过行业基准来评估模型性能。在学习过程中,你还将通过三个有趣的项目,实践所学的技能:创建并训练定制的大语言模型,开发一个VSCode AI编码插件,以及将小型模型部署到树莓派上。 主要内容 ? 平衡成本与性能 ? 再训练与负载测试 ? 针对普通硬件优化模型 ? 在Kubernetes集群上部署"

"Christopher Brousseau是摩根大通的一名资深机器学习工程师(Machine Learning Engineer,MLE),拥有语言学和本地化背景。他专注于语言学驱动的自然语言处理(Nature Language Processing,NLP),尤其在国际化领域有深入研究,并曾在初创公司和财富500强企业中成功领导过机器学习和数据产品项目。Matt Sharp是一名工程师、数据科学家,也是在MLOps领域经验丰富的技术领导者。他曾为初创公司和**科技公司成功领导过多个数据项目。Matt擅长在生产环境中部署、管理和扩展机器学习模型,无论生产环境的具体形式如何。"

驾驭浪潮,铸造价值 ——开启大模型产品化的工程时代 我们正处在一个激动人心又充满挑战的时代。以大语言模型(LLM)为代表的生成式人工智能,正以惊人的速度渗透到各行各业,从根本上重塑着软件的定义、人机交互的范式乃至商业世界的逻辑。作为一名长期关注软件工程演进的学者,我将这一变革视为继“软件作坊”与“软件工厂”之后,迈向“软件智能体”时代的黎明——一个由数据、模型和算力共同驱动,以智能化为核心特征的全新纪元。 然而,当ChatGPT引发的惊叹与狂热逐渐冷却,一个更为严峻的现实问题摆在了所有从业者面前:如何将这些强大的、看似无所不能的模型,转化为稳定、可靠且具有商业价值的产品?从惊艳的技术演示(Demo)到真正服务于亿万用户的生产系统(Production),其间横亘着一道深不见底的鸿沟。这道鸿沟,正是“模型”与“产品”之间的距离,也是无数AI项目折戟沉沙的根源所在。 这正是《大模型产品化手册:工程化方法与实践》这本书存在的价值。它并非一本空谈模型原理或炫技算法的专著,而是一本极其稀缺的、真正聚焦于“工程化落地”的全栈实战指南。作者团队凭借其在机器学习和语言学领域的深厚积累,敏锐地洞察到了当前大模型产品化过程中的核心痛点:数据科学家、软件工程师与产品经理之间普遍存在的“认知鸿沟”。 本书的独特之处在于,它用一种系统化的工程思维,打通了从数据准备到最终部署的全链路。 ● 在基础设施与模型策略上,它直面“自建还是购买”的战略抉择,并深入探讨了如何构建高效的AI基础设施以应对训练与推理的挑战。这与当前行业普遍关注的混合部署、成本优化趋势不谋而合。书中关于“从数据到基础模型”...

目录
荐语
查看详情 查看详情
目    录

第1章  语言的觉醒:为何大语言模型引起了广泛关注  1

1.1  大语言模型加速信息传递  2

1.2  大语言模型应用中的自建与采购决策权衡  6

1.2.1  采购:成熟的路径选择  6

1.2.2  构建:不走寻常路  7

1.2.3  重要提示:即刻拥抱未来  12

1.3  破除迷思  14

1.4  本章小结  16

第2章  大语言模型技术内幕:语言建模深度解析  17

2.1  语言建模  18

2.1.1  语言特征  19

2.1.2  符号学  23

2.1.3  多语言自然语言处理  25

2.2  语言建模技术  26

2.2.1  N-gram与基于语料库的技术  27

2.2.2  贝叶斯技术  29

2.2.3  马尔可夫链  33

2.2.4  连续语言建模  35

2.2.5  词向量技术(Embedding)  39

2.2.6  多层感知机  40

2.2.7  循环神经网络和长短时记忆网络  42

2.2.8  注意力机制  49

2.3  注意力机制即一切  51

2.3.1  编码器  51

2.3.2  解码器  53

2.3.3  Transformer  54

2.4  超大规模变换器  56

2.5  本章小结  60

第3章  大语言模型运维:构建LLM平台  63

3.1  大语言模型运维简介  63

3.2  大语言模型的运维挑战  64

3.2.1  漫长的下载时间  64

3.2.2  更长的部署时间  65

3.2.3  延迟... 查看详情

"当 ChatGPT 引发的惊叹与狂热逐渐冷却,一个更为严峻的现实问题摆在了所有从业者面前:如何将这些强大的、看似无所不能的模型,转化为稳定、可靠且具有商业

价值的产品?从惊艳的技术演示(Demo)到真正服务于亿万用户的生产系统(Production),其间横亘着一道深不见底的鸿沟。这道鸿沟,正是“模型”与“产品”之间的距离,也是无

数AI项目折戟沉沙的根源所在。

这正是《大模型产品化手册:工程化方法与实践》这本书存在的价值。它并非一本空谈模型原理或炫技算法的专著,而是一本极其稀缺的、真正聚焦于“工程化落地”的全栈

实战指南。作者团队凭借其在机器学习和语言学领域的深厚积累,敏锐地洞察到了当前大模型产品化过程中的核心痛点:数据科学家、软件工程师与产品经理之间普遍存在的“认知鸿沟”。

《大模型产品化手册:工程化方法与实践》的独特之处在于,它用一种系统化的工程思维,打通了从数据准备到最终部署的全链路。"


查看详情