


定价:99元
印次:1-1
ISBN:9787302701637
出版日期:2025.09.01
印刷日期:2025.09.10
图书责编:贾旭龙
图书分类:零售
《利用Ray进行MLOps:大模型从开发到部署》围绕 MLOps 展开,全面阐释其概念与落地实践。开篇对 MLOps 进行概述,剖析其体系架构、价值定位与技术栈。随后各章从特征工程、模型训练与推理,到可观测性基础设施,通过理论阐述与架构解析,并结合 Uber、Meta 等知名案例,分享建设思路。此外,本书还介绍 RayCore 及 RayAI库的使用,并提供大语言模型训练部署实例。最后,本书对 MLOps及 AI/MI的发展趋势进行展望。
"Hien Luu是一位充满热情的人工智能/机器学习工程领导者,自2020年以来一直领导DoorDash的机器学习平台。Hien专注于为实际应用开发健壮且可扩展的人工智能/机器学习基础设施。他是《Beginning Apache Spark 3》一书的作者,并在MLOps World、QCon(旧金山、纽约、伦敦)、GHC 2022、Data+AI Summit等会议上发表演讲。Max Pumperla是德国汉堡的数据科学教授和软件工程师。他是活跃的开源贡献者、多个Python软件包的维护者,以及机器学习书籍的作者。他目前在Anyscale担任软件工程师。作为Pathmind Inc.的产品研究负责人,他曾使用Ray RLlib、Serve和Tune为大规模工业应用开发强化学习解决方案。Max曾是Skymind公司DL4J的核心开发人员,并帮助扩展了Keras生态系统。Zhe Zhang自2020年以来一直领导Anyscale的Ray工程团队。在此之前,他在领英(LinkedIn)管理大数据/人工智能计算团队(提供Hadoop/Spark/TensorFlow即服务)。张哲从事开源工作已有约十年时间。他是Apache Hadoop的提交者和项目管理委员会(PMC)成员,也是HDFS纠删码功能的主要作者,该功能是Apache Hadoop 3.0的关键组成部分。2020年,张哲当选为Apache软件基金会成员。"
前言 近年来,机器学习领域发展迅猛,模型复杂度不断攀升,大语言模型更成为推动行业变革的重要力量。但随着机器学习项目从实验阶段迈向生产部署,一系列挑战接踵而至,如何高效管理模型全生命周期,并保障模型持续可用,成为从业者必须攻克的难题。MLOps 作为一套旨在整合机器学习开发与运维的解决方案,应运而生;而 Ray 则为 MLOps 的落地,提供了强大助力。在编写本书时,我们希望能为读者搭建一座通往高效 MLOps 实践的桥梁,帮助大家在复杂多变的 AI 领域中找到前行的方向。 本书开篇对 MLOps 展开全面论述。首先介绍 MLOps 体系结构,以及机器学习项目的输入和输出,让大家理解这一领域的理论框架。随后分析机器学习项目实施的痛点,阐述 MLOps 的愿景与价值,同时介绍 MLOps 标准技术栈与核心组件,帮助大家建立起对 MLOps 的整体认知。 接下来,本书从实操角度出发,详细介绍 MLOps 实施策略。在介绍战略协同、需求评估、基础设施搭建方法后,我结合 Uber 的 Michelangelo 平台、Meta 的 FBLearner 平台等案例,展示如何在实际场景中落地 MLOps。 机器学习模型的开发与运维是一个系统性工程,为此,本书分章节对特征工程、模型训练、模型推理、可观测性基础设施进行了深入剖析。不仅介绍各环节的架构、流程,分析自建与采购方案,还通过大量案例研究,分享如何解决组织实施过程中遇到的挑战,帮助读者积累实战经验。 Ray 作为一款卓越的分布式计算框架,在加速 MLOps 落地方面优势显著。本书专门介绍了 Ray Core 和 Ray AI 库,...
第 1 章 MLOps 概览 1
1.1 MLOps 体系解析 2
1.1.1 机器学习项目 3
1.1.2 机器学习项目的输入和输出 4
1.2 MLOps 的价值定位 6
1.2.1 机器学习项目实施的挑战 6
1.2.2 MLOps 的愿景与价值 11
1.3 MLOps 标准技术栈 19
1.3.1 MLOps 体系架构 19
1.3.2 核心组件解析 20
1.4 小结 30
第 2 章 MLOps 实施策略与案例研究 32
2.1 实施策略 33
2.1.1 战略协同 33
2.1.2 MLOps 需求评估 34
2.1.3 MLOps 基础设施构建方法 41
2.2 MLOps 全景介绍 46
2.3 案例研究 49
2.3.1 Uber 的 Michelangelo 平台 50
2.3.2 Meta 的 FBLearner 平台 52
2.4 小结 55
第 3 章 特征工程基础设施 56
3.1 概述 57
3.2 架构 59
3.2.1 特征规范与定义 61
3.2.2 特征注册表 67
3.2.3 特征编排 68
3.2.4 特征存储 69
3.2.5 特征上传 70
3.2.6 特征服务 71
3.2.7 监控体系 71
3.3 自建与采购 72
3.3.1 重要考量因素 72
3.3.2 自建方案分析 73
3.3.3 采购方案评估 74
3.4 组织性挑战 74
3.4.1 数据可用性 75
3.4.2 数据治理 75
3.5 案例研究 76
3.5.1 开源 76... 查看详情
聚焦 MLOps 全流程落地,从概念体系、技术栈解析到特征工程、模型训练推理与可观测性建设,融合 Uber、Meta 标杆案例,详解 RayCore 与 RayAI 库实操,附赠大语言模型训练部署实例,既给开发者提供 “从开发到落地” 的完整指南,也前瞻 AI/ML 未来趋势,是掌握大模型 MLOps 技术的必备宝典!





