"平衡好性能与成本,深度挖掘AI潜能
随着人工智能和机器学习的发展,大语言模型(LLM)日益普及,但其高昂的计算成本成为许多企业入局的障碍。本书提供了构建和部署大语言模型的高***方
案,从模型选择、提示工程到微调和部署的每个环节,指导读者在不过度牺牲性能的前提下有效控制成本。
《精益大模型:成本优化与工程实践》专为开发者和数据科学家而写,提供了实施搜索系统、智能助手和自主智能体等有价值的生成式AI应用所需的实用技术知
识。本书深入探讨了优化推理的技术,如模型量化和剪枝,并分析了在基础设施层面降低成本的机会。此外,本书展望了大语言模型成本优化的未来趋势,助你在生
成式AI的下一阶段保持竞争力。
本书由亚马逊**数据科学家Shreyas Subramanian撰写,将带你攻克与大语言模型相关的挑战,并成功落地生成式AI解决方案。"
