现代自然语言处理
战略型新兴领域“十四五”高等学校规划教材

作者:王志春,于恒,姜文斌

丛书名:新一代信息技术(人工智能)系列丛书

定价:79元

印次:1-1

ISBN:9787302704669

出版日期:2025.12.01

印刷日期:2025.12.25

图书责编:赵凯

图书分类:教材

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

"本书是一部系统阐述自然语言处理与大语言模型原理、方法及应用的教材。全书共分为8 章: 第1 章绪论,介绍自然语言处理的发展历程、研究内容与基本方法,梳理了从规则方法、机器学习 方法到深度学习与大模型时代的技术演进;第2 章数学基础,系统讲解了自然语言处理所需的数学 工具,包括概率论、线性代数与信息论基础;第3 章神经网络基础,介绍神经元结构、前馈与卷积 网络、循环网络及注意力机制;第4 章语言模型,深入探讨统计语言模型、词向量模型以及神经网 络语言模型;第5 章大语言模型基础,系统分析大模型的宏观与微观发展、典型架构、训练流程与 优化方法,并介绍提示工程与指令微调等关键技术;第6 章大语言模型进阶,进一步讲解强化学习、 思维链推理、大模型智能体、分布式训练与模型评估体系;第7 章多模态大模型,扩展至跨模态理 解与生成,涵盖视觉、文本等多源信息的融合与建模方法;第8 章现代自然语言处理基础任务,结 合前沿模型介绍词性标注、命名实体识别、句法分析、语义分析、信息检索、智能问答与机器翻译 等典型任务及实现方法。 本书内容体系化、覆盖面广,既注重理论讲解,又结合大量实例与模型演进分析,适合作为高 等院校人工智能、计算机科学与技术等专业的教材或研究生课程参考书,也可作为自然语言处理、 大模型研发及人工智能应用领域从业者的自学与进阶用书。 "

前言 当前,人工智能已成为引领新一轮科技革命与产业变革的战略性技术,深刻改变着人 类的生产和生活方式。作为人工智能领域的核心技术,深度学习凭借其出色的表征学习能 力,在计算机视觉、自然语言处理、智能决策等多个方向取得突破性进展,并广泛应用于工 业、医疗、金融、教育等行业。近年来,备受关注的大模型、生成式人工智能、具身智能等 研究方向,也都离不开深度学习技术的支撑。在此背景下,国内众多高校的人工智能及相 关专业(如自动化、计算机、电子等)均已面向高年级本科生和研究生开设深度学习课程。 本书基于作者在清华大学讲授“模式识别与机器学习”本科生课程的多年教学实践,以 及长期在深度学习领域的一线科研经验,立足国内高校人工智能及相关专业教学的实际需 求,系统梳理了深度学习的知识体系,从多层感知机等经典神经网络入手,逐步深入剖析 深度卷积网络、循环神经网络、Transformer 等核心模型与算法,同时介绍了自监督学习、 生成式模型、高效计算方法等前沿与面向实践的内容。由于深度学习仍处于快速发展阶段, 涵盖范围广泛,本书适当省略了一些较为专用或理论过深的内容,而聚焦于最具代表性的 神经网络模型与算法,以帮助初学者迅速把握其核心知识与体系框架。本书特别注重厘清 深度学习的发展脉络,阐明各类模型与算法提出的背景及其演进关系,这对读者系统认识 该领域并逐步形成创新能力具有重要意义。同时,深度学习也是一门高度重视实践的学科。 为此,本书基于常用的PyTorch 深度学习框架,提供了典型的实践指导与代码示例,以帮 助读者将理论学习与动手实操相结合。 通过学习本书,学...

目录
荐语
查看详情 查看详情
目录

第1 章绪论/ 1

1.1 深度学习的历史/ 1

1.2 深度学习的应用/ 4

1.3 深度学习研究的前沿与趋势/ 7

1.3.1 深度学习研究的发展趋势/ 8

1.3.2 深度学习研究的挑战/ 10

第2 章基础知识/ 12

2.1 学习算法与评价方法/ 12

2.1.1 任务与机器学习算法/ 12

2.1.2 性能度量与评价指标/ 14

2.2 假设空间、过拟合和欠拟合/ 22

2.3 偏差和方差/ 23

2.3.1 偏差、方差与噪声的定义/ 23

2.3.2 泛化误差的分解/ 23

2.3.3 偏差与方差的权衡/ 24

2.4 最大似然估计/ 24

2.5 贝叶斯决策/ 27

2.5.1 贝叶斯定理/ 27

2.5.2 贝叶斯分类器/ 27

2.5.3 最小化错误率/ 28

2.5.4 贝叶斯风险/ 28

2.6 无监督、半监督和自监督学习/ 30

2.6.1 无监督学习/ 30

2.6.2 半监督学习/ 32

2.6.3 自监督学习/ 33

2.7 损失函数/ 34

2.7.1 分类任务/ 34

2.7.2 回归任务/ 35

2.7.3 密度估计任务/ 36

2.7.4 目标检测任务/ 36

2.7.5 图像分割任务/ 37

2.7.6 自然语言处理任务/ 37

2.8 习题/ 38

第3 章经典神经网络/ 39

3.1 感知机算法/ 39

3.1.1 基本模型/ 39

3.1.2 学习策略/ 40

3.1.3 感知机的特点与局限/ 40

3.2 多层感知机/ 41

3.2.1 基本结... 查看详情

战略型新兴领域“十四五”高等学校规划教材


查看详情