内容简介

"本书是一部系统阐述自然语言处理与大语言模型原理、方法及应用的教材。全书共分为8 章:

第1 章绪论,介绍自然语言处理的发展历程、研究内容与基本方法,梳理了从规则方法、机器学习

方法到深度学习与大模型时代的技术演进;第2 章数学基础,系统讲解了自然语言处理所需的数学

工具,包括概率论、线性代数与信息论基础;第3 章神经网络基础,介绍神经元结构、前馈与卷积

网络、循环网络及注意力机制;第4 章语言模型,深入探讨统计语言模型、词向量模型以及神经网

络语言模型;第5 章大语言模型基础,系统分析大模型的宏观与微观发展、典型架构、训练流程与

优化方法,并介绍提示工程与指令微调等关键技术;第6 章大语言模型进阶,进一步讲解强化学习、

思维链推理、大模型智能体、分布式训练与模型评估体系;第7 章多模态大模型,扩展至跨模态理

解与生成,涵盖视觉、文本等多源信息的融合与建模方法;第8 章现代自然语言处理基础任务,结

合前沿模型介绍词性标注、命名实体识别、句法分析、语义分析、信息检索、智能问答与机器翻译

等典型任务及实现方法。

本书内容体系化、覆盖面广,既注重理论讲解,又结合大量实例与模型演进分析,适合作为高

等院校人工智能、计算机科学与技术等专业的教材或研究生课程参考书,也可作为自然语言处理、

大模型研发及人工智能应用领域从业者的自学与进阶用书。

"