前言
党的二十大报告指出: 教育、科技、人才是全面建设社会主义现代化国家的基础性、战略性支撑。必须坚持科技是第一生产力、人才是第一资源、创新是第一动力,深入实施科教兴国战略、人才强国战略、创新驱动发展战略,
开辟发展新领域新赛道,不断塑造发展新动能新优势。
高等教育与经济社会发展紧密相连,对促进就业创业、助力经济社会发展、增进人民福祉具有重要意义。
随着数据采集和存储技术的迅速发展,数据正以前所未有的速度爆炸式增长。海量数据成了各行各业重要的战略资源,围绕这些数据进行可行的深入分析,对
社会领域的诸多决策都变得越来越重要。数据挖掘将传统的数据分析方法与用于处理大量数据的复杂算法相结合,利用数据库管理技术和大量以机器学习为基础的数据分析技术,为数据库中的知识发现提供有效支撑。
本书从数据挖掘的过程出发,以数据挖掘的流程和主要的机器学习算法为主线,全面系统地介绍数据挖掘的基本概念和主要思想、典型的机器学习算法以及利用Python实现数据挖掘与机器学习的过程。本书将数据挖掘的理论与方法和机器学习算法以及项目实践充分结合,以便加深加快读者对所学内容的理解和掌握。
全书共12章,包括
绪论、Python数据分析与挖掘基础、认识数据
、数据预处理、
回归分析、关联规则挖掘、分类、聚类、神经网络与深度学习、离群点检测、文本和时序数据挖掘、数据挖掘案例
等内容。书中各章节相互独立,读者可根据自己的兴趣选择使用。各章力求原理叙述清晰,易于理解,突出理论联系实际,辅以Python代码实践与指导,引领读者更好地理解与应用算法,快速迈进数据挖掘领域,掌握机器学习算法的理论和应用。同时,书中每章都给出了小结、习题和实训,可以帮助读者巩固本章学习内容,拓展相关知识。
本书配套资源丰富,包括教学大纲、教学课件、电子教案、程序源码、
在线题库和习题答案
,作者还为本书精心录制了650分钟的微课视频。
资源下载提示
课件等资源: 扫描封底的“图书资源”二维码,在公众号“书圈”下载。
素材(源码)等资源: 扫描目录上方的二维码下载。
在线自测题: 扫描封底的作业系统二维码,再扫描自测题二维码,可以在线做题及查看答案。
微课视频: 扫描封底
的文泉云盘防盗码
,再扫描书中相应章节中的
视频讲解
二维码,可以在线学习。
本书由魏伟一、张国治
和张志昌
编写,由于作者水平有限,不当之处在所难免,恳请各位读者赐教指正。
本书在编写过程中得到了全国高等院校计算机基础教育研究会2020年度“面向新工科的数据挖掘教学改革与资源建设”
项目(2020AFCEC096)的资助,在此表示衷心感谢。
魏伟一2024年5月