前言
党的二十大报告指出: 教育、科技、人才是全面建设社会主义现代化国家的基础性、战略性支撑。必须坚持科技是第一生产力、人才是第一资源、创新是第一动力,深入实施科教兴国战略、人才强国战略、创新驱动发展战略,开辟发展新领域新赛道,不断塑造发展新动能新优势。高等教育与经济社会发展紧密相连,对促进就业创业、助力经济社会发展、增进人民福祉具有重要意义。
随着互联网和物联网等技术的飞速发展,海量的数据产生。对这些数据的存储、处理与分析带动了大数据技术的发展。其中,数据分析与挖掘结合了数据处理、统计分析和机器学习等领域的技术,可以帮助人们在庞大的数据中进行相关分析,找到有价值的信息和规律,使得人们对世界的认识更快、更便捷。在数据科学领域,Python语言由于其简单易用、第三方库强大的特点,深受数据分析与挖掘人员的青睐。
本书从Python数据分析与挖掘的基础知识入手,结合大量的数据挖掘示例,系统介绍了数据分析与挖掘的原理、方法及应用,带领读者快速掌握Python数据分析与挖掘的相关知识,提高解决实际问题的能力。
全书共13章,包括绪论、Python编程基础、NumPy数值计算、Pandas数据分析、Python数据可视化、认识数据、数据预处理、回归分析、关联规则挖掘、分类、聚类、离群点检测以及文本和时序数据挖掘等内容。书中各章内容相对独立,以利于读者选择性学习。每章内容力求原理叙述清晰简洁,突出理论联系实际,辅之以Python代码实践与指导,引领读者快速迈进数据分析与挖掘领域。同时,在每章后面设置了内容小结、习题以及实训练习,有利于读者对内容的理解和掌握。
本书具有以下特色。
(1) 实战导向: 突出“理论工具案例”三位一体的教学理念。
(2) 体系完整: 覆盖数据分析、可视化到数据建模的全流程。
(3) 技术前沿: 集成传统统计分析工具与Python机器学习库。
(4) 受众广泛: 适合多层级、多领域读者自学或教学参考。
为便于教学,本书提供丰富的配套资源,包括教学大纲、教学课件、电子教案、程序源码、教学进度表、在线作业、习题答案和1000分钟的微课视频。
资源下载提示
课件等资源: 扫描封底的“图书资源”二维码,在公众号“书圈”下载。
素材(源码)等资源: 扫描目录上方的二维码下载。
在线自测题: 扫描封底的作业系统二维码,再扫描自测题二维码,可以在线做题及查看答案。
微课视频: 扫描封底的文泉云盘防盗码,再扫描书中相应章节的视频讲解二维码,可以在线学习。
本书由西北师范大学魏伟一教授编写。由于编者水平有限,书中难免存在疏漏和不足之处,敬请读者批评指正。
编者
西北师范大学
2025年1月