


定价:109元
印次:1-1
ISBN:9787302703280
出版日期:2025.10.01
印刷日期:2025.09.29
图书责编:夏毓彦
图书分类:零售
"《Spark大数据开发与应用案例:视频教学版》在培训机构的教学实践中历经8年锤炼而成,以简明清晰且易于理解的方式,全面覆盖Spark集群构建、Spark Core、Spark SQL、Spark实战案例以及面试问答等内容。为增强读者的学习体验,《Spark大数据开发与应用案例:视频教学版》配套丰富的电子资源,包括示例源码、PPT教学课件、集群环境、教学视频以及作者微信群答疑服务。 《Spark大数据开发与应用案例:视频教学版》精心编排为15章,内容包括Spark简介、Spark集群环境部署、Spark编程体验、RDD深度解读、RDD的Shuffle详解、Spark共享变量、Spark序列化和线程安全、Spark内存管理机制、Spark SQL简介、Spark SQL抽象编程详解、Spark SQL自定义函数、Spark SQL源码解读、Spark性能调优、Spark实战案例、Spark面试题。 《Spark大数据开发与应用案例:视频教学版》不仅适合Spark初学者快速入门,也有助于大数据分析人员及大数据应用开发人员进一步提升技能。同时,《Spark大数据开发与应用案例:视频教学版》也可以作为高等院校或高职高专院校Spark大数据技术课程的教材。"
"段海涛,毕业于南京邮电大学,高级工程师。曾就职于中国移动、中国石油、亚信科技等。从事大数据行业10余年,海易牛科技(大数据平台开发技术服务)和北京多易教育(大数据技术培训)创始人。为中国移动、用友软件、四方精创及多个城市的数据局等企业和单位提供过解决方案和技术咨询服务;为数千有志进入大数据开发行业的大学生提供了就业培训服务。在多个互联网平台公开Hadoop、Spark、Flink等大量培训视频,广受欢迎和好评。杨忠良,毕业于清华大学电子工程系,博士,北京邮电大学副研究员、博士生导师。长期从事人工智能、大数据分析等领域的研究。在国内外重要期刊和会议发表学术论文80余篇,多篇文章收录ESI高被引论文。主持或参与多项国家自然科学基金、国家重点研发计划项目等,参与编撰教材1部。获得 2024年中国通信学会科学技术二等奖,2021 年 ACM SIGWEB CHINA 新星奖。余辉,毕业于中科院,硕士,中级工程师,大数据平台架构师。曾就职于京东金融、酷开网络。从事大数据行业10余年,专注于大数据及机器学习领域。发表大数据相关论文3篇,发表软著10多个,授权专利30多个。著有《Hadoop+Spark生态系统与实战指南》。"
前 言 在21世纪的数字化时代,数据已成为国家基础性战略资源,被誉为新时代的“钻石矿”。党中央、国务院始终高度重视大数据在经济社会发展中的关键作用。自党的十八届五中全会提出“实施国家大数据战略”以来,国务院相继印发《促进大数据发展行动纲要》,标志着我国大数据发展进入全面推进的新阶段,旨在加快建设数据强国,推动经济社会高质量发展。 进入“十四五”规划时期,我国大数据产业发展迎来新的历史机遇。在国家政策的引导下,大数据与云计算、人工智能、区块链等新技术深度融合,不断催生新业态、新模式,为经济社会发展注入强大的动力。与此同时,大数据技术在政务、金融、教育、医疗、交通等领域的应用不断深化,有力推动了政府治理体系和治理能力的现代化,加速了产业数字化转型的步伐。 展望“十五五”规划,我国大数据产业将继续保持蓬勃发展态势,技术创新和应用实践将更加广泛深入。随着数据规模的持续增长和数据处理技术的不断进步,大数据将在推动经济社会发展中发挥更加重要的作用。因此,掌握大数据处理技能,特别是像Spark这样高效、易用的大数据处理框架,已成为大数据从业者必备的核心竞争力。 在此背景下,本书应运而生,专注于Apache Spark 3.5版本的快速上手和开发参考,所有内容都在培训机构历时8年的教学实践中锤炼而成。鉴于Spark Core和Spark SQL在大数据开发工作中的核心地位,本书将重点聚焦这两个组件,通过系统化的内容安排和深入浅出的讲解方式,帮助读者迅速掌握Spark的核心原理与实战技巧。 本书特点 (1)入门指南,全面剖析:本书作为Spark入门的权威指南,以深入浅出的笔触,...
第1章 Spark简介 1
1.1 Spark概念及其特点 1
1.2 Spark技术生态系统 2
1.3 Spark运行模式 4
1.4 Spark执行流程 8
1.5 Spark专有名词 9
1.6 本章小结 11
第2章 Spark集群环境部署 12
2.1 VM虚拟机安装 13
2.2 Ubuntu 22.04系统安装 19
2.3 Ubuntu 22.04网络配置 24
2.4 Ubuntu 22.04环境配置 28
2.5 ZooKeeper安装 33
2.6 Hadoop安装 35
2.6.1 下载并解压 35
2.6.2 配置系统环境变量 35
2.6.3 配置核心文件 36
2.6.4 分发Hadoop 40
2.6.5 启动和验证 40
2.7 Spark安装 47
2.7.1 下载和解压 47
2.7.2 配置系统环境变量 47
2.7.3 配置核心文件 47
2.7.4 分发Spark 48
2.7.5 Spark启动及UI界面查看 48
2.7.6 spark-shell启动验证 49
2.8 集群和代码下载 50
2.9 本章小结 52
第3章 Spark编程体验 54
3.1 Scala基础编程 54
3.1.1 基本语法 55
3.1.2 函数和方法 57
3.1.3 控制语句 59
3.1.4 函数式编程 62
3.1.5 类和对象 67
3.1.6 Scala异常处理 70
3.1... 查看详情
"(1)清华大学黄永峰教授、江铭虎教授郑重推荐。
(2)《Spark大数据开发与应用案例:视频教学版》系统讲解Spark 3.5框架,全部内容都在培训机构长达8年的培训实践中,一遍一遍讲解过,一遍一遍实验过。
(3)《Spark大数据开发与应用案例:视频教学版》以通俗易懂的方式详解Spark原生态组件的基础与用法,每一章都结合大量的实战案例,讲解过程中注重知识的系统性和内容的实用性。
(4)《Spark大数据开发与应用案例:视频教学版》最后一章还给出Spark在大厂面试中经常问到的问题,精准覆盖工作中常见使用场景及互联网企业面试要点,可以作为面试指南。
(5)作者提供微信群答疑服务,读者在学习过程中碰到问题可以随时请教作者。
(6)配套示例源码、PPT课件、集群环境、教学视频、配图PDF文件、作者微信群答疑服务。"





