


定价:59元
印次:1-1
ISBN:9787302698111
出版日期:2025.10.01
印刷日期:2025.09.11
图书责编:苏东方
图书分类:教材
"本书是一本针对Spark大数据分析平台的应用开发实践指南,旨在为读者提供一套完整的学习和实战路径,从而深入理解和掌握Spark的各个核心模块及其在实际项目中的应用。本书通过详细的项目导向学习方式,结合实际任务和案例分析,引导读者逐步掌握Spark应用开发的技术细节。 本书共8个项目,涵盖Spark的各个重要组件,包括认识Spark、Scala语法应用、Spark Core数据分析、Spark SQL结构化数据处理、Spark流式数据处理、Spark结构化流式处理、Spark机器学习应用、社交软件运营数据分析,逐步提升读者的技术水平和应用能力。每个项目由多个任务组成,通过任务提出、任务分析、知识准备、任务实现、任务总结、巩固练习和任务拓展的模块化结构,帮助读者系统化地掌握Spark应用开发的技术框架和核心概念。 本书适合作为高等学校本科数据科学与大数据技术专业教材,也适合作为高职本科、高职专科相关课程教材,还可以作为Spark开发初学者和中级开发人员的参考用书,帮助读者快速掌握Spark编程技术,提升在大数据分析和机器学习领域的实际能力。 "
李静,中山大学通信与信息系统专业硕士研究生,5年世界500强企业工作经历,截至目前,从事大数据相关课程教学工作8年,拥有丰富的教学经验,《Hadoop大数据平台搭建》省级精品在线课主持人;指导学生参加全国职业院校技能大赛“大数据技术与应用”赛项国赛三等奖;参与编写“大数据运维1+X等级证书(中级)教材,在大数据等级证书师资培训中担任主讲教师;在国内外核心期刊发表论文4篇,软件著作权5项。
前言 随着大数据时代的到来,数据处理和分析的需求日益增加,尤其是在分布式计算领域,Apache Spark作为一个高效、灵活的开源框架,已经成为大数据应用开发的主流工具之一。无论是批量数据处理、实时流数据分析,还是机器学习算法的应用,Spark都提供了强大的支持。 本书详细介绍了Spark 3版本的各个核心组件,涵盖从环境搭建到实际应用开发的整个过程,不仅探讨Spark Core、Spark SQL、Spark Streaming、Structured Streaming和Spark MLlib等重要模块的基本概念与实现方法,还通过一系列具体项目和任务,帮助读者在实践中逐步深入理解这些技术,掌握如何高效地开发、优化和调试Spark应用。 本书特色 本书作为职业本科大数据工程技术专业的系列教材之一,以职业本科学生编程能力培养需求为导向,采用任务引领的教学模式,结合“世界职业院校技能大赛(大数据应用开发赛项)”涵盖的技术框架,通过一系列精心设计的项目任务,引导学生逐步掌握Spark编程的基本知识和技能。每个任务均包括以下几部分。 任务提出: 明确任务的背景和目标,让读者清楚学习的方向。 任务分析: 分析任务的具体需求,帮助读者理解任务的实现过程。 知识准备: 在实现任务之前,介绍完成任务所需的Spark核心技术,为读者打下扎实的理论基础。 任务实现: 通过详细的步骤和代码示例,帮助读者实现项目任务。 任务总结: 总结任务中的关键知识点,帮助读者回顾和巩固学习成果。 巩固练习: 提供相关练习题,帮...
项目1认识Spark
任务1搭建Spark环境
【任务提出】
【任务分析】
【知识准备】
1.1认识Spark
1.1.1Spark内置模块
1.1.2Spark运行模式
1.2Spark安装
【任务实现】
【任务总结】
【巩固练习】
【任务拓展】
任务2Spark程序运行
【任务提出】
【任务分析】
【知识准备】
1.3Spark集群架构及运行原理
1.4Spark作业运行流程
1.4.1Spark本地模式
1.4.2Spark独立模式
1.4.3SparkonYarn模式
1.5Spark RDD及核心原理
【任务实现】
【任务总结】
【巩固练习】
【任务拓展】
项目2Scala语法应用
任务1安装Scala
【任务提出】
【任务分析】
【知识准备】
2.1了解Scala
2.2编程范式
【任务实现】
【任务总结】
【巩固练习】
【任务拓展】
任务2管理购物清单
【任务提出】
【任务分析】
【知识准备】
2.3基本语法
2.3.1基本数据类型
2.3.2变量和常量
2.3.3运算符
2.4集合类型之数组
2.5程序结构控制
2.5.1判断结构
2.5.2循环结构
2.6函数
2.6.1匿名函数
2.6.2高阶函数
【任务实现】
... 查看详情


