首页 > 图书中心 >图书详情
大数据基础教程
作者:王成良 廖军
定价:59元
印次:1-2
ISBN:9787302559665
出版日期:2020.11.01
印刷日期:2021.12.08
本书是理论与实践相结合的教材,以Centos 7、Eclipse等为实验开发工具,搭建了Hadoop、HBase、ZooKeeper、Spark等相应的实验集群,通过相关经典实验案例,使学生由浅入深、由点到面的逐步提高和巩固大数据基础理论知识和综合实践能力。
more >前言 随着云时代的到来,大数据(Big Data)引起了人们越来越多的关注。大数据作为IT领域最热门的技术之一,正在不断渗透到人们的生活中,具有广阔的应用空间和发展前景,社会对大数据人才的需求也日益迫切。了解和学习大数据相关知识,不仅是对数据科学和大数据技术、计算机等相关专业学生的要求,也是学生未来职业发展的一种重要途径。 本书与实践相结合介绍大数据基础理论,以Centos 7、Eclipse等作为实验开发环境和工具,搭建了包括Hadoop、HBase、ZooKeeper、Spark等Hadoop生态圈的实验集群,通过典型的实验案例,学生可以由浅入深、由点到面地逐步学习、掌握大数据基础理论知识,并能结合具体实验熟悉大数据基础技术,培养综合实践能力。 本书内容充实、丰富,覆盖面广,共分为10章。第1章介绍大数据相关定义及概念,包括大数据的历史与发展、大数据的特点和应用场景以及大数据的挑战和机遇等;第2章介绍Apache架构与Apache Hadoop的基本概念、Hadoop的安全性、Hadoop的搭建及相关实验案例;第3章介绍Hadoop分布式文件系统(HDFS)的概念、原理、常用命令及简单的实验案例;第4章介绍YARN的基本架构,描述YARN的工作流程,详细分析YARN协议及优点;第5章介绍MapReduce的基本知识,详细描述Map框架流程、应用MapReduce所需的环境搭建及相关实验;第6章介绍Hive的相关定义、Hive安装配置过程及典型实验;第7章介绍HBase的基础、数据模型以及访问接口,详细讲解HBase伪分布式和完全分布式的安装与配置;第8章介绍ZooKeeper的发展背景及主要特点,详细说明ZooKeeper的体系结构与关键算法ZAB,同时还介绍ZooKeeper的四字命令及集群搭建操作,并讲解相应的实验案例;第9章介绍Spark的基本概念、组件以及Spark的特性,着重描述Spark的主要架构,并对Spark的计算模型、集群搭建、相关技术及实验进行详细讲解;第10章主要介绍Apache Kafka分布式消息系统相关的消息队列、中间件,详细描述Kafka的结构、Producer和Consumer的消息状态、Kafka的相应消息与日志、Kafka的特性及Kafka的消息发送与接收。本书在多数章章末提供了必要的基础实验,便于读者全面、深入地掌握大数据基础技术的知识点。 本书的编写得到了重庆大学大数据与软件学院领导的关心和支持,邓惠尹、王子梁、张钧洋、王丹、谭杨等参与了本书部分内容的编写工作,在此一并表示感谢。 由于作者水平有限,加之时间仓促,书中难免存在疏漏和不妥之处,恳请同行专家和读者给予批评和指正。对于本书中的实验操作视频,读者可扫描相应章节的二维码直接观看。 本书的配套课件、完整的案例源代码等资源可以从清华大学出版社网站www.tup.com.cn或微信公众号“书圈”下载,本书及课件等资源的使用中如有问题,请联系404905510@qq.com。 编者2020年8月
more >