内容简介

本书系统介绍了大数据的相关知识及应用,重视理论与实验的结合。全书共14章,理论部分包含大数据概述、大数据平台Hadoop、分布式文件系统、分布式并行编程模型MapReduce、数据仓库Hive、分布式数据库HBase、基于内存的编程模型Spark、流计算与Storm、大数据采集与预处理、大数据存储与管理、大数据分析与挖掘、大数据可视化、大数据安全与治理、大数据应用案例。