本书翻译自Sam R.Alapati的Expert Hadoop Administration。Sam R.Alapati是Sabre公司的首席Hadoop管理员,具有多年的Hadoop运维管理经验。他希望通过本书,为Hadoop集群开发与管理人员提供一些有益指导。从事Hadoop的管理工作,首先要了解Hadoop的架构,只进行单纯的操作并不能被称为合格的管理员。基于此,本书在介绍Hadoop及其生态组件时,都会首先介绍其架构,以期读者能够在更高的层次认识管理工作。本书首先介绍了Hadoop的整体架构及其部署与使用;然后着重介绍了两个重要的计算引擎MapReduce与Spark;接着介绍了Hadoop的数据存储与安全、数据均衡等特性;很后则介绍了如何进行参数调优与故障排除。整个流程下来,读者能够建立起完整的关于Hadoop管理的体系架构。