本书结合理论和实践,由浅入深,多方面介绍了Hadoop这一高性能的海量数据处理和分析平台。全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。第Ⅱ部分介绍MapReduce,主题包括MapReduce应用开发;MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。第Ⅲ部分介绍Hadoop的运维,主题涉及构建Hadoop集群、管理Hadoop。第Ⅳ部分介绍Hadoop相关开源项目,主题涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供了三个案例,分别来自医疗卫生信息技术服务商塞纳(Cerner)、微软的人工智能项目ADAM(一种大规模分布式深度学习框架)和开源项目Cascading(一个新的针对MapReduce的数据处理API)。本书是一本很好不错、全面的Hadoop参考书和工具书,阐述了Hadoop生态圈的很新发展和应用,程序员可以
本书是一本讲解MySQL程序员面试笔试的百科书,在写法上,除了讲解如何解答MySQL程序员面试笔试问题以外,还引入了相关知识点辅以说明,让读者能够更加容易地理解。 本书将MySQL程序员面试笔试过程中各类知识点一网打尽,在广度上,通过各种渠道,搜集了近3年来典型IT企业针对MySQL数据库岗位的笔试面试涉及的知识点,包括但不限于MySQL数据库、计算机网络、操作系统等,所选择真题均为企业招聘使用题目。在讲解的深度上,本书由浅入深地分析每一个知识点,并提炼归纳,同时,引入相关知识点,加以深度剖析,让读者不仅能够理解这个知识点,还能在遇到相似问题的时候,也能游刃有余地解决,而这些内容是其他同类书籍所没有的。本书对知识点进行归纳分类,结构合理,条理清晰,对于读者进行学习与检索意义重大。 本书是一本计算机相关专业毕业生面