本书结合理论和实践,由浅入深,全方位介绍了Hadoop这一高性能的海量数据处理和分析平台。全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。第Ⅱ部分介绍MapReduce,主题包括MapReduce应用开发;MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。第Ⅲ部分介绍Hadoop的运维,主题涉及构建Hadoop集群、管理Hadoop。第Ⅳ部分介绍Hadoop相关开源项目,主题涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供了三个案例,分别来自医疗卫生信息技术服务商塞纳(Cerner)、微软的人工智能项目ADAM(一种大规模分布式深度学习框架)和开源项目Cascading(一个新的针对MapReduce的数据处理API)。本书是一本权威、全面的Hadoop参考书和工具书,阐述了Hadoop生态圈的近期新发展和应用,程序员可以从
本书精讲数据结构与算法,对常见的算法及实现代码进行详细讲解,并配合具体的图表和教学视频,使读者轻松掌握数据结构知识并深入理解其中的算法思想。 本书共分8章,内容包括线性表、栈、队列、串、数组和广义表、树、图、查找、排序等。本书知识点涵盖全面,案例典型。本书习题大部分来自各大名校考研和 软件公司的笔试面试题目,是作者多年来的教学实践经验的总结。本书案例代码全部在Visual C++开发环境运行通过,并配套教学视频,方便读者自学。 本书适合C语言数据结构与算法的初学者、数据结构与算法课程考试的学生、考研人员、算法竞赛选手,也可以作为高等院校和培训机构计算机相关专业师生的教学参考书。
本书结合理论和实践,由浅入深,全方位介绍了Hadoop这一高性能的海量数据处理和分析平台。全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。第Ⅱ部分介绍MapReduce,主题包括MapReduce应用开发;MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。第Ⅲ部分介绍Hadoop的运维,主题涉及构建Hadoop集群、管理Hadoop。第Ⅳ部分介绍Hadoop相关开源项目,主题涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供了三个案例,分别来自医疗卫生信息技术服务商塞纳(Cerner)、微软的人工智能项目ADAM(一种大规模分布式深度学习框架)和开源项目Cascading(一个新的针对MapReduce的数据处理API)。本书是一本权威、全面的Hadoop参考书和工具书,阐述了Hadoop生态圈的近期新发展和应用,程序员可以从