本书在基本数据结构的基础上,围绕一些常用的高级数据结构,结合大量实战例题,深入分析 数据结构是如何服务于算法的 ,这也是本书编写的一个核心理念:学习数据结构是为了 用好 数据结构。本次修订除了改错,主要是更换全书的程序代码为(C )。本书的适用对象包括:中学信息学竞赛SHOU*选手及辅导老师、大学ACM比赛SHOU*选手及教练、高等院校计算机专业的师生、程序设计爱好者等。
本书主要介绍大数据概论,内容包括大数据概述、科学研究第四范式、分布系统设计的CAP理论、NoSQL数据库、复杂网络、MapReduce分布编程模型、大数据存储、大数据分析、大数据挖掘、大数据可视化、大数据安全、大数据机器学习、大数据推荐技术,以及数据科学与数据思维。全书对上述内容概念性地介绍,语言精练、内容全面。
随着大数据的概念、技术、应用深入到了社会中的各个方面,它在迅速而深刻地改变着我们工作方式和生活方式。Hadoop作为大数据行业中的一位元老级成员,它提供了一种可以高效处理海量规模数据的方式,为大数据的发展提供了巨大帮助。本书紧密结合理实一体化教学,以项目的形式呈现了基于Hadoop的大数据平台的构建、使用与管理,具体包括六个模块:(1)搭建单节点Nadoop整合平台;(2)搭建高可用Hadoop整合平台;(3)Hadoop整合平台的使用与管理;(4)基于Linux的MySQL数据库平台的搭建;(5)Hive数据仓库的搭建和使用;(6)使用ETL工具Sqoop转换数据。每个项目又划分成多个学习任务,呈现出一个个真实案例,在教学中取得了良好的教学效果,让读者通过案例实践对大数据以及Hadoop平台有更直观的认识。