本书按照需求规划、需求实现、需求可视化的流程进行编排,遵循项目开发的实际流程,全面介绍了数据仓库的搭建过程。在整个数据仓库的搭建过程中,本书介绍了主要组件的安装部署过程、需求实现的具体思路、部分问题的解决方案等,并在其中穿插了许多与大数据和数据仓库相关的理论知识,包括大数据概论、数据仓库概论、电商业务概述、数据仓库理论准备、数据仓库建模等。 本书从逻辑上可以分为三部分:一是大数据与数据仓库概论及项目需求描述,主要介绍了数据仓库的概念、应用场景和搭建需求;二是项目部署的环境准备,介绍了如何从零开始搭建一个完整的数据仓库环境;三是需求模块实现,针对不同需求分模块进行实现,是本书的重点部分。 本书适合具有一定的编程基础并对大数据感兴趣的读者阅读。通过阅读本书,读者可以快速了解数据
《经济学人》杂志年度推荐的三大可视化图书之一 《大数据》作者、《经济学人》大数据主编肯尼思·库克耶倾情推荐,称赞其为“关于数据呈现的思考和方式的颠覆之作” 亚马逊数据和信息可视化类图书排名第3位 畅销书《鲜活的数据》作者近期新力作及姐妹篇 第一本系统讲述数据可视化过程的的普及图书 这是一本教我们如何制作完美可视化图表,挖掘大数据背后意义的书。作者认为,可视化是一种媒介,向我们揭示了数据背后的故事。他循序渐进、深入浅出地道出了数据可视化的步骤和思想。本书让我们知道了如何理解数据可视化,如何探索数据的模式和寻找数据间的关联,如何选择适合自己的数据和目的的可视化方式,有哪些我们可以利用的可视化工具以及这些工具各有怎样的利弊。 作者给我们提供了丰富的可视化信息以及查看、探索数据的多元视角
国家高度重视并积极推动新型基础设施的建设和发展。5G作为新基建的排头兵,凭借其万物物联和泛在智能的优势,将为社会带来根本性的变革。本书从新基建基本内涵出发,着眼于5G新基建中的网络规划建设和融合业务发展两条主线展开论述,详细介绍了5G网络架构和关键技术、5G网络规划与建设及5G融合业务应用与实践案例等。 本书内容丰富且深入浅出,适用于通信运营商、规划设计院、业务集成解决方案提供商、5G行业咨询机构等单位的相关技术人员参阅,同时也可以作为对口大专院校和科研机构研究生及教师的参考用书。
本书精讲数据结构与算法,对常见的算法及实现代码进行详细讲解,并配合具体的图表和教学视频,使读者轻松掌握数据结构知识并深入理解其中的算法思想。 本书共分8章,内容包括线性表、栈、队列、串、数组和广义表、树、图、查找、排序等。本书知识点涵盖全面,案例典型。本书习题大部分来自各大名校考研和 软件公司的笔试面试题目,是作者多年来的教学实践经验的总结。本书案例代码全部在Visual C++开发环境运行通过,并配套教学视频,方便读者自学。 本书适合C语言数据结构与算法的初学者、数据结构与算法课程考试的学生、考研人员、算法竞赛选手,也可以作为高等院校和培训机构计算机相关专业师生的教学参考书。
在传统的数据处理流程中,总是先收集数据,然后将数据放到DB中。当人们需要的时候通过DB对数据做query,得到答案或进行相关的处理。这样看起来虽然很好合理,但是结果却很好的紧凑,尤其是在一些实时搜索应用环境中的某些具体问题,类似于MapReduce方式的离线处理并不能很好地解决问题。这就引出了一种新的数据计算结构---流计算方式。它可以很好地对大规模流动数据在不断变化的运动过程中实时地进行分析,捕捉到可能有用的信息,并把结果发送到下一计算节点。本书讲解流计算原理。
本书结合理论和实践,由浅入深,全方位介绍了Hadoop这一高性能的海量数据处理和分析平台。全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。第Ⅱ部分介绍MapReduce,主题包括MapReduce应用开发;MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。第Ⅲ部分介绍Hadoop的运维,主题涉及构建Hadoop集群、管理Hadoop。第Ⅳ部分介绍Hadoop相关开源项目,主题涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供了三个案例,分别来自医疗卫生信息技术服务商塞纳(Cerner)、微软的人工智能项目ADAM(一种大规模分布式深度学习框架)和开源项目Cascading(一个新的针对MapReduce的数据处理API)。本书是一本权威、全面的Hadoop参考书和工具书,阐述了Hadoop生态圈的近期新发展和应用,程序员可以从
《数据挖掘技术及其应用(精)》(作者杨杰、姚莉秀)系统地讲述了数据挖掘的基本概念和基本原理,并列举了在相应领域具有参考价值的算法及其改进和应用,是作者多年来从事教学和科研实践的成果。全书共9章,主要内容有:数据挖掘的基本概念和原理,数据预处理,各种分类、聚类和关联规则提取算法,以及在生物信息学、材料学中的实际应用案例。 《数据挖掘技术及其应用(精)》可用作计算机专业本科高年级学生或研究生的教材或参考书,也可供从事计算机信息处理、数据挖掘、工业优化等有关方面工作的科技人员参考。