本书结合理论和实践,由浅入深,多方面介绍了Hadoop这一高性能的海量数据处理和分析平台。全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。第Ⅱ部分介绍MapReduce,主题包括MapReduce应用开发;MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。第Ⅲ部分介绍Hadoop的运维,主题涉及构建Hadoop集群、管理Hadoop。第Ⅳ部分介绍Hadoop相关开源项目,主题涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供了三个案例,分别来自医疗卫生信息技术服务商塞纳(Cerner)、微软的人工智能项目ADAM(一种大规模分布式深度学习框架)和开源项目Cascading(一个新的针对MapReduce的数据处理API)。本书是一本很好不错、全面的Hadoop参考书和工具书,阐述了Hadoop生态圈的很新发展和应用,程序员可以
本书紧扣“大数据”这一时代主题,着眼于侦查领域大数据运用在法律研究方面的空白,构建起包括思维、模式、方法等全方位的大数据侦查体系,同时对大数据侦查可能产生的法律问题进行探讨,为侦查实务中大数据的运用提供方法、法律理论及程序上的指导。
《数据仓库(原书第4版)》系统讲述数据仓库的基本概念、基本原理以及建立数据仓库的方法和过程。主要内容包括;决策支持系统的发展、数据仓库环境结构、数据仓库设计、数据仓库粒度划分、数据仓库技术、分布式数据仓库、EIS系统和数据仓库的关系、外部和非结构化数据与数据仓库的关系、数据装载问题、数据仓库与Web、ERP与数据仓库以及数据仓库设计的复查要目。 《数据仓库(原书第4版)》是数据仓库之父撰写的关干数据仓库的最著作,既可作为相关专业的研究生教材,也是数据仓库的研究、开发和管理人员的指南。
《Oracle数据库管理与应用:基于Oracle12c版本(第2版)/高等教育精品教材》是一本全面介绍Oracle数据库技术基本架构、DBA管理和对象数据库等知识的教程。全书包括5部分共21章。部分讨论了Oracle数据库的基本架构,包括物理架构和逻辑架构,第二部分全面介绍了Oraclel2c的新特性——多租户数据库及Oracle常用的数据对象,第三部分全面介绍了Oracle数据库的PL/SQL语言,第四部分探讨了Oracle数据库的备份及恢复策略,第五部分详细介绍了基于Oracle数据库的对象关系数据库的设计方法、步骤及其实现脚本等。《Oracle数据库管理与应用:基于Oracle12c版本(第2版)/高等教育精品教材》内容全面、概念清晰、语言流畅、图文并茂,可作为高等院校计算机相关专业Oracle数据库课程的教材,也可供从事于计算机软件工作的科技人员(如数据分析系统、电子商务网站开发人员等)参阅。