本书结合理论和实践,由浅入深,多方面介绍了Hadoop这一高性能的海量数据处理和分析平台。全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。第Ⅱ部分介绍MapReduce,主题包括MapReduce应用开发;MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。第Ⅲ部分介绍Hadoop的运维,主题涉及构建Hadoop集群、管理Hadoop。第Ⅳ部分介绍Hadoop相关开源项目,主题涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供了三个案例,分别来自医疗卫生信息技术服务商塞纳(Cerner)、微软的人工智能项目ADAM(一种大规模分布式深度学习框架)和开源项目Cascading(一个新的针对MapReduce的数据处理API)。本书是一本很好不错、全面的Hadoop参考书和工具书,阐述了Hadoop生态圈的很新发展和应用,程序员可以
在集团内,数据人员面临的现实情况是:集团数据存储已经达到EB级别,部分单张表每天的数据记录数高达几千亿条;在2016年“购物狂欢节”的24小时中,支付金额达到了1207亿元人民币,支付峰值高达12万笔/秒,下单峰值达17.5万笔/秒,媒体直播大屏处理的总数据量高达百亿级别且所有数据都需要做到实时、准确地对外披露……巨大的信息量给数据采集、存储和计算都带来了极大的挑战。《大数据之路——大数据实践》就是在此背景下完成的。本书中讲到的大数据系统架构,就是为了满足不断变化的业务需求,同时实现系统的高度扩展性、灵活性以及数据展现的高性能而设计的。本书由数据技术及产品部组织并完成写作,是分享对大数据的认知,与生态伙伴共创数据智能的重要基石。相信本书中的实践和思考对同行会有很大的启发和借鉴意义。
《Oracle数据库管理与应用:基于Oracle12c版本(第2版)/高等教育精品教材》是一本全面介绍Oracle数据库技术基本架构、DBA管理和对象数据库等知识的教程。全书包括5部分共21章。部分讨论了Oracle数据库的基本架构,包括物理架构和逻辑架构,第二部分全面介绍了Oraclel2c的新特性——多租户数据库及Oracle常用的数据对象,第三部分全面介绍了Oracle数据库的PL/SQL语言,第四部分探讨了Oracle数据库的备份及恢复策略,第五部分详细介绍了基于Oracle数据库的对象关系数据库的设计方法、步骤及其实现脚本等。《Oracle数据库管理与应用:基于Oracle12c版本(第2版)/高等教育精品教材》内容全面、概念清晰、语言流畅、图文并茂,可作为高等院校计算机相关专业Oracle数据库课程的教材,也可供从事于计算机软件工作的科技人员(如数据分析系统、电子商务网站开发人员等)参阅。
随着The Data Warehouse Toolkit(1996)版的出版发行,Ralph Kimball为整个行业引入了维度建模技术。从此,维度建模成为一种被广泛接受的表达数据仓库和商业智能(DW/BI)系统中数据的方法。该经典书籍被认为是维度建模技术、模式和实践的资源。 这本《数据仓库工具箱(第3版)——维度建模指南》汇集了到目前为止最全面的维度建模技术。本书采用新的思路和实践对上一版本进行了全面修订,给出了设计维度模型的全面指南,既适合数据仓库新手,也适合经验丰富的专业人员。 本书涉及的所有技术都基于作者实际从事DW/BI的设计经验,通过实际案例加以描述。 主要内容 实用设计技术——有关维度和事实表的基本和高级技术 14个案例研究,涉及零售业、电子商务、客户关系管理、采购、库存、订单管理、会计、人力资源、金融服务、医疗卫生、