《Spark大数据技术与应用/大数据应用型人才培养规划教材》共分为10章,~8章阐述了spark核心组件的用法,以及使用相应组件进行大数据分析应用的方法,通过综合性实践案例将理论和实践相结合;第9~10章通过两个综合实例让读者从理论阶段上升到实际应用层面,可以帮助读者更深入理解Spark的使用方法。 《Spark大数据技术与应用/大数据应用型人才培养规划教材》作为大数据分析与内存计算的入门教材,希望能够帮助读者打开大数据分析与应用的大门。《Spark大数据技术与应用/大数据应用型人才培养规划教材》采用理论结合实践的方式,循序渐进地介绍了Spark的运行原理,并引入综合性的实践案例,以引导读者运用所学知识解决现实中的问题。
(1) 概念篇:介绍当前紧密关联的IT领域技术云计算、大数据和物联网。 (2) 大数据存储与管理篇:介绍分布式数据存储的概念、原理和技术,包括HDFS、HBase、NoSQL数据库、云数据库。 (3) 大数据处理与分析篇:介绍MapReduce分布式编程框架、基于内存的分布式计算框架Spark、图计算、流计算、数据可视化。 (4) 大数据应用篇:介绍基于大数据技术的。
这是一本系统剖析Greenplum开源大数据平台的书籍,也是大数据战略制定与落地的实战型指导书! 本书围绕数字原生和云计算、大数据、人工智能驱动的企业数字化转型的核心诉求,从商业和技术实战视角分享了业界领先企业大数据战略的深刻思考,并提供了大数据战略从制定到落地的全面指导。既有高阶数字化战略高度对大数据的解读,又有技术实战角度对使用 Greenplum 大数据和机器学习平台实现大数据战略的实践指南。 本书作者来自Greenplum 核心研发团队,致力于以开源、开放的理念和先进的技术推进大数据产业生态,助力企业以更低的成本、更高的效率实现数字化转型,并基于Greenplum 开源社区培养大数据产业更多人才。 本书分为四个部分。 部分介绍大数据战略。其中, 章将分享作者对于人工智能、大数据和云计算
本书以云计算为基石,从概念、研究、应用角度出发,系统地介绍了数据爆炸时代下的大数据。首先介绍了云计算及大数据的基础知识,让读者对云计算及大数据有概要认识;然后根据需要介绍了Hadoop软件下的MapReduce、HDFS及HBase这几个组件;接着全面、系统地介绍了云时代下的大数据,主要包括大数据的链接、聚类、项集、系统、相似项挖掘及数据量化等内容,让读者挖掘云时代大数据体系下的效益、价值及研究方向。
随着TheDataWarehouseToolkit(1996)版的出版发行,RalphKimball为整个行业引入了维度建模技术。从此,维度建模成为一种被广泛接受的表达数据仓库和商业智能(DW/BI)系统中数据的方法。该经典书籍被认为是维度建模技术、模式和实践的资源。这本《数据仓库工具箱(第3版)——维度建模指南》汇集了到目前为止最全面的维度建模技术。本书采用新的思路和实践对上一版本进行了全面修订,给出了设计维度模型的全面指南,既适合数据仓库新手,也适合经验丰富的专业人员。本书涉及的所有技术都基于作者实际从事DW/BI的设计经验,通过实际案例加以描述。主要内容实用设计技术——有关维度和事实表的基本和高级技术14个案例研究,涉及零售业、电子商务、客户关系管理、采购、库存、订单管理、会计、人力资源、金融服务、医疗卫生、保险、教育、电信和运输等为12
《大嘴巴漫谈数据挖掘(第2季产品篇)》沿袭季图文的轻松易懂的写作形式,以产品构想、原型设计、测试、上市商用的产品生命周期为主线,用数据挖掘的手段对用户需求与市场竞争环境,以秉承以用户为中心的理念,综合技术、市场两种驱动能力,以科学严谨的方法,进行准确有效的收集并分析,为产品运营、业务支撑和数据管理等相关人员的工作提供系统化的指导,进一步辅助企业管理人员解决经营决策中所面临的问题。。