全书分为三大部分: 主要讨论有关增强数据密集型应用系统所需的若干基本原则。首先开篇第1章即瞄准目标:可靠性、可扩展性与可维护性,如何认识这些问题以及如何达成目标。第2章我们比较了多种不同的数据模型和查询语言,讨论各自的适用场景。接下来第3章主要针对存储引擎,即数据库是如何安排磁盘结构从而提高检索效率。第4章转向数据编码(序列化)方面,包括常见模式的演化历程。 我们将从单机的数据存储转向跨机器的分布式系统,这是扩展性的重要一步,但随之而来的是各种挑战。所以将依次讨论数据远程复制(第5章)、数据分区(第6章)以及事务(第7章)。接下来的第8章包括分布式系统的更多细节,以及分布式环境如何达成一致性与共识(第9章)。 主要针对产生派生数据的系统,所谓派生数据主要指在异构系统中,如果无法用一个数
本书围绕精益创业展开讨论,融合了精益创业法、客户开发、商业模式画布和敏捷/持续集成的精华。本书汇聚了100多位创始人、投资人、内部创业者和创新者的成功创业经验,呈现了 30 多个极具价值的案例分析,可以为各阶段的创业者提供行为准则。 如果你是一名创业者,或者你是一名产品开发、产品管理、市场营销、公共关系和投资领域的商务专业人员,那么本书不容错过。
《Hadoop海量数据处理》从Hadoop的基础知识讲起,逐步深入Hadoop分布式文件系统(HDFS)和MapReduce分布式编程框架的核心技术,帮助读者全面、系统、深入地理解Hadoop海量数据处理技术的精髓。本书在讲解技术原理时穿插大量的典型示例,并详解两个典型项目实战案例,帮助读者提高实际项目开发水平。 《Hadoop海量数据处理》共15章,分为4篇。第1篇Hadoop基础知识,包括大数据概述、Hadoop概述、Hadoop环境搭建与配置;第2篇Hadoop分布式存储技术,包括HDFS概述、HDFS基础操作、HDFS的读写原理和工作机制、Hadoop 3.x的新特性;第3篇MapReduce分布式编程框架,包括MapReduce概述、MapReduce开发基础、MapReduce框架的原理、MapReduce数据压缩、YARN资源调度器、Hadoop企业级优化;第4篇项目实战,包括Hadoop高可用集群搭建实战和统计TopN经典项目案例实战。 《Hadoop海量数据处理》通俗易懂、案
利用这本书,你将学习以下内容:了解如何选择Spark转换实现优化的解决方案。探索强大的转换和归约,包括reduceByKey()、combineByKey()和mapPartitions()。理解数据分区以实现优化查询。使用PySpark设计模式构建和应用模型。对图数据应用motif查找算法。使用GraphFrames API分析图数据。对临床医学和基因组数据应用PySpark算法。学习如何在ML算法中使用和应用特征工程。了解并使用实用的数据设计模式。
Python凭借其简单、易读、可扩展性以及拥有巨大而活跃的科学计算社区,在需要分析、处理大量数据的金融行业得到了广泛而迅速的应用,并且成为该行业开发核心应用的编程语言。《Python金融大数据分析》提供了使用Python进行数据分析,以及开发相关应用程序的技巧和工具。 《Python金融大数据分析》总计分为3部分,共19章,部分介绍了Python在金融学中的应用,其内容涵盖了Python用于金融行业的原因、Python的基础架构和工具,以及Python在计量金融学中的一些具体入门实例;第2部分介绍了金融分析和应用程序开发中重要的Python库、技术和方法,其内容涵盖了Python的数据类型和结构、用matplotlib进行数据可视化、金融时间序列数据处理、高性能输入/输出操作、高性能的Python技术和库、金融学中需要的多种数学工具、数生成和过程模拟、Python统计学应用、Python和Excel的集
《Tableau8指南》对如何利用Tableau软件制作交互美观的仪表板做了详细而全面的介绍。全书主要分为7个主题:如何连接各种数据源、如何快速创建各种图形、如何创建地图及自定义地图、如何使用各种函数创建新的字段、如何使用参数、如何设计交互的仪表板以及如何共享仪表板并让其自动刷新,适合数据分析师、视觉设计师和对数据感兴趣的开发人员学习提高。如果你是初次接触Tableau软件,那么《Tableau8指南》对你大有帮助。书中对Tableau的每一步操作、每一个按钮的作用都有详尽的说明,加上Tableau8软件本身简单易用,读完本书可让你迅速掌握Tableau8的完整功能。如果你是Tableau软件的老用户,阅读《Tableau8指南》也能让你对Tableau8的细节功能有更深入的认识。例如,在Tableau8中,用蓝色标记的字段说明其值是离散的,用绿色标记的字段说明其值是连续的,而许多老用
本书是《Oracle . Edwards技术与应用丛书》系列丛书的基础篇,全书共分五章,通过介绍信息化的概念和内容,从而引出企业信息化的ERP的概念,及在企业实现ERP的软件应用系统Oracle . Edwards EnterpriseOne系统。进而以企业应用. Edwards EnterpriseOne为主线,通过一些模拟企业的使用场景,让读者学习. Edwards EnterpriseOne的基本应用功能、财务、分销和生产管理的使用方法、. Edwards的项目实施方法学和. Edwards OBA(Oracle Business Accelerated )(Oracle业务加速器)。本书兼顾需要Oracle . Edwards EnterpriseOne知识的各类相关读者,它是Oracle . Edwards EnterpriseOne系统的入门指南,通过阅读本书,读者可以对E有一个直观和感性的认识。
为推广数据中心的建设技术,贯彻执行国家标准,本书总结了数据中心供配电系统、空调系统、机柜系统和布线系统的理论和实践经验,阐述了数据中心用电设备对于电能的基本要求,介绍了数据中心环境要求、设备布局、空调系统规划、未来的发展趋势以及数据中心空调系统的评估和优化。
本书是华为 HCIA-openGauss 认证考试的官方教材。本书*对 openGauss 数据库进行概述;其次介绍了 openGauss 的体系架构及关键特性;接着讲解了 openGauss 数据库安装部署的过程,并对 openGauss数据库及核心对象进行了详细说明;还介绍了 SQL 基础,其中包括 SQL 操作符、常用函数和语法分类等;*介绍了华为云数据库GaussDB(for openGauss)及其应用场景。除了有*的知识讲解,本书还有综合案例,通过理论与案例结合,帮助*快速掌握 openGauss 数据库的开发技能。 本书不仅适合备考 HCIA-openGauss 认证的人员和从事软件开发工作的专业人员阅读,还适合高等院校相关专业的学生、准备投身数据库领域的人员及网络技术爱好者阅读。