全书分为三大部分: 主要讨论有关增强数据密集型应用系统所需的若干基本原则。首先开篇第1章即瞄准目标:可靠性、可扩展性与可维护性,如何认识这些问题以及如何达成目标。第2章我们比较了多种不同的数据模型和查询语言,讨论各自的适用场景。接下来第3章主要针对存储引擎,即数据库是如何安排磁盘结构从而提高检索效率。第4章转向数据编码(序列化)方面,包括常见模式的演化历程。 我们将从单机的数据存储转向跨机器的分布式系统,这是扩展性的重要一步,但随之而来的是各种挑战。所以将依次讨论数据远程复制(第5章)、数据分区(第6章)以及事务(第7章)。接下来的第8章包括分布式系统的更多细节,以及分布式环境如何达成一致性与共识(第9章)。 主要针对产生派生数据的系统,所谓派生数据主要指在异构系统中,如果无法用一个数
K线图已经成为金融交易平台和图表程序的关键组成部分。使用这些图表,交易者们从中学习基础模式,用于解释价格走势历史,并预测未来市场。这本详细的指南向投资组合经理、量化分析师、策略师和分析师展示了如何使用Python来识别、扫描K线图模式,根据模式进行交易,并回测K线图模式的盈利能力。 金融作家、交易顾问和机构市场策略师Sofien Kaabar在本书中展示了如何创建K线图扫描器和指标,通过这些指标,我们可以比较不同模式的盈利能力。通过这本实践指南,你还将探索一种类似K线图的新型图表系统,以及从未介绍过的新模式。 通过这本书,你将学会: 创建并理解经典和现代K线图模式所需的条件。 学习这些模式背后的市场心理。 使用一个框架来学习如何进行交易策略的回测。 探索不同的图表系统并理解它们的局限性 在Python中导入不同时间框架的OHLC
本书完整全面地讲述数据挖掘的概念、方法、技术和近期新研究进展。本书对前两版做了全面修订,加强和重新组织了全书的技术内容,重点论述了数据预处理、频繁模式挖掘、分类和聚类等的内容,还全面讲述了OLAP和离
本书是目前有关数据挖掘在数据化运营实践领域比较全面和系统的著作,也是诸多数据挖掘书籍中为数不多的穿插大量真实的实践应用案例和场景的著作,更是创造性地针对数据化运营中不同分析挖掘课题类型,推出一一对应的分析思路集锦和相应的分析技巧集成,为读者提供“菜单化”实战锦囊的著作。作者结合自己数据化运营实践中大量的项目经验,用通俗易懂的“非技术”语言和大量活泼生动的案例,围绕数据分析挖掘中的思路、方法、技巧与应用,全方位整理、总结、分享,帮助读者深刻领会和掌握“以业务为核心,以思路为重点,以分析技术为辅佐”的数据挖掘实践应用宝典。全书共19章,分为三个部分:基础篇(~4章)系统介绍了数据分析挖掘和数据化运营的相关背景、数据化运营中“协调配合”的核心,以及实践中常见分析项目类型;实战篇(第6~
本书针对MySQL中高级用户,详细讲解MySQL高级使用技术。书中详解了每一个知识点以及数据库操作的方法和技巧。本书注重实战操作,帮助读者循序渐进地掌握MySQL中的各项高级技术。本书主要包括MySQL架构介绍、MySQL权限与安全、MySQL备份与还原、MySQL的高级特性、MySQL锁定机制、使用MySQLWorkbench管理数据库、SQL性能优化、MySQL服务器性能优化、MySQL性能监控、MySQLReplication、MySQLCluster实战、企业中MySQL的高可用架构实战。同时,本书还提供了所有示例的源码,读者可以直接查看和调用。本书适合有基础的MySQL数据库学习者,MySQL数据库开发人员和MySQL数据库管理人员,同时也能作为高等院校和培训学校相关专业师生的教学参考用书。
Spark SQL 是 Spark 技术体系中较有影响力的应用(Killer application),也是 SQL-on-Hadoop 解决方案 中举足轻重的产品。《Spark SQL内核剖析》由 11 章构成,从源码层面深入介绍 Spark SQL 内部实现机制,以及在实际业务场 景中的开发实践,其中包括 SQL 编译实现、逻辑计划的生成与优化、物理计划的生成与优化、Aggregatio算子和 Joi算子的实现与执行、Tungste优化技术、生产环境中的一些改造优化经验等。
随着大数据实时处理需求的强劲增长,Storm的出现填补了大数据处理生态系统的缺失,并被越来越多的公司所采用。集团数据平台事业部商家数据业务部正是最早使用Storm的技术团队之一。《Storm实战:构建大数据实时计算》是一本系统并且具有实践指导意义的Storm工具书和参考书,对Storm整个技术体系进行了全面的讲解,不仅包括对基本概念、特性的介绍,也涵盖了一些原理说明。实战性很强,各章节都提供了一些小案例,同时对于本地,以及集群环境的部署有详细介绍,易于理解,操作性强。《Storm实战:构建大数据实时计算》一共分为10章:章全面介绍了Storm的特性、能解决什么问题,以及和其他流计算系统的对比;第2章通过实际运行一个简单的例子,以及介绍本地环境和集群环境的搭建,让读者对Storm有了直观的认识;第3章深入讲解了Storm的基本概念,同时实现
《数据库系统:基础、设计及应用》系统地介绍了数据库系统的基础知识、设计方法以及应用技术,内容包括数据库系统基本概念,关系数据库基础知识,创建数据库的一般方法,SQL语言及其使用方法,数据库完整性与安全性知识,数据库应用程序设计的一般方法以及事务管理基础知识。 《数据库系统:基础、设计及应用》将知识讲解与实验指导融为一体,着重于讲解数据库系统的核心知识和常用技术,对于学习和实验过程中所涉及的语言(SQL语言等)与软件(SQLServer等)的介绍也力求准确、清晰,便于读者的学习和运用。 《数据库系统:基础、设计及应用》适用于高等院校本科生数据库课程的教学,也可供数据库爱好者或工程技术人员自学与参考。
本书比较全面系统地介绍了数据仓库(Data Warehouse)、联机分析处理(OLAP)、数据挖掘(Data Mining)等3个层次的基本概念、原理和应用技术。全书分成4篇,基本原理篇和设计建模篇的内容主要包括:数据仓库的基本概念、体系结构、创建过程、建模设计、项目规划,OLAP的基本概念、ROLAP和MOLAP的实现原理、OLAP模型设计,数据挖掘的基本概念、基本过程、常见模型和算法。产品介绍篇介绍了现有数据仓库厂商产品工具的基本情况,并对产品选择进行了一些分析。应用实践篇结合电信领域的实例,介绍了数据仓库项目在设计和实施中的关键问题。 本书的编写以理论联系实际为原则,内容系统全面,对于从事数据仓库研究、设计、开发等工作的人员具有宝贵的参考价值,对于需要了解数据仓库技术的系统集成人员、系统分析师、系统设计师也具有的参考价值。