全书分为三大部分: 主要讨论有关增强数据密集型应用系统所需的若干基本原则。首先开篇第1章即瞄准目标:可靠性、可扩展性与可维护性,如何认识这些问题以及如何达成目标。第2章我们比较了多种不同的数据模型和查询语言,讨论各自的适用场景。接下来第3章主要针对存储引擎,即数据库是如何安排磁盘结构从而提高检索效率。第4章转向数据编码(序列化)方面,包括常见模式的演化历程。 我们将从单机的数据存储转向跨机器的分布式系统,这是扩展性的重要一步,但随之而来的是各种挑战。所以将依次讨论数据远程复制(第5章)、数据分区(第6章)以及事务(第7章)。接下来的第8章包括分布式系统的更多细节,以及分布式环境如何达成一致性与共识(第9章)。 主要针对产生派生数据的系统,所谓派生数据主要指在异构系统中,如果无法用一个数
本书对可视化技术、交互技术以及数据分析方法进行了系统和全面的讲解。介绍了交互式可视化数据分析解决方案的设计标准,论述了设计中的影响因素以及工作流程的检验方法。读者可以从中了解可视化编码的基础知识,以及用于多元数据、时间数据、地理空间数据和图形数据等方面的众多可视化技术。 书中专门用一章的内容来介绍与可视化效果互动的常规概念,并且利用图示来说明现代交互技术如何推动可视化数据分析的发展。针对如今庞大而复杂的数据,本书涵盖了自动化分析计算支持可视化数据分析的相关内容,另外还介绍了多屏幕环境下的高级可视化概念、数据分析过程中的用户指南以及渐进式可视化数据分析等技术。 作者用简洁明了的术语以自上而下的视角解读了交互式可视化数据分析。众多真实案例和丰富的插图将使学生、本领域专家、数据密
随着MySQL越来越受欢迎,关于如何通过MySQL解决具体问题的疑问越来越多,这本书也应运而生。这本手册为需要快速的解决方案或技术,但没有时间从零开始解决MySQL问题的程序员或专家提供大量简短且重点突出的代码,数百个完整的示例,以及清晰简明的解说。 本书的主要内容包括: ?连接到服务器、执行查询,并获取结果。从MySQL服务器获取数据。存储、获取以及处理字符串。使用日期和时间。排序查询结果,生成汇总信息。评估数据集的特征。编写存储函数和过程。使用存储例程、触发器和计划事件。执行基本的MySQL管理员任务。理解MySQL的基础监视知识。
利用这本书,你将学习以下内容:了解如何选择Spark转换实现优化的解决方案。探索强大的转换和归约,包括reduceByKey()、combineByKey()和mapPartitions()。理解数据分区以实现优化查询。使用PySpark设计模式构建和应用模型。对图数据应用motif查找算法。使用GraphFrames API分析图数据。对临床医学和基因组数据应用PySpark算法。学习如何在ML算法中使用和应用特征工程。了解并使用实用的数据设计模式。
本书的主要内容有:深入探讨BigQuery的内部工作方式,包括其整体架构。学习BigQuery支持的数据类型、函数和运算符。优化查询语句和schema,从而提高性能或降低成本。使用标准SQL中高级功能,如GIS、历史快照、DDL/DML、用户定义函数和脚本。使用BigQuery ML解决各类机器学习问题。学习如何保护数据、监控作业,以及授权用户。
《深入Access2010》由詹宁斯所著,这是全世界最专业、最全面、最实用的Access2010使用指南。Access专家Roger Jennings向您奉献了在使用Access2010的过程中遇到的任何问题的解决方案——创建更高效的数据库、编写更好的查询语句、建造更漂亮的报表、安全地在任何地方分享数据、实现自动化升级、应用程序的扩展等,让你更高效地处理相关问题!
本书展示了如何系统地表达现实世界中的业务问题,从而可以利用数据挖掘技术来解决。重点介绍如何将业务问题的口头表达或模糊的描述首先转换为定性的模型,然后再转换为定义明确的定量模型用于解决问题。描述了通过数据挖掘所发现的这些结论如何转换为战略的或技术的实现。 本书回答了各行各业各个层次的经营管理者,数据挖掘工具的真正用户所面临的许多非常切实的问题,例如、数据挖掘技术能够在哪些领域中最有效地应用?如何建立挖掘模型,从而把业务问题转化为数据挖掘能够解决的形式?如何为数据挖掘工具准备数据?等等,并给出了实际解决方案。 主要内容: 如何发现、构建和提炼在业务情景中有用的模型 如何设计、发现和开发数据以便进行数据挖型 为各种业务情景挖掘数据的实用方法 用于构建模型和挖掘的综合、易用