全书分为三大部分: 主要讨论有关增强数据密集型应用系统所需的若干基本原则。首先开篇第1章即瞄准目标:可靠性、可扩展性与可维护性,如何认识这些问题以及如何达成目标。第2章我们比较了多种不同的数据模型和查询语言,讨论各自的适用场景。接下来第3章主要针对存储引擎,即数据库是如何安排磁盘结构从而提高检索效率。第4章转向数据编码(序列化)方面,包括常见模式的演化历程。 我们将从单机的数据存储转向跨机器的分布式系统,这是扩展性的重要一步,但随之而来的是各种挑战。所以将依次讨论数据远程复制(第5章)、数据分区(第6章)以及事务(第7章)。接下来的第8章包括分布式系统的更多细节,以及分布式环境如何达成一致性与共识(第9章)。 主要针对产生派生数据的系统,所谓派生数据主要指在异构系统中,如果无法用一个数
本书对可视化技术、交互技术以及数据分析方法进行了系统和全面的讲解。介绍了交互式可视化数据分析解决方案的设计标准,论述了设计中的影响因素以及工作流程的检验方法。读者可以从中了解可视化编码的基础知识,以及用于多元数据、时间数据、地理空间数据和图形数据等方面的众多可视化技术。 书中专门用一章的内容来介绍与可视化效果互动的常规概念,并且利用图示来说明现代交互技术如何推动可视化数据分析的发展。针对如今庞大而复杂的数据,本书涵盖了自动化分析计算支持可视化数据分析的相关内容,另外还介绍了多屏幕环境下的高级可视化概念、数据分析过程中的用户指南以及渐进式可视化数据分析等技术。 作者用简洁明了的术语以自上而下的视角解读了交互式可视化数据分析。众多真实案例和丰富的插图将使学生、本领域专家、数据密
利用这本书,你将学习以下内容:了解如何选择Spark转换实现优化的解决方案。探索强大的转换和归约,包括reduceByKey()、combineByKey()和mapPartitions()。理解数据分区以实现优化查询。使用PySpark设计模式构建和应用模型。对图数据应用motif查找算法。使用GraphFrames API分析图数据。对临床医学和基因组数据应用PySpark算法。学习如何在ML算法中使用和应用特征工程。了解并使用实用的数据设计模式。
本书的主要内容有:深入探讨BigQuery的内部工作方式,包括其整体架构。学习BigQuery支持的数据类型、函数和运算符。优化查询语句和schema,从而提高性能或降低成本。使用标准SQL中高级功能,如GIS、历史快照、DDL/DML、用户定义函数和脚本。使用BigQuery ML解决各类机器学习问题。学习如何保护数据、监控作业,以及授权用户。
随着MySQL越来越受欢迎,关于如何通过MySQL解决具体问题的疑问越来越多,这本书也应运而生。这本手册为需要快速的解决方案或技术,但没有时间从零开始解决MySQL问题的程序员或专家提供大量简短且重点突出的代码,数百个完整的示例,以及清晰简明的解说。 本书的主要内容包括: ?连接到服务器、执行查询,并获取结果。从MySQL服务器获取数据。存储、获取以及处理字符串。使用日期和时间。排序查询结果,生成汇总信息。评估数据集的特征。编写存储函数和过程。使用存储例程、触发器和计划事件。执行基本的MySQL管理员任务。理解MySQL的基础监视知识。
本书主要内容包括:基本模式篇介绍构建以及运行基于容器的云原生应用程序的核心原则与实践。行为模式篇介绍各类容器和平台交互的管理。结构化模式篇介绍通过组织容器解决特定的用例。配置模式篇介绍如何处理Kubernetes中应用程序的配置。安全模式篇介绍如何提高运行在Kubernetes之上的应用程序的安全性。高级模式篇涵盖更复杂的主题,例如操作器、自动伸缩以及集群内镜像构建等。
本书展示了如何系统地表达现实世界中的业务问题,从而可以利用数据挖掘技术来解决。重点介绍如何将业务问题的口头表达或模糊的描述首先转换为定性的模型,然后再转换为定义明确的定量模型用于解决问题。描述了通过数据挖掘所发现的这些结论如何转换为战略的或技术的实现。 本书回答了各行各业各个层次的经营管理者,数据挖掘工具的真正用户所面临的许多非常切实的问题,例如、数据挖掘技术能够在哪些领域中最有效地应用?如何建立挖掘模型,从而把业务问题转化为数据挖掘能够解决的形式?如何为数据挖掘工具准备数据?等等,并给出了实际解决方案。 主要内容: 如何发现、构建和提炼在业务情景中有用的模型 如何设计、发现和开发数据以便进行数据挖型 为各种业务情景挖掘数据的实用方法 用于构建模型和挖掘的综合、易用
《深入Access2010》由詹宁斯所著,这是全世界最专业、最全面、最实用的Access2010使用指南。Access专家Roger Jennings向您奉献了在使用Access2010的过程中遇到的任何问题的解决方案——创建更高效的数据库、编写更好的查询语句、建造更漂亮的报表、安全地在任何地方分享数据、实现自动化升级、应用程序的扩展等,让你更高效地处理相关问题!
本书主要面向数据库初学者和专家,以及Web开发人员,经过更新后涵盖了MySQL*版的强大功能。本书侧重于使用Python、PHP、Java、Perl和Ruby的API进行编程。本书包含两百多个技巧,你可以从中学习:使用mysql客户端,编写基于MySQL的程序。建表、加载数据,以及从表中选择数据。存储、获取和处理字符串。使用日期和时间。排序查询结果,生成汇总信息。使用存储例程、触发器和计划事件。导入、导出、验证,以及重新格式化数据。执行事务,统计应用。处理Web输入,根据查询结果生成Web网页。使用MySQL进行Web会话管理。安全防范和服务器管理。
《PHP、MySQL与JavaScript学习手册(第四版)》的主要内容有借助面向对象的编程基础,深入学习PHP。研究MySQL,从数据库结构到复杂查询。使用MySQLi扩展功能和PHP改进的MySQL接口。创建自适应用户窗口大小的动态PHP网页。管理cookies和会话,以及高级别的安全性。掌握JavaScript语言,以及带有jQuery的增强功能。调用Ajax进行后台浏览器/服务器通信。学会用CSS2和CSS3技能专业定制网页风格。实现所有新的HTML5特性,包括地理定位、音频、视频以及画布。
IaH. Witten, Eibe Frank and Mark A. Hall: Data Mining: Practical Machine Learning Tools and Techniques, Third Editio(ISBN 978-0-12-374856-0). Original English language editiocopyright 2011 by Elsevier Inc. All rights reserved. Authorized English language reprint editiopublished by the Proprietor. Copyright 2012 by Elsevier (Singapore) Pte Ltd. Printed iChina by China Machine Press under special arrangement with Elsevier (Singapore) Pte Ltd. This editiois authorized for sale iChina only, excluding Hong Kong, Macao SARs and Taiwan. Unauthorized export of this editiois a violatioof the Copyright Act. Violatioof this Law is subject to Civil and Criminal Penalties.