Spark SQL 是 Spark 技术体系中较有影响力的应用(Killer application),也是 SQL-on-Hadoop 解决方案 中举足轻重的产品。《Spark SQL内核剖析》由 11 章构成,从源码层面深入介绍 Spark SQL 内部实现机制,以及在实际业务场 景中的开发实践,其中包括 SQL 编译实现、逻辑计划的生成与优化、物理计划的生成与优化、Aggregatio算子和 Joi算子的实现与执行、Tungste优化技术、生产环境中的一些改造优化经验等。
《中国数据中心运维管理指针》主要针对数据中心运维管理、监控系统、基础设施管理技术,结合《数据中心设计规范》(GB50174-2013),总结了国内外数据中心技术发展情况,从技术、规范、设计及产品应用等方面进行了阐述。本书主要包括以下三个方面的内容:一、数据中心运维管理技术:数据中心运维白皮书简介、数据中心ITIL运维框架、数据中心运维组织架构、数据中心基础设施运维之监控系统、数据中心基础设施运维之日常工作、数据中心基础设施运维之应急处理、数据中心网络运维、数据中心客户服务、数据中心现场运维之基础工作、数据中心基础及应用平台运维、数据中心运维管理工具、数据中心运维质量保障体系、数据中心运维相关认证、数据中心运维之行业实例、数据中心能耗测评、数据中心运维之能效管理、数据中心测试验证和数据中心运维之供
本书介绍了 PostgreSQL 内部的工作原理,包括数据库对象的逻辑组织与物理实现,进程与内存的架构。并依次剖析了几个重要的子系统:查询处理、外部数据包装器、并发控制、清理过程、缓冲 区管理、WAL、备份及流复制。本书为 DBA 与系统开发者提供了一幅全景概念地图,有助于读者形 成对数据库实现的整体认识,亦可作为深入学习 PostgreSQL 源代码的导读手册,对于理解数据库原 理与 PostgreSQL 内部实现大有裨益。 本书适合数据库开发人员及相关领域的研究人员、数据库 DBA 及高等院校相关专业的学生阅读。
本书系统地介绍数据结构基础理论知识及算法设计方法,~7章从抽象数据类型的角度讨论各种基本类型的数据结构及其应用,主要包括线性表、栈和队列、串、数组和广义表、树和二叉树及图; 第8章和第9章主要讨论查找和排序的各种实现方法及其综合比较; 0章介绍数据结构课程实验的目的、步骤及内容; 录给出全书习题的参考答案。全书采用类C语言作为数据结构和算法的描述语言,随书配备电子教案。本书在内容选取上符合人才培养目标的要求及教学规律和认知规律,在组织编排上体现“先理论、后应用、理论与应用相结合”的原则,并兼顾学科的广度和深度,力求适用面广。本书具有结构严谨、层次清楚、概念准确、深入浅出、描述清晰等特点。
本书是在作者多年从事数据挖掘行业实践和相关科学研究的基础上编写而成,书中包括数据挖据理论研究及实际应用的现状分析、研究内容的组织框架、研究方法与技术路线的描述、数据挖掘理论及应用的综述、不确定性理论、多目标优化的分类器方法、模糊多目标优化的分类器模型和算法、基于粗糙集和统计贡献度的特征选择算法、基于粗糙集预处理和粗近似的多目标优化的分类器模型和算法以及基于模糊化、核方法和惩罚因子的多目标优化的分类器模型和算法等内容。本书含有不确定性多目标优化的数据挖掘在信用评分、Web客户忠诚度分析、蛋白质交互的热点区域预测以及重大疾病的医疗诊断和预测等几个经典领域中的实际应用的描述。最后,通过对研究内容和实际应用效果的总结,展望了进一步研究和应用的方向。本书可供从事数据挖掘、机器学习与知识工
本书主要探讨在这个演算时代,"身份”的意义为何:演算法如何运作,在哪些层面控制了我们的生活,我们又该如何抵抗?演算法无所不在,组织全世界的数据。我们每一次使用电脑搜寻、按赞、点击与购买都是一个数据。这些复杂的系统规则,不只塑造我们在网络与现实生活中的知识与人际关系,还决定了我们的现在与未来的样貌,无论是否在线。
数据作为一种基础性与战略性资源得到了广泛认可,数据服务成为很多组织和机构日常运营中必不可少的重要环节。当下,数据质量在理论越来越受到关注,不仅是制约数据产业发展的关键问题,也是大数据应用研究中绕不开的重大问题。《大数据质量》汇集了国内外数据质量研究的经典理论、技术和方法,以及的前沿发展趋势;首先介绍了传统数据质量研究的各种代表性成果,并在此基础上,分析大数据时代下数据质量面临的挑战,并详细介绍基于大数据的数据质量相关技术的实现;最后,通过一个实际案例,提出一套完整的大数据质量解决方案。
本书主要探讨在这个演算时代,"身份”的意义为何:演算法如何运作,在哪些层面控制了我们的生活,我们又该如何抵抗?演算法无所不在,组织全世界的数据。我们每一次使用电脑搜寻、按赞、点击与购买都是一个数据。这些复杂的系统规则,不只塑造我们在网络与现实生活中的知识与人际关系,还决定了我们的现在与未来的样貌,无论是否在线。