Spark SQL 是 Spark 技术体系中较有影响力的应用(Killer application),也是 SQL-on-Hadoop 解决方案 中举足轻重的产品。《Spark SQL内核剖析》由 11 章构成,从源码层面深入介绍 Spark SQL 内部实现机制,以及在实际业务场 景中的开发实践,其中包括 SQL 编译实现、逻辑计划的生成与优化、物理计划的生成与优化、Aggregatio算子和 Joi算子的实现与执行、Tungste优化技术、生产环境中的一些改造优化经验等。
《中国数据中心运维管理指针》主要针对数据中心运维管理、监控系统、基础设施管理技术,结合《数据中心设计规范》(GB50174-2013),总结了国内外数据中心技术发展情况,从技术、规范、设计及产品应用等方面进行了阐述。本书主要包括以下三个方面的内容:一、数据中心运维管理技术:数据中心运维白皮书简介、数据中心ITIL运维框架、数据中心运维组织架构、数据中心基础设施运维之监控系统、数据中心基础设施运维之日常工作、数据中心基础设施运维之应急处理、数据中心网络运维、数据中心客户服务、数据中心现场运维之基础工作、数据中心基础及应用平台运维、数据中心运维管理工具、数据中心运维质量保障体系、数据中心运维相关认证、数据中心运维之行业实例、数据中心能耗测评、数据中心运维之能效管理、数据中心测试验证和数据中心运维之供
postgresql是目前广泛应用的开源数据库管理。《PostgreSQL 数据库内核分析》从postgresql数据库的源代码入手,深入分析了该数据库管理的底层实现细节,揭示了数据库运行的基本原理。《PostgreSQL 数据库内核分析》的主要内容包括:postgresql数据库的体系结构、 存储管理、索引机制、查询编译、查询执行、并发控制机制以及安全等。每个主题都引用了大量的数据结构、图表等进行说明,使读者对实现过程和机理一目了然。
查询优化器是数据库中很重要的模块之一,只有掌握好查询优化的方法且了解查询优化的细节,在对数据库调优的过程中才能有的放矢,否则调优的过程就如无本之木、无源之水,虽上下求索而不得其法。本书揭示了PostgreSQL数据库中查询优化的实现技术细节,首先对子查询提升、外连接消除、表达式预处理、谓词下推、连接顺序交换、等价类推理等逻辑优化方法进行了详细描述,然后结合统计信息、选择率、代价对扫描路径创建、路径搜索方法、连接路径建立、Non-SPJ路径建立、执行计划简化与生成等进行了深度探索,使读者对PostgreSQL数据库的查询优化器有深层次的了解。本书适合数据库内核开发人员及相关领域的研究人员、数据库DBA、高等院校相关专业的本科生或者研究生阅读。
我们能相信统计么? 抛了5次硬币,结果都是正面,抛硬币是否肯定是正面?如何从高层的统计指标看透数据后面的本质?如何在大数据时代获取战略制高点,确定自己的职业发展定位?从一个互联网公司数据分析师的成长经历,为您娓娓道来,数据分析中的奇闻趣事、心得总结、方法技巧与哲学感悟。
本书以了解COBOL语言为基础,通过由浅入深的讲解,循序渐进地介绍了如何使用COBOL语言进行实际开发。同时在讲解的过程中,也穿插了部分IBM大型机的知识及其在实际应用中的操作。 本书共分14章,从内容上可分为COBOL的入门篇、高级处理篇与实战篇。入门篇介绍了掌握一门语言必须了解的基础知识,包括数据类型、流程控制和各种运算;高级处理篇是针对COBOL有难度的一些技术点,包括表、子程序、数据处理、VSAM面向对象等;实战篇是通过一个完整的实例带你走完一个用COBOL开发的流程。 本书通俗易懂,适合广大COBOL程序开发人员、大型机培训班学员和大专院校学生阅读,尤其适合具有编程基础的人员进行学习。
我们能相信统计么? 抛了5次硬币,结果都是正面,抛硬币是否肯定是正面?如何从高层的统计指标看透数据后面的本质?如何在大数据时代获取战略制高点,确定自己的职业发展定位?从一个互联网公司数据分析师的成长经历,为您娓娓道来,数据分析中的奇闻趣事、心得总结、方法技巧与哲学感悟。
本书重点介绍数据质量管理与安全管理的理论及应用。首先通过数据管理现况和问题的分析,提出数据质量管理的步必须是将各种来源的数据标准化,具有统一的数据格式和规则。书稿中强调了提高数据质量不仅可提高信息系统的质量,还可提高经营活动的质量。需要制定质量管理计划或执行具体的质量管理活动。定义了数据质量的准确性、一致性、可用性、可达性、及时性、安全性这6个标准以及对应的管理流程,划分了5个能力成熟度的等级,界定了从管理者到执行者等各个质量管理活动和责任。提出多项数据质量管理主要技术和各国实用案例,还进一步在Orange数据库中实践了数据质量诊断流程。书稿后半部针对日益增长的数据库安全性的需求,提出了安全管理系统构建、访问控制,数据伪装等具体可行的技术手段,最后还将数据安全技术推广到大数据的应用场景
本全书内容主要包括11章和三个附录,其中11章又分为两大部分,部分是一些基础的介绍性的内容,章和第二章完整地讲述了元数据的意义以及一些基本的概念,第三章则从总体上分明绍了当前主要的元数据标准。第二部分则根据无数据的仓储项目生命周期的各个阶段,分别在第四章到第九章介绍了元数据的工具的评估,元数据仓储项目的组织和人员的配置,如何制定元数据的项目计划,元数据体系的结构的设计,如何通过元数据来提高数据的质量以及元模型的构造,此外,第十章还详细地介绍了开发周期的各个阶段该交付的产品以及取得的阶段性的成果,后第十一章展望了元数据的未来发展的趋势。
本书从工业测控的实际应用出发,系统地讲述了虚拟仪器软件LabVIEW的测控应用技术。首先介绍了虚拟仪器的含义、功能、结构、特点和常用开发平台,接着系统地讲述了LabVIEW程序设计基本知识,然后通过基于板卡的测控系统、串口通信测控系统等19个典型应用实例,详细地讲解了利用LabVIEW设计测控程序的方法,帮助读者完整地掌握LabVIEW测控应用实战技术。书中提供的测控应用实例都有详细的操作步骤,读者可以按步骤用LabVIEW实现各种测控功能,因此实践操作性强是本书的一大特色。本书内容丰富,论述深入浅出,有较强的实用性和可操作性,可供自动化、计算机应用、电子信息、机电一体化、测控仪器等专业的高等院校师生阅读,还可供从事计算机测控系统研发的工程技术人员参考。
本书以了解COBOL语言为基础,通过由浅入深的讲解,循序渐进地介绍了如何使用COBOL语言进行实际开发。同时在讲解的过程中,也穿插了部分IBM大型机的知识及其在实际应用中的操作。 本书共分14章,从内容上可分为COBOL的入门篇、高级处理篇与实战篇。入门篇介绍了掌握一门语言必须了解的基础知识,包括数据类型、流程控制和各种运算;高级处理篇是针对COBOL有难度的一些技术点,包括表、子程序、数据处理、VSAM面向对象等;实战篇是通过一个完整的实例带你走完一个用COBOL开发的流程。 本书通俗易懂,适合广大COBOL程序开发人员、大型机培训班学员和大专院校学生阅读,尤其适合具有编程基础的人员进行学习。
财务管理对所有企业而言都具有重要战略意义。一个能全盘掌握企业信息,并能清晰地提供决策所需资料的数据处理系统将是企业提升财务管理系统的核心平台。Oracle公司是全球的信息管理软件及服务供应商,Oracle数据库已成为世界上使用最广泛的数据库系统之一。在市场竞争日趋激烈的今天,该系统可以为企业培养迅捷的反应能力和整合资源提供极大的便利。
书中描述了Python程序的基本构件:类型、操作符、语句、函数、模块、类以及异常,此外还介绍了更多高级主题,包括复杂的实例,最后讲述了如何使用Python定制库来创建大型程序。