《数据恢复技术深度揭秘》第二版是在第一版的基础之上增加和充实了服务器磁盘阵列(RAID)的恢复技术,新增了大量实战案例的分析和讲解,并精选书中的部分案例由作者制作成视频教学资料(DVD光盘)随书附赠。
MongoDB自2009年推出以来,历经了近十年的发展,在这十年中,数据库领域可谓经历了翻天覆地的变化。本书深入剖析MongoDB新旧版本的特性,结合生产案例详细讲解MongoDB的常见故障;学习MongoDB索引,以便更好地掌握MongoDB性能调优技巧;描述备份恢复的重要性,让读者掌握MongoDB备份恢复技巧;充分利用MongoDB的水平扩展能力,详解MongoDB复制集、分片架构环境;很后讲解如何使用PMM性能监控平台,做好线上MongoDB的监控工作。
《中国数据中心运维管理指针》主要针对数据中心运维管理、监控系统、基础设施管理技术,结合《数据中心设计规范》(GB50174-2013),总结了外数据中心技术发展情况,从技术、规范、设计及产品应用等方面进行了阐述。本书主要包括以下三个方面的内容:一、数据中心运维管理技术:数据中心运维白皮书简介、数据中心ITIL运维框架、数据中心运维组织架构、数据中心基础设施运维之监控系统、数据中心基础设施运维之日常工作、数据中心基础设施运维之应急处理、数据中心网络运维、数据中心客户服务、数据中心现场运维之基础工作、数据中心基础及应用平台运维、数据中心运维管理工具、数据中心运维质量保障体系、数据中心运维相关认证、数据中心运维之行业实例、数据中心能耗测评、数据中心运维之能效管理、数据中心测试验证和数据中心运维之供应商
本书提供了全面、实用的建议,以保证在复杂的生产环境中,能可靠且高效地运行Oracle 数据库。七位主要的Oracle 专家对Oracle 12c、11g 和其他很近版本的Oracle 数据库汇集了一系列经过验证的解决方案、实践的例子以及循序渐进的技巧。每一个解决方案都是精心设计的,以帮助有经验的Oracle DBA和DMA 尽可能快地理解和修复严重的问题。本书不仅涵盖了LOB 段、undo 表空间、高GC 缓冲区等待事件、糟糕的查询响应时间、闩锁争用、索引、XA 分布式事务、RMAN 备份/ 恢复等内容,还深入地讲解了DDL 优化、VLDB 调优、数据库取证、自适应游标共享、数据泵、数据迁移、SSD、索引等内容,并介绍了如何解决Oracle RAC 问题。
《数据建模与DB设计》重点介绍数据建模与数据库设计的理论及应用。从数据模型的发展历程及其必要性引入,基于作者在研究和项目实践中积累的经验,让读者理解数据建模是业务负责人与数据设计者之间沟通的工具,数据模型决定数据处理性能与数据管理便利性。书中首先将数据建模划分为概念建模、逻辑建模、物理建模以及最后的数据库设计四个阶段,明确了导出实体、设定实体的重要关系、设定键的数据建模流程。为了提高数据整合性和业务流程性能,先后提出了范式化和反范式化过程,在构建理解的数据结构的同时兼顾数据库的访问成本,寻找盈亏平衡点。《数据建模与DB设计》无论对数据分析设计领域的初学者还是实际业务的实践者,都很有启发和指导作用。
本书全面介绍了数据开发利用技术,包括大数据计算、大数据管理、大数据安全、大数据可视化、数据自治、数据爬虫、知识图谱、大数据挖掘、深度学习、区块链等技术,还介绍了数据产品生产技术。这些技术涵盖了数据获取与管理、数据分析与应用、数据安全与流通等数据开发利用的各个环节,形成一个较为完整的大数据技术体系。
本书在广泛调研、深入研究和实际应用基础上,详细解析数据中心基础设施具体包括供电、制冷、监控和机柜等各部分的设备级、系统级、整体级测试技术及维护测试技术,并作了较为深刻的经验总结。本书的编写与出版,不仅填补了数据中心测试技术研究书籍的空白,而且实际案例解析资料丰富、分析深入透彻、具有较高的系统性、创新性和实用性,为保障数据中心基础设施领域可靠、安全、稳定运行具有重要的参考价值与现实意义。
特征选择是机器学习的重要研究内容,有着广泛的应用价值。特征选择主要从数据(尤其是高维数据)中选取有效特征来表示数据,从而提高机器学习算法的性能。《高维数据的特征选择:理论与算法》以重庆工商大学等单位的机器学习、图像处理课题为基础,系统地介绍特征选择的基本概念,以及相关的理论和算法,也对它的前沿研究(如无监督特征选择)和其在计算机视觉中的应用进行详细介绍,最后对特征选择的发展方向进行展望。 《高维数据的特征选择:理论与算法》理论联系实际,对教学、科研具有重要指导意义,可作为高等院校和科研机构从事机器学习的学者的参考书,亦可供从事大数据分析(如基因数据、计算机视觉)的专业技术人员参考。
查询优化器是数据库中很重要的模块之一,只有掌握好查询优化的方法且了解查询优化的细节,在对数据库调优的过程中才能有的放矢,否则调优的过程就如无本之木、无源之水,虽上下求索而不得其法。本书揭示了PostgreSQL数据库中查询优化的实现技术细节,首先对子查询提升、外连接消除、表达式预处理、谓词下推、连接顺序交换、等价类推理等逻辑优化方法进行了详细描述,然后结合统计信息、选择率、代价对扫描路径创建、路径搜索方法、连接路径建立、Non-SPJ路径建立、执行计划简化与生成等进行了深度探索,使读者对PostgreSQL数据库的查询优化器有深层次的了解。本书适合数据库内核开发人员及相关领域的研究人员、数据库DBA、高等院校相关专业的本科生或者研究生阅读。
数据作为一种基础性与战略性资源得到了广泛认可,数据服务成为很多组织和机构日常运营中必不可少的重要环节。当下,数据质量在理论越来越受到关注,不仅是制约数据产业发展的关键问题,也是大数据应用研究中绕不开的重大问题。《大数据质量》汇集了国内外数据质量研究的经典理论、技术和方法,以及的前沿发展趋势;首先介绍了传统数据质量研究的各种代表性成果,并在此基础上,分析大数据时代下数据质量面临的挑战,并详细介绍基于大数据的数据质量相关技术的实现;最后,通过一个实际案例,提出一套完整的大数据质量解决方案。
本书覆盖了当前大数据处理领域的热门技术,包括Hadoop、Spark、Storm、Dremel、Drill等,详细分析了各种技术的应用场景和优缺点;同时阐述了大数据下的日志分析系统,重点讲解了ELK日志处理方案;分析了大数据处理技术的发展趋势。本书采用幽默的表述风格,使读者容易理解、轻松掌握;重点从各种技术的起源、设计思想、架构等方面阐述,以帮助读者从根源上悟出大数据处理之道。
《中国数据中心运维管理指针》主要针对数据中心运维管理、监控系统、基础设施管理技术,结合《数据中心设计规范》(GB50174-2013),总结了外数据中心技术发展情况,从技术、规范、设计及产品应用等方面进行了阐述。本书主要包括以下三个方面的内容:一、数据中心运维管理技术:数据中心运维白皮书简介、数据中心ITIL运维框架、数据中心运维组织架构、数据中心基础设施运维之监控系统、数据中心基础设施运维之日常工作、数据中心基础设施运维之应急处理、数据中心网络运维、数据中心客户服务、数据中心现场运维之基础工作、数据中心基础及应用平台运维、数据中心运维管理工具、数据中心运维质量保障体系、数据中心运维相关认证、数据中心运维之行业实例、数据中心能耗测评、数据中心运维之能效管理、数据中心测试验证和数据中心运维之供应商
在阿里巴巴集团内,数据人员面临的现实情况是:集团数据存储已经达到EB级别,部分单张表每天的数据记录数高达几千亿条;在2016年“双11购物狂欢节”的24小时中,支付金额达到了1207亿元人民币,支付峰值高达12万笔/秒,下单峰值达17.5万笔/秒,媒体直播大屏处理的总数据量高达百亿级别且所有数据都需要做到实时、准确地对外披露……巨大的信息量给数据采集、存储和计算都带来了极大的挑战。 《大数据之路:阿里巴巴大数据实践》就是在此背景下完成的。《大数据之路:阿里巴巴大数据实践》中讲到的阿里巴巴大数据系统架构,就是为了满足不断变化的业务需求,同时实现系统的高度扩展性、灵活性以及数据展现的高性能而设计的。 《大数据之路:阿里巴巴大数据实践》由阿里巴巴数据技术及产品部组织并完成写作,是阿里巴巴分享对