《数据质量管理基础》正文由7章组成(重点考虑关系型结构化数据):章简介数据质量问题;第2章展开讨论条件依赖理论;第3章阐述发现条件依赖,以及基于发现条件依赖检测数据不一致、修复数据的实践技术;第4章介绍依赖匹配作为数据去重的匹配规则;第5章重温经典的两个信息完整性假定,即封闭世界假定和开放世界假定,并提出和研究相对信息完整性理论;第6章进行数据时效性建模,以便时间戳缺失情况下,在数据库中进行实体值辨别并基于此返回查询结果;第7章探索数据质量问题之间的交互作用。
在这本书里,读者将会跟随作者一同对Oracle数据库的相关知识进行梳理,很终共同提炼出必须很先掌握的那部分知识,无论你是数据库开发、管理、优化、设计人员,还是从事Java、C的开发人员。接下来作者再将这部分知识中很实用的内容进一步提炼,浓缩出很精华的部分,分享给大家。这是“二八现象”的一次经典应用。这部分知识就是Oracle的物理体系结构、逻辑体系结构、表、索引以及表连接五大部分。通过阅读本书中的这些章节,读者将会在短时间内以一种有史以来很轻松的方式,完成对Oracle数据库的整体认识,不仅能解决工作中的常规问题,还能具备的设计和调优能力。通过对这些章节的学习,读者在Oracle的学习中会有极大的收获。然而,作者更希望看到的是:让读者的收获,不止Oracle。为达到此目的,作者精心将全书分成上下两篇,刚才所描述的具体知
本书以管理和应用视角解读大数据,以大数据分析全生命周期为主线,从大数据的采集、存储、预处理、分析、可视化、治理等环节切入,对大数据管理与应用的理论、方法、工具和应用进行科学合理的组织。本书包含十六章,分为四篇:概念篇主要介绍大数据管理与应用的基本概念、分析的基本思路;基础篇主要介绍大数据管理与应用的数学基础和机器学习基础;技术篇主要介绍大数据管理应用的数据采集与存储技术、数据预处理技术、数据回归分析技术、数据分类分析技术、数据聚类分析技术、数据关联分析技术、深度学习技术、文本分析技术、Web分析技术、可视化技术、数据治理技术;平台与发展篇介绍大数据计算平台和综述大数据管理与应用的新进展。 本书可作为高等学校大数据管理与应用、信息管理与信息系统、数据科学与大数据技术等管理类、信息
本体描述了领域间的概念以及概念间的关系,是解决语义网上数据异质问题的方案。但是由于人类的主观性,同一个实体在不同本体中可能拥有不同的名称和描述方式,使得本体间存在异质问题。给定两个描述一系列离散的实体(实体可能是概念、关系和实例)的本体,确定这些本体间的关系的过程称为本体匹配,本体匹配可以有效地解决本体异质问题。当本体中的实体规模庞大的时候,本体匹配问题是一个复杂的(非线性问题且有很多局部很优解)和费时的(大规模问题)问题,因此近似的求解方法通常被用于确定本体匹配结果。源自这一观点,进化算法成为了求解本体匹配问题的有效方法。本书首先为本体概念层和实例层构建了不同的单目标、多目标和众目标模型,然后针对性地给出了各种进化算法(如混合进化算法,NSGA-II和MOEA/D)来求解这些模型。很后,还
本书从企业数字化转型入手,介绍企业如何通过OpenShift构建PaaS平台 实现DevOps 实现微服务治理和微服务的管理。 全书共分为部分: 部分PaaS能力建设。即本书的“PaaS三部曲”,包含第2-4章的内容,分别是:基于OpenShift构建企业级PaaS OpenShift在企业中的开发和运维实践 OpenShift在公有云上的实践。 第二部分DevOps能力建设。即本书的“DevOps两部曲”,包含第5-6章的内容,分别为:在OpenShift上实现DevOps DevOps在企业中的实践。 第三部分微服务能力建设。即本书“微服务三部曲”,包含第7-9章的内容,分别为:微服务介绍及Spring Cloud在OpenShift上落地 Istio架构介绍与安装部署 基于OpenShift和Istio实现微服务落地。 第四部分微服务管理。包含本书0章的内容。介绍基于OpenShft和红帽其他解决方案微服务的管理(API管理 分布式集成和流程自动化),并最终实现企业业务中台的建设。
本书分13章,分别从企业大数据战略定位、企业大数据落地实施和价值评估,以及大数据的变革与挑战这方面进行撰写,宏观上涵盖了企业战略决策和定位,微观上涵盖了大数据职能、思路、方法、流程、开发、应用、评估的整个环节。企业大数据的知识完整性也是本书的特色之一。