本书介绍了 PostgreSQL 内部的工作原理,包括数据库对象的逻辑组织与物理实现,进程与内存的架构。并依次剖析了几个重要的子系统:查询处理、外部数据包装器、并发控制、清理过程、缓冲 区管理、WAL、备份及流复制。本书为 DBA 与系统开发者提供了一幅全景概念地图,有助于读者形 成对数据库实现的整体认识,亦可作为深入学习 PostgreSQL 源代码的导读手册,对于理解数据库原 理与 PostgreSQL 内部实现大有裨益。 本书适合数据库开发人员及相关领域的研究人员、数据库 DBA 及高等院校相关专业的学生阅读。
《数据质量管理基础》正文由7章组成(重点考虑关系型结构化数据):章简介数据质量问题;第2章展开讨论条件依赖理论;第3章阐述发现条件依赖,以及基于发现条件依赖检测数据不一致、修复数据的实践技术;第4章介绍依赖匹配作为数据去重的匹配规则;第5章重温经典的两个信息完整性假定,即封闭世界假定和开放世界假定,并提出和研究相对信息完整性理论;第6章进行数据时效性建模,以便时间戳缺失情况下,在数据库中进行实体值辨别并基于此返回查询结果;第7章探索数据质量问题之间的交互作用。
《数据质量管理基础》正文由7章组成(重点考虑关系型结构化数据):章简介数据质量问题;第2章展开讨论条件依赖理论;第3章阐述发现条件依赖,以及基于发现条件依赖检测数据不一致、修复数据的实践技术;第4章介绍依赖匹配作为数据去重的匹配规则;第5章重温经典的两个信息完整性假定,即封闭世界假定和开放世界假定,并提出和研究相对信息完整性理论;第6章进行数据时效性建模,以便时间戳缺失情况下,在数据库中进行实体值辨别并基于此返回查询结果;第7章探索数据质量问题之间的交互作用。
本书重点介绍数据质量管理与安全管理的理论及应用。首先通过数据管理现况和问题的分析,提出数据质量管理的步必须是将各种来源的数据标准化,具有统一的数据格式和规则。书稿中强调了提高数据质量不仅可提高信息系统的质量,还可提高经营活动的质量。需要制定质量管理计划或执行具体的质量管理活动。定义了数据质量的准确性、一致性、可用性、可达性、及时性、安全性这6个标准以及对应的管理流程,划分了5个能力成熟度的等级,界定了从管理者到执行者等各个质量管理活动和责任。提出多项数据质量管理主要技术和各国实用案例,还进一步在Orange数据库中实践了数据质量诊断流程。书稿后半部针对日益增长的数据库安全性的需求,提出了安全管理系统构建、访问控制,数据伪装等具体可行的技术手段,还将数据安全技术推广到大数据的应用场景。本
本书主要探讨在这个演算时代,"身份”的意义为何:演算法如何运作,在哪些层面控制了我们的生活,我们又该如何抵抗?演算法无所不在,组织全世界的数据。我们每一次使用电脑搜寻、按赞、点击与购买都是一个数据。这些复杂的系统规则,不只塑造我们在网络与现实生活中的知识与人际关系,还决定了我们的现在与未来的样貌,无论是否在线。