《 区块链知识 大众普及版 》 本书只从外部来介绍区块链这个事物,注重的是普通人的理解,基本不涉及技术内容。内容覆盖了区块链常见知识的95%,适合大众了解和认识区块链。从区块链技术的诞生、特点、主要发展历程、热点概念、相关原理等内容都做了完整的介绍,并介绍了当前典型的区块链应用,如区块链电子发票,DCEP等。还介绍了区块链领域的监管、安全、危害等内容。同时分析了国内外对区块链的态度与指导思想,鼓励方向与政策等内容。 《区块链知识 技术普及版》 本书覆盖了区块链的技术基础知识,适合技术从业者从技术角度认知区块链。技术普及版用一种类似庖丁解牛的方式,将区块链技术的肌肉、骨骼、灵魂,逐一分解来讲解,是当前区块链知识技术分解比较完整和全面的一本书。 《图灵区块链》 有了《区块链知识-大众普及版
Spark SQL 是 Spark 技术体系中较有影响力的应用(Killer application),也是 SQL-on-Hadoop 解决方案 中举足轻重的产品。《Spark SQL内核剖析》由 11 章构成,从源码层面深入介绍 Spark SQL 内部实现机制,以及在实际业务场 景中的开发实践,其中包括 SQL 编译实现、逻辑计划的生成与优化、物理计划的生成与优化、Aggregatio算子和 Joi算子的实现与执行、Tungste优化技术、生产环境中的一些改造优化经验等。
本书重点介绍数据质量管理与安全管理的理论及应用。首先通过数据管理现况和问题的分析,提出数据质量管理的步必须是将各种来源的数据标准化,具有统一的数据格式和规则。书稿中强调了提高数据质量不仅可提高信息系统的质量,还可提高经营活动的质量。需要制定质量管理计划或执行具体的质量管理活动。定义了数据质量的准确性、一致性、可用性、可达性、及时性、安全性这6个标准以及对应的管理流程,划分了5个能力成熟度的等级,界定了从管理者到执行者等各个质量管理活动和责任。提出多项数据质量管理主要技术和各国实用案例,还进一步在Orange数据库中实践了数据质量诊断流程。书稿后半部针对日益增长的数据库安全性的需求,提出了安全管理系统构建、访问控制,数据伪装等具体可行的技术手段,最后还将数据安全技术推广到大数据的应用场景
本书是首本专注于利用R语言进行科研数据清洗的书籍,全书主要分为两大块,首块以简洁的内容向读者介绍R语言的入门知识,让读者了解并认识R语言,为后面的内容打下基础。全书大部分篇幅主要集中在第二块内容,即数据清洗的知识。作者从实际问题出发,详细的介绍了如何利用R语言处理科研中的数据,比如缺失值的插补,异常值的查找,长宽型数据结构的转换,时间日期数据的处理,文本数据的处理等,此外,作者也将数据清洗的内容进行了适当扩展,比如书中加入了R语言与数据库的连接方法,让大数据的处理更加得心应手。