我们能相信统计么? 抛了5次硬币,结果都是正面,抛硬币是否肯定是正面?如何从高层的统计指标看透数据后面的本质?如何在大数据时代获取战略制高点,确定自己的职业发展定位?从一个互联网公司数据分析师的成长经历,为您娓娓道来,数据分析中的奇闻趣事、心得总结、方法技巧与哲学感悟。
Spark SQL 是 Spark 技术体系中较有影响力的应用(Killer application),也是 SQL-on-Hadoop 解决方案 中举足轻重的产品。《Spark SQL内核剖析》由 11 章构成,从源码层面深入介绍 Spark SQL 内部实现机制,以及在实际业务场 景中的开发实践,其中包括 SQL 编译实现、逻辑计划的生成与优化、物理计划的生成与优化、Aggregatio算子和 Joi算子的实现与执行、Tungste优化技术、生产环境中的一些改造优化经验等。 《Spark SQL内核剖析》不属于入门级教程,需要读者对基本概念有的了解。在企业中任职的系统架构师和软件开发人员,以及对大数据、分布式计算和数据库系统实现感兴趣的研究人员,均适合阅读《Spark SQL内核剖析》。
Spark SQL 是 Spark 技术体系中较有影响力的应用(Killer application),也是 SQL-on-Hadoop 解决方案 中举足轻重的产品。《Spark SQL内核剖析》由 11 章构成,从源码层面深入介绍 Spark SQL 内部实现机制,以及在实际业务场 景中的开发实践,其中包括 SQL 编译实现、逻辑计划的生成与优化、物理计划的生成与优化、Aggregatio算子和 Joi算子的实现与执行、Tungste优化技术、生产环境中的一些改造优化经验等。 《Spark SQL内核剖析》不属于入门级教程,需要读者对基本概念有的了解。在企业中任职的系统架构师和软件开发人员,以及对大数据、分布式计算和数据库系统实现感兴趣的研究人员,均适合阅读《Spark SQL内核剖析》。
《数据质量管理基础》正文由7章组成(重点考虑关系型结构化数据):章简介数据质量问题;第2章展开讨论条件依赖理论;第3章阐述发现条件依赖,以及基于发现条件依赖检测数据不一致、修复数据的实践技术;第4章介绍依赖匹配作为数据去重的匹配规则;第5章重温经典的两个信息完整性假定,即封闭世界假定和开放世界假定,并提出和研究相对信息完整性理论;第6章进行数据时效性建模,以便时间戳缺失情况下,在数据库中进行实体值辨别并基于此返回查询结果;第7章探索数据质量问题之间的交互作用。
在这本书里,读者将会跟随作者一同对Oracle数据库的相关知识进行梳理,很终共同提炼出必须很先掌握的那部分知识,无论你是数据库开发、管理、优化、设计人员,还是从事Java、C的开发人员。接下来作者再将这部分知识中很实用的内容进一步提炼,浓缩出很精华的部分,分享给大家。这是“二八现象”的一次经典应用。这部分知识就是Oracle的物理体系结构、逻辑体系结构、表、索引以及表连接五大部分。通过阅读本书中的这些章节,读者将会在短时间内以一种有史以来很轻松的方式,完成对Oracle数据库的整体认识,不仅能解决工作中的常规问题,还能具备的设计和调优能力。通过对这些章节的学习,读者在Oracle的学习中会有极大的收获。然而,作者更希望看到的是:让读者的收获,不止Oracle。为达到此目的,作者精心将全书分成上下两篇,刚才所描述的具体知
?????Oracle RAC 12c????????????RAC???????????????????????????????RAC??????????????????????????????????????Oracle??????????????????????RAC One Node??11g????????Flex????12c?????????????RAC?????????????????????
郝忠孝所著的《时空数据库新理论》系统论述和分析了时空数据库、空间数据库、移动数据库等查询、空间数据推理新技术和新理论。全书共分8章。内容包括:基于Voronoi图的线段反向最近邻查询;空间数据间的序及数据查询;不确定性平面、区域的平面线段的近邻查询、平面动态线段的索引和查询;基于聚类的空间数据索引优化及代价分析;高维主存kNN查询,△-tree的非递归、递归深度,自底向上深度递归kNN查询,自顶向下主存△-tree的高维数据相似连接;区域对象间主方向关系的反关系推理、三维空间方向关系的表达与推理、基于定性坐标的位置表达及主方向关系推理等。 《时空数据库新理论》可作为计算机科学与技术学科、地理信息系统、机器人技术、人工智能、卫星遥感、气象分析、地质灾害分析等专业的高年级本科生或硕士生选修课教材,也可供从事上述
我们能相信统计么? 抛了5次硬币,结果都是正面,抛硬币是否肯定是正面?如何从高层的统计指标看透数据后面的本质?如何在大数据时代获取战略制高点,确定自己的职业发展定位?从一个互联网公司数据分析师的成长经历,为您娓娓道来,数据分析中的奇闻趣事、心得总结、方法技巧与哲学感悟。
郝忠孝所著的《时空数据库新理论》系统论述和分析了时空数据库、空间数据库、移动数据库等查询、空间数据推理新技术和新理论。全书共分8章。内容包括:基于Voronoi图的线段反向最近邻查询;空间数据间的序及数据查询;不确定性平面、区域的平面线段的近邻查询、平面动态线段的索引和查询;基于聚类的空间数据索引优化及代价分析;高维主存kNN查询,△-tree的非递归、递归深度,自底向上深度递归kNN查询,自顶向下主存△-tree的高维数据相似连接;区域对象间主方向关系的反关系推理、三维空间方向关系的表达与推理、基于定性坐标的位置表达及主方向关系推理等。 《时空数据库新理论》可作为计算机科学与技术学科、地理信息系统、机器人技术、人工智能、卫星遥感、气象分析、地质灾害分析等专业的高年级本科生或硕士生选修课教材,也可供从事上述
本书是由中国电子技术标准化研究院联合中国计算机用户协会数据中心分会编的系列蓝皮书之一。本书对中国数据中心的历史沿革、行业状况、发展趋势进行了阶段性的回顾和深入剖析,是对中国数据中心截至2018年年底发展状况的阶段性总结,是中国数据中心建设经验的翔实记录和未来发展的积极指引。本书是全面介绍我国数据中心产业政策和数据中心基础设施设备发展及应用情况的本蓝皮书,将对数据中心行业的发展起到重要的指导作用,适合数据中心相关从业人员阅读参考。
Power?Query?是Office?商业智能工具的重要组件,Office?2016?已经将其作为内置工具嵌入在“数据”选项卡中,可见微软非常重视此功能。Power?Query?集成了Access?和Excel?的功能,通过它可以对数据进行可视化菜单操作,完成对数据的提取、转换和加载。? 本书主要内容包括Power?Query?简介及安装、Power?Query?基本操作、Power?Query?应用案例、PowerQuery?结构组成、Power?Query?高级应用以及常用M?语言函数语法介绍。? 本书适合具备一定Excel?应用基础知识,了解Excel?基础函数应用的读者,另外也适合财务、统计、人力资源、客服、售后服务、电商等需要处理大量数据的朋友学习。?
本书覆盖了当前大数据处理领域的热门技术,包括Hadoop、Spark、Storm、Dremel、Drill等,详细分析了各种技术的应用场景和优缺点;同时阐述了大数据下的日志分析系统,重点讲解了ELK日志处理方案;最后分析了大数据处理技术的发展趋势。本书采用幽默的表述风格,使读者容易理解、轻松掌握;重点从各种技术的起源、设计思想、架构等方面阐述,以帮助读者从根源上悟出大数据处理之道。
本书从实战着手,通过实例讲述了使用JSP进行数据库应用系统开发的流程和编程技巧。全书共12章,章介绍了JSP的基本理论;第2章介绍了数据库的基本理论;第3章综合JSP与数据库系统开发两个方面进行讲解;第4章~1章以多个实用的管理系统为例,详细讲述了管理系统创建的过程;2章介绍了系统建模技术,包括UML建模和PowerDesigner建模。本书每个实例都包括需求分析、UML系统建模、数据库设计、界面设计以及代码实现等步骤。其内容翔实,阐述清楚,各种复杂的技术难点都得以体现。 本书主要面向有JSP语言编程基础和对数据库编程有了解的读者,不仅适合广大使用JSP进行数据库系统开发的软件开发人员参考使用,而且对高等院校计算机专业的学生进行毕业设计具有较高的参考价值。
本书是为以Visual FoxPro作为开发工具的程序开发人员提供的开发案例参考书,作者以商业应用开发者的经验为基础,介绍在使用Visual FoxPro进行开发时的所有典型开发模式及应用案例。内容包括单用户应用程序模式开发案例、多用户共享数据库模式开发案例、客户/服务器模式开发案例、多层架构Web服务模式开发案例,以及使用ActiveX控件和API函数来扩展Visual FoxPro程序功能的开发案例。 本书适合广大Visual FoxPro初、中级程序开发人员学习,也适合Visual FoxPro高级程序员参考。