本书完整全面地讲述数据挖掘的概念、方法、技术和近期新研究进展。本书对前两版做了全面修订,加强和重新组织了全书的技术内容,重点论述了数据预处理、频繁模式挖掘、分类和聚类等的内容,还全面讲述了OLAP和离群点检测,并研讨了挖掘网络、复杂数据类型以及重要应用领域。 本书是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都推荐阅读的参考书,是一本适用于数据分析、数据挖掘和知识发现课程的优秀教材,可以用做高年级本科生或者一年级研究生的数据挖掘导论教材。
该书基于通用的Excel、 SPSS工具, 加上必知必会的数据分析概念, 以图文并茂、 理论与实操相结合的方式, 按照CDA人才培养考核要求进行编写。全书分为6章, 分别为数据分析概述、 数据收集与导入、 数据的清洗与预处理、 数据可视化呈现、 基础数据分析、 综合分析。本书适合数据分析零基础群体读者阅读, 也可供大学生、 初入数据分析职场人员、 参与CDA考试的人员学习使用。
可视化是数据描述的图形表示,旨在一目了然地揭示数据中的复杂信息。可视化的典型如纽约地铁图和人脑图。成功的可视化的美丽之处既在于其艺术设计,也在于其通过对细节的优雅展示,能够有效地产生对数据的洞察和新的理解。 在本书中,20多位可视化专家包括艺术家、设计师、评论家、科学家、分析师、统计学家等,展示了他们如何在各自的学科领域内开展项目。他们共同展示了可视化所能实现的功能以及如何使用它来改变世界。在《数据可视化之美》中,你将: · 通过简单的可视化实践探索讲故事的重要性。 · 了解颜色如何传达我们尚未充分意识到而大脑已经识别出的信息。 · 发现我们购买的书籍和我们的交际圈如何揭示内心的自我。 · 通过对民航交通的可视化探索识别航空旅行的混乱的一种方法。 · 揭秘研究人员如何调查未知问题,包括从最
在Oracle 12c 版本之前,数据库版本的迭代中基本架构都没有非常明显的变化,但从Oracle 12c版本开始,引入了很多新特性,其主要的特性颠覆了之前的概念,尤其是引入了多租户的概念。本书主要针对Oracle 12c 版本以后的新特性进行讲解。本书在编写的过程中,以Oracle 18c 为环境进行测试,内容涵盖Oracle 18c 的多租户架构、In-Memory 特性的使用、ASMFD、Flex ASM,以及RAC集群环境中的GIMR 和CHM。通过学习本书的内容,读者可以快速掌握Oracle 12c 和Oracle 18c 的管理和使用方法。本书不是一本基础的入门图书,在阅读本书时需要对Oracle 的基本概念有的了解,同时具备的实际操作能力,本书适合Oracle 运维人员和具备Oracle 基础的开发人员阅读。
Spark SQL 是 Spark 技术体系中较有影响力的应用(Killer application),也是 SQL-on-Hadoop 解决方案 中举足轻重的产品。《Spark SQL内核剖析》由 11 章构成,从源码层面深入介绍 Spark SQL 内部实现机制,以及在实际业务场 景中的开发实践,其中包括 SQL 编译实现、逻辑计划的生成与优化、物理计划的生成与优化、Aggregatio算子和 Joi算子的实现与执行、Tungste优化技术、生产环境中的一些改造优化经验等。 《Spark SQL内核剖析》不属于入门级教程,需要读者对基本概念有的了解。在企业中任职的系统架构师和软件开发人员,以及对大数据、分布式计算和数据库系统实现感兴趣的研究人员,均适合阅读《Spark SQL内核剖析》。
oracle rac 11g是oracle公司推出的集群数据库版本。《Oracle RAC 11g实战指南》从实用的角度出发,详细介绍了rac的安装过程和管理方法。书中提到了许多在安装和管理rac时需要注意的问题,这些问题都是作者在实际的工程实施过程中遇到过并亲手解决的。 《Oracle RAC 11g实战指南》主要介绍rac 11.2在unix/linux系统中的安装和管理方法。从内容组织形式上来看,《Oracle RAC 11g实战指南》共分为10章和2个附录:章介绍了系统高可用性的概念,第2章介绍了rac的体系结构,第3章介绍在aix系统中所需要做的安装前的准备工作,第4章~第6章介绍了rac的整?安装过程,第7章介绍rac集群环境的管理方法,第8章介绍asm实例和磁盘组的维护方法,第9章介绍了对rac数据库的常规管理方法,0章介绍集群数据库的备份与恢复。附录a和附录b分别介绍了在solaris和linux两种操作系统中需要做的安装前
本书在系统地介绍各种类型RAID的结构和工作原理的基础上,深入浅出地讲解了RAID数据恢复的方法和技巧,同时,针对市场上主流的Windows、Linux、UNIX和Apple等多种文件系统,提供了大量RAID数据恢复的实际案例供读者学习。采用自然形象的方式描述RAID系统的抽象概念;同一个恢复案例,注重对不同的恢复方法进行比较分析。 本书概念清楚,逻辑性强,图文并茂,内容新颖。 本书适合数据恢复、信息安全等领域的从业人员以及对RAID数据恢复技术感兴趣的人员阅读,也可作为大专院校计算机相关专业学生的教材或参考书。
本书结合大数据技术趋势和中兴通讯的长期实践,对大数据技术提出系统的理解,对大数据研究提供了初步的思路和建议。本书首先从大数据的需求和现状出发,分析目前大数据出现的问题,然后针对这些问题对大数据存储、大数据处理,以及大数据的可视化进行了充分的探索。
postgresql是目前广泛应用的开源数据库管理系统。《PostgreSQL 数据库内核分析》从postgresql数据库的源代码入手,深入分析了该数据库管理系统的底层实现细节,揭示了数据库运行的基本原理。《PostgreSQL 数据库内核分析》的主要内容包括:postgresql数据库的体系结构、 存储管理、索引机制、查询编译、查询执行、并发控制机制以及安全等。每个主题都引用了大量的数据结构、图表等进行说明,使读者对实现过程和机理一目了然。 《postgresql数据库内核分析》适合从事数据库领域相关研究的技术人员、高等院校相关专业高年级本科生或研究生阅读,有助于读者进行数据库的高级开发、基于postgresql定制满足需求的数据库系统,或者在数据库内核中实现并验证数据库新技术。
财务管理对所有企业而言都具有重要战略意义。一个能全盘掌握企业信息,并能清晰地提供决策所需资料的数据处理系统将是企业提升财务管理系统的核心平台。Oracle公司是全球的信息管理软件及服务供应商,Oracle数据库已成为世界上使用最广泛的数据库系统之一。在市场竞争日趋激烈的今天,该系统可以为企业培养迅捷的反应能力和整合资源提供极大的便利。 本书以版本的Oracle 11i E Business Suit为对象,全面系统地介绍了Oracle 11i财务系统的操作使用流程和方法。从教学内容上来看,本书涵盖了财务模块的所有构成部分,表述了会计核算和财务分析的主要流程,体系完整; 从教学方法上看,本书提供了丰富的示例和技巧说明,并辅以明晰的图示,读者可以轻松地在实践中掌握相关技巧。本书的目的是力争让每一位希望实现企业财务管理软件化、现代化、智能化
《数据结构例题详解与课程设计指导》力求对每题严格按照知识点全面分析并详细解答。本书由两部分组成:部分是典型例题详解和习题解答,基本上涵盖了数据结构的所有知识点;第2部分通过经典的课程设计案例详解给出课程设计的实践指导。 《数据结构例题详解与课程设计指导》希望通过对基础理论和概念的归纳总结、典型例题的详细分析、课后习题的详尽解答、课程设计的实例分析,帮助读者深化对基本概念的理解,熟练掌握数据结构基本原理,进一步提高算法设计和分析能力。 本书语言流畅,内容通俗易懂,例题经典,解答详尽。本书是《数据结构(C语言版)》(秦锋主编,清华大学出版社出版,ISBN:978-7-302-24603-9)的配套教材,同时又自成体系。本书可作为高等学校计算机信息类专业的学习辅导书,也可作为研究生入学考试的复习参考书。本书由秦锋教授和