本书系统地介绍数据结构基础理论知识及算法设计方法,~7章从抽象数据类型的角度讨论各种基本类型的数据结构及其应用,主要包括线性表、栈和队列、串、数组和广义表、树和二叉树及图; 第8章和第9章主要讨论查找和排序的各种实现方法及其综合比较; 0章介绍数据结构课程实验的目的、步骤及内容; 附录给出全书习题的参考答案。全书采用类C语言作为数据结构和算法的描述语言,随书配备电子教案。本书在内容选取上符合人才培养目标的要求及教学规律和认知规律,在组织编排上体现“先理论、后应用、理论与应用相结合”的原则,并兼顾学科的广度和深度,力求适用面广。本书具有结构严谨、层次清楚、概念准确、深入浅出、描述清晰等特点。 本书可以作为计算机类专业和信息类相关专业的本科或专科教材,也可以供从事计算机工程与应用工作的科技
本书主要探讨在这个演算时代,"身份”的意义为何:演算法如何运作,在哪些层面控制了我们的生活,我们又该如何抵抗?演算法无所不在,组织全世界的数据。我们每一次使用电脑搜寻、按赞、点击与购买都是一个数据。这些复杂的系统规则,不只塑造我们在网络与现实生活中的知识与人际关系,还决定了我们的现在与未来的样貌,无论是否在线。
本书以了解COBOL语言为基础,通过由浅入深的讲解,循序渐进地介绍了如何使用COBOL语言进行实际开发。同时在讲解的过程中,也穿插了部分IBM大型机的知识及其在实际应用中的操作。 本书共分14章,从内容上可分为COBOL的入门篇、高级处理篇与实战篇。入门篇介绍了掌握一门语言必须了解的基础知识,包括数据类型、流程控制和各种运算;高级处理篇是针对COBOL有难度的一些技术点,包括表、子程序、数据处理、VSAM面向对象等;实战篇是通过一个完整的实例带你走完一个用COBOL开发的流程。 本书通俗易懂,适合广大COBOL程序开发人员、大型机培训班学员和大专院校学生阅读,尤其适合具有编程基础的人员进行学习。
本书讲授标准数据库设计与管理技术,适用于任何类型的数据库。本书使用Access和Oracle作为样例数据库,讲授如何使用结构化查询语言SQL来创建和访问数据库对象,使用范式化来完成逻辑数据库设计,将逻辑设计转换成物理数据库,以及处理数据和过程模型。另外,本书还介绍数据库安全、在线分析处理、数据库与应用系统的连接,以及将XML和对象内容集成到数据库等内容。本书最后给出了各个章节的自我测试题答案和动手实践练习题解决方案,非常适合作为数据库系统的基础教材。
计算和信息技术的飞速发展带来了医学、生物学、财经和营销等诸多领域的海量数据。理解这些数据是一种挑战,这导致了统计学领域新工具的发展,并延伸到诸如数据挖掘、机器学习和生物信息学等新领域。许多工具都具有共同的基础,但常常用不同的术语来表达。本书介绍了这些领域的一些重要概念。尽管应用的是统计学方法,但强调的是概念,而不是数学。许多例子附以彩图。本书内容广泛,从有指导的学习(预测)到无指导的学习,应有尽有。包括神经网络、支持向量机、分类树和提升等主题,是同类书籍中介绍得最全面的。 本书可作为高等院校相关专业本科生和研究生的教材,对于统计学相关人员、科学界和业界关注数据挖掘的人,本书值得一读。
本书重点介绍数据质量管理与安全管理的理论及应用。首先通过数据管理现况和问题的分析,提出数据质量管理的步必须是将各种来源的数据标准化,具有统一的数据格式和规则。书稿中强调了提高数据质量不仅可提高信息系统的质量,还可提高经营活动的质量。需要制定质量管理计划或执行具体的质量管理活动。定义了数据质量的准确性、一致性、可用性、可达性、及时性、安全性这6个标准以及对应的管理流程,划分了5个能力成熟度的等级,界定了从管理者到执行者等各个质量管理活动和责任。提出多项数据质量管理主要技术和各国实用案例,还进一步在Orange数据库中实践了数据质量诊断流程。书稿后半部针对日益增长的数据库安全性的需求,提出了安全管理系统构建、访问控制,数据伪装等具体可行的技术手段,最后还将数据安全技术推广到大数据的应用场景
在信息技术革命之后,我们将迎来数据革命。在大数据的概念、性质和价值已得到政府和社会的认可之后,大家关注的是数据如何获取,以及有了数据以后如何挖掘数据的价值。仅适合特定行业、满足特定需求的技术不足以应对一场革命,大数据不但是超出计算机软硬件处理的能力,更是超出人类的认知能力。只有实现对数据的认知,利用数据辅助决策,才是适合不同行业数据价值实现的通用手段。本书描述了数据革命的起源、实现的思路、所用的技术和要达到的目标,针对当今社会热点描述了在数据时代的应对之策。本书宏观和微观、人文和技术、启迪思想和关注实用并举,既适合宏观层面的领导启迪思维,提出工作目标,又适合微观层次的执行人员找到实现的方法和路径。本书介绍的理论和技术均可在智慧城市、智能制造领域实际使用。本书适合政府、企业决
本书介绍了 PostgreSQL 内部的工作原理,包括数据库对象的逻辑组织与物理实现,进程与内存的架构。并依次剖析了几个重要的子系统:查询处理、外部数据包装器、并发控制、清理过程、缓冲 区管理、WAL、备份及流复制。本书为 DBA 与系统开发者提供了一幅全景概念地图,有助于读者形 成对数据库实现的整体认识,亦可作为深入学习 PostgreSQL 源代码的导读手册,对于理解数据库原 理与 PostgreSQL 内部实现大有裨益。 本书适合数据库开发人员及相关领域的研究人员、数据库 DBA 及高等院校相关专业的学生阅读。
Spark SQL 是 Spark 技术体系中较有影响力的应用(Killer application),也是 SQL-on-Hadoop 解决方案 中举足轻重的产品。《Spark SQL内核剖析》由 11 章构成,从源码层面深入介绍 Spark SQL 内部实现机制,以及在实际业务场 景中的开发实践,其中包括 SQL 编译实现、逻辑计划的生成与优化、物理计划的生成与优化、Aggregatio算子和 Joi算子的实现与执行、Tungste优化技术、生产环境中的一些改造优化经验等。
postgresql是目前广泛应用的开源数据库管理。《PostgreSQL 数据库内核分析》从postgresql数据库的源代码入手,深入分析了该数据库管理的底层实现细节,揭示了数据库运行的基本原理。《PostgreSQL 数据库内核分析》的主要内容包括:postgresql数据库的体系结构、 存储管理、索引机制、查询编译、查询执行、并发控制机制以及安全等。每个主题都引用了大量的数据结构、图表等进行说明,使读者对实现过程和机理一目了然。
我们能相信统计么? 抛了5次硬币,结果都是正面,抛硬币是否肯定是正面?如何从高层的统计指标看透数据后面的本质?如何在大数据时代获取战略制高点,确定自己的职业发展定位?从一个互联网公司数据分析师的成长经历,为您娓娓道来,数据分析中的奇闻趣事、心得总结、方法技巧与哲学感悟。