本书主要介绍了数据库系统的基本概念,包括数据库设计、数据库语言和系统实现。第4版中扩展了ER模型、SQL、数据仓库、OLAP、数据挖掘的内容,新增了XML、数据库管理、应用开发等章节,更新并扩展了信息检索部分。本书可作为三、四年级本科生一年级研究生的数据库课程的教材,同时,可供数据库领域的技术人员参考。涵盖了数据模型、基本对象的系统和XML、数据库存储和检索、事务处理、 数据库系统体系结构等多方面的内容,采用直观的方式描述所有概念,并以结构清晰的图示和例子代替形式化的证明,以银行数据库实例生动地解释重要概念,增强了本书的易读性。
本书针对spark从验证性环境迁移到实际生产环境时会遇到的各种问题给出了实际的帮助,涵盖了开发及维护生产级Spark应用的各种方法、组件与有用实践。全书分为6章, ~ 2章帮助读者深入理解Spark的内部机制以及它们在生产流程中的含义;第3章和第5章阐述了针对配置参数的法则和权衡方案,用来调优Spark,改善性能,获得高可用性和容错性;第4章专门讨论Spark应用中的安全问题;第6章则全面介绍生产流,以及把一个应用迁移到一个生产工作流中时所需要的各种组件,同时对Spark生态系统进行了梳理。
本书定义为“轻教材”,并结合先进的大数据公司的实战经验,帮助大数据从业人员熟悉大数据相关的基础知识、基本工具,帮助大数据企业的管理者建立数据驱动的文化和构建团队。此书将成为大数据从业人员、大数据企业管理人员以及大数据领域的投资者、监管者的参考书籍。
数据库云平台是当今乃至今后一段时期信息化领域普遍关注的一个热点领域。云技术的本质是分布式计算,而数据库云平台揭示的正是分布式计算在数据处理领域的本质问题。本书介绍了数据库的起源与发展,分析了关系型数据库与NoSQL数据库的适应场景,介绍了国产自主可控数据库云平台发展现状;针对云计算环境大数据时代对结构化和非结构化数据的管理需要,介绍了关系型数据库中的事务、数据恢复、SQL、分布式数据库和NoSQL数据库的一致性与事务等理论;针对越来越多的大数据业务,介绍了数据库应用系统的设计、优化和集成技术。结合发展趋势,重点介绍了当前流行的关系数据库和NoSQL数据库的编程技术;针对信息化建设演进式发展,介绍了数据库重构技术。 本书作为计算机、网络工程、信息管理院校研究生的高端教材,适合具有计算机基础知识的读
在本书中,作者将自己多年形成的编程习惯以及阅读既有代码的体验凝练成了编程中的价值观、原则和77种实现模式。 沟通、简单和灵活的价值观应当被所有开发人员所铭记。局部影响、化重复、将逻辑与数据捆绑等原则同样是通用性的指导思想,比价值观更贴近编程场景,在价值观和模式之间搭建了桥梁。在77种实现模式中,每一种模式都覆盖了编写简洁、清晰、易扩展、易维护的代码这一原则的某个方面。它们为日常的编程提供了丰富翔实的参考依据,并告诉大家这些代码如何为降低沟通成本和提高有效产出提供保障。 本书适用于各个阶段的开发者群体。刚刚涉足软件开发领域的新人能够透过大师的眼睛来看待编程,了解编程的价值观与原则;具有丰富经验的资深工程师则可以通过这些模式进行反思,探究成功实践背后的意义。把价值观、原则和开发
本书瞄准云计算和大数据产业,论述云计算环境下的数据治理成熟度模型规范,为用户提供通用的数据治理模型方法;针对靠前外市场对云端数据治理的迫切需求,给云端数据治理的用户提供很好实践方法;给出云端数据治理成熟度的评估方法和流程,帮助用户开展云端数据治理成熟度评估并实现用户的数据治理成熟度持续改进;进行云端数据治理示例分析,对云端数据治理成熟度应用和评估方法予以说明,并给出实施方法和应用步骤。
DB2是IBM公司出品的一种关系型数据库系统,凭借其较好的完整性、安全性、可恢复性,以及可扩展性,在各行各业的大中型企业中受到青睐。随着企业规模、业务的扩展以及时间的推移,企业中的数据库会越来越庞大,企业对DB2的性能要求势必也会水涨船高。在此情形下,针对DB2性能监控和负载查询优化的工具OPM和OWQT应运而生。 《DB2性能管理与实战》围绕着OPM和OWQT这两个工具的使用方法和技巧展开介绍,并在各种实战案例的基础之上,总结了OPM和OQWT的各种新特性和功能。本书总共分为8章,分别讲解了DB2的系统架构、内存管理、锁定机制、性能监控相关命令及参数、SQL优化的基本原理、OPM和OQWT的基本功能、DB2性能分析方法论与决策树,以及DB2性能分析实战案例等知识。《DB2性能管理与实战》附录部分还讲解了OPM和OQWT的使用架构和使用注意事项,帮助读者快速
本书介绍如何使用图形化的方法来分析和理解复杂的数据,该方法突出数据中重要的关联和分布趋势,并使用尽可能简单的视觉元素来呈现尽可能丰富的信息。本书重点介绍如何理解数据分析的图形元素,以及如何使用R生成书中涉及的各种图形。附录中列有大量参考资料,以及章节练习解答、相关R函数、R包、故障排查等信息,便于读者深入学习。
《数据库设计与关系理论》中,关系数据库领域的泰斗C.ate用超过40年的经验证明了为什么恰当的数据库设计是非常关键的,他用数据库设计者和开发者可以轻松理解的方式介绍了设计理论,弥补了其他图书的空缺。《数据库设计与关系理论》每章都包括一组习题,它们要么展示在实践中如何应用理论,提供更多的信息,要么要求你证明一些简单的理论结果。如果你是一位熟悉关系模型的数据库专业人员,并对数据库设计有非凡的兴趣,那么《数据库设计与关系理论》正是为你准备的。
本教材导引部分介绍了数据库常见的几大基本概念以及数据库的发展,阐述了贯穿教材始终的图书管理系统项目。基础应用篇以图书管理系统为背景,详细讲解了数据库最重要的应用SQL语句以及关系代数和常见的数据库对象视图与索引。深度剖析篇仍然是以图书管理系统为背景,详细讲解了进行数据库设计的理论依据、操作步骤。高级拓展篇展示了数据库的高级管理部分以及复杂的高级编程部分,以图书管理系统为背景贯穿始终。
本书主要内容包括:数据清洗在数据科学领域中的重要作用,文件格式、数据类型、字符编码的基本概念,组织和处理数据的电子表格与文本编辑器,各种格式数据的转换方法,解析和清洗网页上的HTML 文件的三种策略,提取和清洗PDF 文件中数据的方法,检测和清除RDBMS 中的坏数据的解决方案,以及使用书中介绍的方法清洗来自Twitter 和Stack Overflow 的数据。
本书首次专门讨论数据库重构,向数据专业人员展示了如何运用重构、测试驱动及其他敏捷技术进行演进式数据库开发。书中通过许多实际例子,详细说明了数据库重构的过程、策略以及部署。 本书前5章介绍了演进式数据库开发的基本思想和技术,后6章详细描述了每一类重构,包括结构、数据质量、参照完整性、架构、方法的重构;另外还描述了不属于重构范畴的转换技术。 书中的示例代码是用java、hibernate和oracle代码编写的,代码都很简单,读者可以毫无困难地将它们转换成c#、c 或visualbasic代码。
本书通过大量案例研究介绍数据可视化的基础知识,以及如何利用数据创造出吸引人的、信息量大的、有说服力的故事,进而达到有效沟通的目的。具体内容包括:如何充分理解上下文,如何选择合适的图表,如何消除杂乱,如何聚焦受众的视线,如何像设计师一样思考,以及如何用数据。
数据分析实战 由实战经验丰富的两位数据分析师执笔,数据分析实战 首先介绍了商业领域里通用的数据分析框架,然后根据该框架,结合8个真实的案例,详细解说了通过数据分析解决各种商业问题的流程,让读者在解决问题的过程中学习各种数据分析方法,包括柱状图、交叉列表统计、A B测试、多元回归分析、逻辑回归分析、聚类、主成分分析、决策树分析、机器学习等。特别是书中使用的数据都是未经清洗的原始数据,对如何加工数据以用于数据分析也进行了详细的介绍。读者可以使用R语言实际操作数据,体验真实的数据分析流程,避免纸上谈兵。
本书用最轻松的图解方式来讲解数据结构,全书采用丰富的图例阐述数据结构的基本概念及应用,并将重要理论、演算方法做最详细的诠释与举例,是一本兼具内容及专业的数据结构的教学用书。由于作者长期从事信息教育及写作,在文字的表达上简洁明了、逻辑清晰,并安排了大量的习题,供读者检验学习成果。