本书提供了一种简单、高效、通用的关系型数据库索引设计方法。作者通过系统的讲解及大量的案例清晰地阐释了关系型数据库的访问路径选择原理,以及表和索引的扫描方式,详尽地讲解了如何快速地估算SQL运行的CPU时间及执行时间,帮助读者从原理上理解SQL、表及索引结构、访问方式等对关系型数据库造成的影响,并能够运用量化的方法进行判断和优化,指导关系型数据库的索引设计。
本书由斯坦福大学知名计算机科学家Jeffrey Ullman和JenniferWidom合作编写。本书首先介绍流行的关系数据库和对象关系数据库内容,涉及关系数据模型、E/R模型、UML模型以及对象模型等高级数据模型。然后介绍了有关半结构化数据组织管理中比较流行的XML等内容,既包括了数据组织模型的内容,也给出了相关编程语言,如XPath、XQuery、XSLT等。 本书举例丰富翔实,既可用作大学本科、研究生计算机及相关专业数据库课程的教科书,也可用作数据库领域技术人员的参考书。
本书主要内容包括:数据清洗在数据科学领域中的重要作用,文件格式、数据类型、字符编码的基本概念,组织和处理数据的电子表格与文本编辑器,各种格式数据的转换方法,解析和清洗网页上的HTML 文件的三种策略,提取和清洗PDF 文件中数据的方法,检测和清除RDBMS 中的坏数据的解决方案,以及使用书中介绍的方法清洗来自Twitter 和Stack Overflow 的数据。
本书是一本从理论到实践的全面且细致的企业数据驱动指南,作者见证并献身百度大数据的建设,毫无保留地将成败摸索实践的真实场景进行完整还原,并对近十年大数据从业经验与心得做了归纳和总结,同时详解大数据本质、理念与现状,并围绕数据驱动四环节——采集、建模、分析、指标,深入浅出地讲述企业如何从零到一将完整的数据驱动方案落地,全面展示大数据在各领域内的应用情况与趋势展望。
本书是一本独特的数据库入门书,以最有效的教学思路讲解数据库的每一个知识点,完全以初学者的思维方式提出疑问再深入答疑。这也许不是一本传统的教科书,但是自学数据库的书籍。本书采用 老田、小天 二人对话的形式讲解,其中不乏诙谐幽默的问题和解答,避免对知识点生搬硬套。 通过学习本书,你能够在嬉笑怒骂的环境中轻松掌握数据存储原理、数据库设计技巧以及大量数据库编程的实战经验,更重要的是能够掌握一种的学习方法、解决问题的思路和思考的方式。这些经验和技巧得益于我和邹老师两人加起来近25年的项目开发和教育培训经历。 本书部分对于数据库的创建、备份、配置、安全等做详细介绍,通过这部分学习,可以掌握关系数据库的基础,以及对数据库的日常维护操作;本书第二部分对于分析项目需求,创建表,然后使用T-SQL语
随着大数据研究热潮的兴起,各种数据可视化图表层出不穷,大数据生动呈现就成为了具有挑战性的工作,随之出现了大量的可视化软件。本书是基于行业占有率比较高的Microsoft Power BI近期新版本所编写的,详细介绍Microsoft Power BI的数据可视化功能,包括数据类型和运算符、软件的安装、连接数据源、数据基础操作、可视化设计原则、可视化图表、自定义可视化效果、报表、仪表板、查询编辑器、运行R脚本、数据不错操作、数据分析表达式、网页流量数据分析、超市运营数据分析、Power BI移动应用和Power BI应用开发等内容。
数据分析实战 由实战经验丰富的两位数据分析师执笔,数据分析实战 首先介绍了商业领域里通用的数据分析框架,然后根据该框架,结合8个真实的案例,详细解说了通过数据分析解决各种商业问题的流程,让读者在解决问题的过程中学习各种数据分析方法,包括柱状图、交叉列表统计、A B测试、多元回归分析、逻辑回归分析、聚类、主成分分析、决策树分析、机器学习等。特别是书中使用的数据都是未经清洗的原始数据,对如何加工数据以用于数据分析也进行了详细的介绍。读者可以使用R语言实际操作数据,体验真实的数据分析流程,避免纸上谈兵。
本书瞄准云计算和大数据产业,论述云计算环境下的数据治理成熟度模型规范,为用户提供通用的数据治理模型方法;针对靠前外市场对云端数据治理的迫切需求,给云端数据治理的用户提供很好实践方法;给出云端数据治理成熟度的评估方法和流程,帮助用户开展云端数据治理成熟度评估并实现用户的数据治理成熟度持续改进;进行云端数据治理示例分析,对云端数据治理成熟度应用和评估方法予以说明,并给出实施方法和应用步骤。
数据结构是计算机专业教学计划中的一门核心课程,也是信息管理、通信电子、自动控制等与计算机技术关系密切的专业的一门基础课程。要从事和计算机科学与技术相关的工作,尤其是计算机应用领域的开发和研制工作,必须具备坚实的数据结构的基础。本书对C 语言作了简单介绍,叙述了抽象数据类型和面向对象的概念,介绍了线性表、栈、队列、数组、广义表、树和图等数据结构,并且介绍了查找和排序的方法。全书用C 语言描述并实现了所有数据结构的类和程序,并附有习题,便于教学。 本书是为高等院校开设“数据结构”课程编写的教材,可作为计算机专业本科生教材使用,也可供从事计算机软件开发和应用的工程技术人员阅读、参考。
本书汇集了作者有关数据库管理的真知灼见,讲述了dba 的方方面面,有技术的,还有生活的。作者本人不仅专业技术过硬,还当过篮球教练,对人生,尤其是dba 的生存之道有很独到的领悟。书中语言浅显易懂,生动 幽默,还配有多个技术审稿人的精彩评注。这些评注与作者的文字相辅相成,和而不同,因此本书可谓是博采众家之长,值得一读。 本书为dba 量身订做。如果你是dba,那么不可错过;如果你有意成为dba,或者想了解dba 的生存之道,本书同样适合你。
本书是江苏省高等学校精品教材和“十二五”江苏省高等学校重点教材(编号:2015-1-072)。全书突出基础性、新颖性、实用性、操作性,系统全面、深入浅出、实例丰富,以关系数据库系统为核心,将数据库基本原理、方法和应用技术相结合。本书主要内容包括数据库系统概述、关系数据库、关系数据库标准语言SQL、关系规范化理论、数据库设计、数据库保护技术、SQL Server 2012的应用、数据库应用系统开发和数据库技术新进展等。每章均配有小结并附有适量的习题,便于读者巩固所学知识。书后所附习题答案可以帮助读者检验学习和练习效果。此外,本书配有教学课件及数据库应用系统开发源程序。本书可作为高等院校计算机科学与技术、软件工程、信息管理与信息系统、信息与计算科学以及相关专业的本科生教材,也可作为从事计算机软件工作的科技人员和工程
随着大数据研究热潮的兴起,各种数据可视化图表层出不穷,大数据生动呈现就成为了具有挑战性的工作,随之出现了大量的可视化软件。本书是基于行业占有率比较高的Microsoft Power BI近期新版本所编写的,详细介绍Microsoft Power BI的数据可视化功能,包括数据类型和运算符、软件的安装、连接数据源、数据基础操作、可视化设计原则、可视化图表、自定义可视化效果、报表、仪表板、查询编辑器、运行R脚本、数据不错操作、数据分析表达式、网页流量数据分析、超市运营数据分析、Power BI移动应用和Power BI应用开发等内容。
本书对常用的数据结构做了系统的介绍,既注重原理又强调实践,配有大量的图表和习题,概念讲解清晰、逻辑性强、可读性好。主要内容包括:数据结构的基本概念;算法描述和算法分析初步;线性表栈、队列、串和广义表、树、图等结构:排序和查找的各种方法。每章均例举了典型应用实例,并配有算法和相应源程序以供教学和实践使用。另外还在附录中设计了上机实验题供读者独立完成,以加深读者对所学知识的理解和应用。 作为“21世纪计算机系列规划教材”之一,本书可作为高等院校应用型本科及高职高专院校计算机专业教材,也可以作为大学非计算机专业学生的选修课教材和广大从事计算机应用的科技人员的参考书。
PowerDesigner 10为Sybase发布的的软件分析设计工具,是目前最为流行的软件分析设计工具之一。本书首先介绍了PowerDesigner的基本概念及基本操作,然后以数据库系统设计建模为主,分别介绍了概念数据模型(CDM)、物理数据模型(PDM)、多维数据模型、文档生成(Report)、版本控制(Repository)等几个部分。本书从实用的目的出发,结合实例讲解,努力做到概念清晰,面向应用,帮助用户全面系统地掌握PowerDesigner的使用。其中,文档生成(Report)部分,以问题为导向,系统阐述如何解决文档生成中遇到的实际问题,从而生成满足用户特定需求的文档。介绍PowerDesigner的同时,书中还穿插了一些相关内容的基本理论知识,帮助不熟悉的读者快速掌握,从而更好地使用PowerDesigner。此外,本书还融入了CSDN网友的常见提问及笔者回答的整理,这些内容以FAQ的形式单独成立一章,
本书将整体内容分为两部分,在第1部分中以影响数据读取效率的所有 要素为类别,对其各自的概念、原理、 特征、应用准则,以及表的结构特 征、多样化的索引类型、优化器的内部作用、优化器为各种结果制定的执行 计划予以详细说明,并以对优化器的正确理解为基础,提出对执行计划和执 行速度产生影响的索引构建战略方案;在第2部分中主要介绍提高数据 读取效率的具体战略方案,在这部分中介绍与数据读取效率相关的局部范围 扫描的原理和具体应用方法,以及对被认为是提高数据库使用效率基础的表 连接的所有类型予以详细说明。 《海量数据库解决方案》系列丛书深受广大读者的喜爱已经长达10年之久,在被誉为“”的同时,它已经变成了数据库用户不可或缺的书籍。作者竭力探求能够让IT工作者在实际工作中轻松应用并掌控的巧妙方法 ,提供事半
本书是一本广受好评的Cassandra图书。与传统的关系型数据库不同,Cassandra是一种开源的分布式存储系统。书中介绍了它无中心架构、高可用、无缝扩展等引人注目的特点,讲述了如何安装、配置Cassandra及如何在其上运行实例,还介绍了对它的监控、维护和性能调优手段,同时还涉及了Cassandra相关的集成工具Hadoop及其类似的其他NoSQL数据库。 本书适合数据库开发人员与网站开发者阅读。