《数据库系统概念》是数据库系统方面的经典教材之一,其内容由浅入深,既包含数据库系统基本概念,又反映数据库技术新进展。它被国际上许多大学所采用,包括斯坦福大学、耶鲁大学、得克萨斯大学、康奈尔大学、伊利诺伊大学等。
本书系统论述了图数据库的理论知识与行业应用实践。本书分为理论篇和实践篇,共15章。其中,理论篇包括第1~8章,由浅入深地介绍了图数据库的概念和底层技术原理,涵盖主流图数据库的内核原理与架构设计、图查询语言、图算法 、图数据库客户端编程、图数据库服务端编程、图可视化、图数据库选型等内容;实践篇包括第9~15章,介绍了图数据库的行业应用案例,涵盖知识图谱、金融、泛政府、零售、制造业供应链管理、企业资产管理、生命科学等内容,通过这些案例,进一步启发读者深入思考和挖掘潜在的应用场景。针对行业案例,本书免费提供详尽的源代码,以便读者动手实践。 本书适合数据库应用开发人员、数据库管理人员、数据科学家以及负责数据库选型的技术专家阅读,也适合高等院校数据库专业的高年级本科生和研究生参考。
本书是一部通过提供一套易于遵守及操作的方法论来实现高质量数据管理的实践指南。内容 全面、详细,并有许多实用的建议和模板,第1版推出后,已成为全球信息质量实践者的书 籍,甚至已成为美国阿肯色大学信息质量研究生项目的教科书。 本书共7章,内容包括数据质量和依赖于数据的世界、数据质量实践、关键概念、十步法流 程、设计项目结构、其他技巧和工具,以及写在最后的话。 作者将信息质量的概念框架与改善信息质量的技术、工具、操作指南相结合,提出并详细描 述了获取高质量数据和可信信息的十步法。作为本书的最新改版,作者进一步阐明并更新了流程 步骤和支持模板,整合了一些有价值的示例和案例,说明了近些年技术和数据生产的演变。 本书内容丰富,理论和实践相结合,易读性和可操作性强,可以作为数据质量管理的入门和 进阶用
本书主要介绍从高维数据中感知、处理、分析和学习低维结构的基本数学原理和高效计算方法,系统地归纳了建模高维空间中低维结构的数学原理,梳理了处理高维数据模型的可扩展高效计算方法,阐明了如何结合领域具体知识或考虑其他非理想因素来正确建模并成功解决真实世界中的应用问题。本书包括基本原理、计算方法和真实应用三个部分:基本原理部分系统地介绍稀疏、低秩和一般低维模型的基本性质和理论结果,计算方法部分介绍解决凸优化和非凸优化问题的有效算法,真实应用部分通过实例演示利用前两部分的知识改进高维数据处理和分析问题的解决方案。本书适合作为计算机科学、数据科学和电气工程专业的高年级本科生和研究生的教材,也适合学习稀疏性、低维结构和高维数据课程的学生参考。
本书针对高校商学院商业分析课程编写,内容涵盖了所有相关的商业分析主题,而且各个主题在设计上都是模块化的,教师授课时可灵活地选择最符合其课程目标的主题。比如,本书可以适用于涵盖数据处理(第2章)、数据可视化(第3章)、综合指标(第3章)、统计理论(第4章和第5章)和回归分析(第6章和第7章)的入门课程,或侧重于预测(第8、9、10、11和12章)和预测性建模(第13章)的高级商业分析课程。 为适应不同学生对于统计软件的需求,本书每个知识点都提供了Excel和 R语言两种分析方法和实际操作,而且所有的例题和习题都是使用撰写本书时最新版本的软件解决的,即Microsoft Office Professional 2016、Analytic Solver 2019和 R语言3.5.3版本。 本书的最终目的是让学生更好地理解、管理和可视化数据,学会应用适当的分析工具,并对研究结果及其相关性进行沟通
近年来,在所有科学学科和工业环境中收集的数据量和种类都出现了爆炸式增长。如此庞大的数据集给统计和机器学习领域的研究人员带来了许多挑战。本书对高维统计学进行了详尽介绍,重点介绍核心方法论和理论,包括尾部界、集中不等式、一致律和经验过程以及随机矩阵。此外还深入探索了特定的模型类,包括稀疏线性模型、用秩约束矩阵模型、图模型和各种类型的非参数模型。书中提供了数百个工作示例和练习,既适合统计学相关课程使用,也适合统计学、机器学习和相关领域的研究生与研究人员自学。
本书英文原版由全球数据中心业内专家共同编写,中文版由国内数据中心业内专家共同翻译并修订完成。内容涵盖了数据中心全生命周期的相关技术及运营管理策略。从数据中心规划、选址、设计、建设、测试、验收、运营到灾备,内容全面详实。是作者及译者多年经验所得。是一本来自全球不同国家、不同企业、不同专业领域的专家共同完成的杰作。 本书可作为数据中心设计者、建设者、管理者以及投资者的学习及参考材料,亦可作为高校相关专业学生及其他人士了解数据中心行业的入门材料。
本书以敏捷分析工具Tableau为基础,部分章节辅以SQL讲解,系统介绍了数据可视化分析的体系和方法,内容涵盖问题分析方法、数据合并和建模、可视化图形的选择和构建、多种交互方式及其组合、仪表板设计与高级交互、基本计算和高级计算等。 本书以Tableau Desktop的应用为中心,借工具讲解原理,以原理深化工具应用,并由点及面地介绍了业务分析的思考和原理,特别是提出了实践性的"业务 数据 分析 层次框架,并以三类"详细级别 的概念贯通数据模型、高级筛选和高级计算三大主题。 本书重点介绍工具应用背后的思考方式和原理,帮助读者建立"详细级别 的思考框架,举一反三,从而实现多维、结构化分析。
本书是一本数据科学的入门与提升教程,全书共5篇,按照由浅入深、循序渐进的方式介绍R语言的基本语法与实际应用,并结合现实数据进行实战操作。内容涵盖R语言的安装与运行、数据对象的创建与编程、R语言初级与高级绘图、数据的管理与清洗、统计分析与数据降维、无监督与有监督学习、利用R Markdown创建动态报告和制作幻灯片等。本书为读者提供了相关案例的源码(获取方式见封底)。 本书适合对数据可视化、统计建模、数据分析、数据挖掘感兴趣的研究人员和工程技术人员阅读,也可作为高等院校数学、统计学、数据科学、计算机科学、人工智能、云计算、大数据分析、生物医学、工业统计等方向本科生或研究生的参考教程。
本书是一本探索如何应用图思维和图技术解决复杂问题的书籍。该书针对有兴趣学习如何使用图数据提升工作水平、解决困难问题的实战从业者。 该书涵盖了与图数据相关的广泛主题,包括图思维、图数据模型和查询语言,讨论了如何将图数据应用于社交网络、物流和网络安全等领域的问题解决方案。 此外,该书还提供了实践指导,包括工具和框架的推荐、设计有效图数据模型的建议,以及如何使用图数据生成洞见和做出明智决策的建议。 总的来说,本书是任何希望学习如何使用图数据解决复杂问题和获得新的工作洞见的人的优质资源。
本书基于感知和可视化的科学,介绍了大量应用的提升可视化效果的关键原则和方法。新版增加了可视化领域的新进展,特别是增加了神经科学感知相关的可视化内容。
本书介绍可以帮助读者处理真实数据分析挑战的概念和技能。它涵盖了概率论、统计推断、线性回归和机器学习等概念。它还帮助读者提升如下技能:R编程、数据清洗、数据可视化、预测算法构建、使用UNIX/Linux shell组织文件、使用Git和GitHub进行版本控制以及可复制的文档准备。全书分为六个部分,分别为R、数据可视化、统计与R、数据清洗、机器学习和生产力工具。
本书介绍了数据工程生命周期,并展示如何组合运用各种云技术来满足下游数据消费者的需求。本书分为三部分:第一部分介绍了数据工程的定义、数据工程的生命周期、合理的架构设计和帮助技术选型的框架;第二部分深入介绍了数据工程生命周期的每个阶段 数据生成、存储、获取、转换和服务;第三部分讨论了数据工程的重要部分 安全和隐私。附录还介绍了与处理数据文件和评估数据系统的性能有关的序列化和压缩,以及云网络。本书适合软件工程师、数据科学家、数据工程师和数据分析师等相关技术人员阅读。
本书是一本指导DBA进行数据库开发和运维的实用手册,本书共9章,包括漫谈数据库、如何提升数据库性能、如何运维好数据库、如何进行数据库设计、如何做好数据库之间的数据同步、认识HTAP技术、认识数据库的功能原理、认识数据库中的数学(逻辑与算法),以及DBA的日常:数据库管理及开发的最佳实践。另有附录DBA杂谈。 本书内容是资深DBA多年实践经验的归纳总结,涵盖DBA日常工作中的主要方面,通过剖析众多的真实案例,并解读原理、分享技巧、提供思路,内容具备较强的启发性和指导性。 本书的受众包括但不限于想要了解如何提升数据库性能的应用开发人员、DBA、业务架构师、IT架构师、数据架构师、数据分析师、系统架构师、解决方案架构师和企业高级管理人员。
作为数据仓库和商业智能(DW/BI)行业中有影响力的领军人物,RalphKimball、MargyRoss得到了世界范围内的认可和尊重,他们在《数据仓库与商业智能宝典(第1版)》中确立了行业标准。现在,在《数据仓库与商业智能宝典(第2版)成功设计、部署和维护DW/BI系统》中已经更新了65篇DesignTip和白皮书,从而汇集了DW/BI技术创新前沿的著作。 从项目规划和需求收集,到维度建模、ETL和BI应用,《数据仓库与商业智能宝典(第2版):成功设计、部署和维护DW/BI系统》涵盖了你在数据仓库和商业智能中将会遇到的所有内容。这些无与伦比的文章提供了成功地设计、部署和维护DW/BI系统的重要建议。 启动DW/BI项目和收集需求的注意事项 集成式企业数据仓库的要素,其中包括总线架构和矩阵 事实表的粒度性和三种基本类型 渐变维度技术 星型模式、
本书提供了学习大数据技术及架构的一站式解决方案,覆盖了大数据生态圈中的完整技术体系,包含以下内容。 . 一、数据采集 日志数据采集工具(Flume 、Logstash、Filebeat ) 数据库数据采集工具(离线采集工具 Sqoop、DataX,实时数据采集工具 Canal、Maxwell 网页数据采集工具 物联网数据采集工具 消息队列中间件 . 二、数据存储 分布式文件存储之HDFS NoSQL数据库之HBase NoSQL数据库之Redis . 三、离线数据计算 离线计算引擎MapReduce 离线计算引擎Spark . 四、实时数据计算 实时计算引擎Storm 实时计算引擎Spark Streaming 新一代实时计算引擎Flink . 五、OLAP数据分析 离线OLAP引擎(Hive、Impala、Kylin) 实时OLAP引擎(Druid、ClickHouse、Doris) . 六、全文检索引擎 Lucene Solr Elasticsearch . 七、分布式任务调度系统 Azkaban Ooize DolphinScheduler . 八、分布式资源管理 YARN的原理、架构 YARN
本书详细介绍了Oracle、MySQL、PostgreSQL、SQL Server、DB2等各种关系数据库的SQL查询技巧和一些基础的SQL查询语句,并且通过短小精悍的实例,不仅讲解了如何插入、更新和删除数据,还介绍了如何检索记录、为查询结果排序、同时操作多张数据库表、查询元数据、处理涉及字符串和数值的操作、根据时间数据和日期数据进行运算、执行层次查询和区间查询等。随着多种SQL实现大量采用窗口函数,本书第2版针对相关实例做了优化,还新增了为数据科学家和算法工程师量身定制的实例。
本书是ClickHouse领域的集大成之作,从基础知识、实现原理、项目实战、扩展应用4个维度全面展开,表述简练清晰、案例丰富实用,既可以作为入门的标准参考书,又适合作为案头速查手册。书中内容是作者在阿里巴巴、字节跳动多年实战经验的总结,得到了字节跳动和阿里巴巴9位大数据专家的高度评价。 全书共10章,主要内容如下: 第1~3章整体介绍ClickHouse概念、特性、应用场景、技术生态、快速入门和基础数据类型等基础内容,目的是从本质上揭开ClickHouse高性能背后的秘密,帮助读者快速上手实践。 第4~6章重点讲解ClickHouse的高级数据类型、函数和SQL查询语法与配置实践等进阶内容,通过该部分内容的阅读和学习,你将全面掌握ClickHouse核心功能的使用方法和技巧。 第7~10章从企业级项目实战的角度出发,详细解析ClickHouse在实际业务项目中的使用,主要包括基于
本书详尽阐述了高斯数据库的系统架构、设计理念、核心技术、实现机制以及未来的发展方向。通过深入浅出的叙述,将技术理论与行业应用完美融合,为读者呈现如何实现数据库高性能、高可用、高扩展性、高智能和高安全的关键技术,并深度剖析其背后的优化动因与权衡。本书还介绍了数据库在实际场景中的系统调优思路和经验,为数据库从业人员提供有益参考。 此外,本书还详细介绍了高斯数据库在我国众多关键基础行业的成功应用案例,覆盖金融、政府(比如政务云、财政管理等)、制造业、卫生健康、电信、能源、水利、广播电视等领域,展示了其在实践中的强大功能和广泛影响力。
本书详细介绍了Oracle、MySQL、PostgreSQL、SQL Server、DB2等各种关系数据库的SQL查询技巧和一些基础的SQL查询语句,并且通过短小精悍的实例,不仅讲解了如何插入、更新和删除数据,还介绍了如何检索记录、为查询结果排序、同时操作多张数据库表、查询元数据、处理涉及字符串和数值的操作、根据时间数据和日期数据进行运算、执行层次查询和区间查询等。随着多种SQL实现大量采用窗口函数,本书第2版针对相关实例做了优化,还新增了为数据科学家和算法工程师量身定制的实例。本书适合数据分析师、数据库管理员以及与SQL打交道的数据科学家和算法工程师阅读。
本书涵盖了使用统计分析和数据科学方法对财务数据进行建模和分析的方法。第1章概述了金融市场,描述了市场运作并使用探索性数据分析来说明金融数据的性质。第2章介绍了探索性数据分析的方法,尤其是图形方法,并在实际财务数据上进行了说明。第3章介绍了可用于财务分析的概率分布,特别是重尾分布,并介绍了计算机模拟财务数据的方法。第4章介绍了统计推断的基本方法,尤其是在分析中使用线性模型,第5章介绍了时间序列的方法,其中特别强调了适用于财务数据分析的模型和方法。附录还描述了如何使用R从互联网获取当前财务数据。
看似佛系,其实只是不思进取;在朋友圈假装热爱生活,真实的自我只敢去微博展露;年初列了无数计划,年底全成了打脸的笑话;人前装得无懈可击,活得却比谁都软弱无力 本书作者赵德昊, 毒鸡汤 公众号创始人,凭借《不会偷懒还假装勤奋,怪不得你又累又穷》《你这不是抑郁,是没钱和缺爱的正常表现》《就算朋友遍天下,你还是个nobody》等爆文圈粉无数。 这些热辣酸爽的金句,引起无数年轻人共鸣,也映照出他们在当下焦虑生活中无力挣扎的现实。61篇犀利扎心的硬核文章,不卖情怀只给解药,愿这些狠话能为你打破思维桎桔,重塑人生。 生活虽不易,但请你干万别假装。
本书以MySQL 8.0为主,全面系统地阐述了MySQL日常使用及管理过程中的一些常用知识点:安装、复制、binlog、备份、监控、DDL、线程池、中间件、常用工具、组复制、InnoDB Cluster、JSON、MySQL 8.0的新特性。 本书定位于实战,目的是让读者拿来即用,快速上手MySQL。除了实战,本书还花费了大量的篇幅来讲解MySQL中一些常见操作、常用工具的实现原理。 组复制是MySQL官方推荐的高可用方案,本书会从源码角度分析组复制的一些核心模块的实现细节,包括分布式恢复、冲突检测、事务一致性以及流量控制机制等。
在建设新型数据中心的过程中,利用新能源、新技术加速实现节能减排,提升算力服务水平,赋能数据中心产业的节能低碳绿色发展。 本书解读了国家关于绿色低碳新型数据中心政策与节能发展要求,详细介绍了新型数据中心规划、设计和建设的要求以及旧机房DC化重构的整体思路和新技术应用案例,突出新型数据中心智能化管理平台的框架和实现方案以及低碳节能维护管理的基本要素,重点分析了电源系统和空调系统的低碳节能维护要点与管理体系以及新技术应用案例,体现了数据中心赋能经济社会。 本书是信息通信基础设施低碳节能技术的总结和新建局站节能的指南,可供数据中心工程设计、建设施工、运营管理的人员以及系统集成、智慧建筑、IT等行业的技术人员参考和阅读,也可作为大中专院校相关专业师生的参考用书。