《DAMA数据管理知识体系指南(第2版修订版)》是在DMBOK1和DMBOK2的基础上进行的第三次修订,是DAMA国际对过去30多年数据管理领域领域知识和实践的总结,是一部数据管理基础工具书。本书从数据处理道德规范、数据治理、数据架构、数据建模和设计、数据存储和操作、数据安全、数据集成和互操作性、文档和内容管理、参考数据和主数据、数据仓库和商业智能、元数据管理、数据质量管理、大数据数据科学、数据管理成熟度评估、数据管理组织和角色期望、数据管理和组织变革管理等方面对数据管理知识体系进行了系统介绍,并描述如何在数据管理功能领域中应用这些原则。
本书是一本全面关注工业企业数据治理方面的工具书,主要内容分为概述篇、体系篇、工具篇、实施篇及案例篇。其中概述篇主要介绍工业企业数据治理的基础概念、主流数据治理标准及框架、数据治理的发展趋势等;体系篇主要介绍数据管控、数据战略、数据架构、主数据管理等的基本原理与管理体系;工具篇主要介绍主数据管理工具、数据模型管理工具、数据资产运营工具等;实施篇主要介绍具体实施策略及路径选择、顶层架构规划与设计、数据资产运营实施等;案例篇主要介绍电力、能源化工、钢铁、制造、战略投资等行业的数据治理案例,为读者提供专业、丰富、可信的数据治理实施范例。本书是工业大数据应用技术国家工程实验室多年潜心研究的重要科研成果的总结和凝聚,既具有理论高度,也具备面向中国工业企业的可实操性。参与本书编著的作者均
本书英文原版由全球数据中心业内专家共同编写,中文版由国内数据中心业内专家共同翻译并修订完成。内容涵盖了数据中心全生命周期的相关技术及运营管理策略。从数据中心规划、选址、设计、建设、测试、验收、运营到灾备,内容全面详实。是作者及译者多年经验所得。是一本来自全球不同国家、不同企业、不同专业领域的专家共同完成的杰作。 本书可作为数据中心设计者、建设者、管理者以及投资者的学习及参考材料,亦可作为高校相关专业学生及其他人士了解数据中心行业的入门材料。
本书针对高校商学院商业分析课程编写,内容涵盖了所有相关的商业分析主题,而且各个主题在设计上都是模块化的,教师授课时可灵活地选择最符合其课程目标的主题。比如,本书可以适用于涵盖数据处理(第2章)、数据可视化(第3章)、综合指标(第3章)、统计理论(第4章和第5章)和回归分析(第6章和第7章)的入门课程,或侧重于预测(第8、9、10、11和12章)和预测性建模(第13章)的高级商业分析课程。 为适应不同学生对于统计软件的需求,本书每个知识点都提供了Excel和 R语言两种分析方法和实际操作,而且所有的例题和习题都是使用撰写本书时最新版本的软件解决的,即Microsoft Office Professional 2016、Analytic Solver 2019和 R语言3.5.3版本。 本书的最终目的是让学生更好地理解、管理和可视化数据,学会应用适当的分析工具,并对研究结果及其相关性进行沟通
本书系统论述了图数据库的理论知识与行业应用实践。本书分为理论篇和实践篇,共15章。其中,理论篇包括第1~8章,由浅入深地介绍了图数据库的概念和底层技术原理,涵盖主流图数据库的内核原理与架构设计、图查询语言、图算法 、图数据库客户端编程、图数据库服务端编程、图可视化、图数据库选型等内容;实践篇包括第9~15章,介绍了图数据库的行业应用案例,涵盖知识图谱、金融、泛政府、零售、制造业供应链管理、企业资产管理、生命科学等内容,通过这些案例,进一步启发读者深入思考和挖掘潜在的应用场景。针对行业案例,本书免费提供详尽的源代码,以便读者动手实践。 本书适合数据库应用开发人员、数据库管理人员、数据科学家以及负责数据库选型的技术专家阅读,也适合高等院校数据库专业的高年级本科生和研究生参考。
本书以敏捷分析工具Tableau为基础,部分章节辅以SQL讲解,系统介绍了数据可视化分析的体系和方法,内容涵盖问题分析方法、数据合并和建模、可视化图形的选择和构建、多种交互方式及其组合、仪表板设计与高级交互、基本计算和高级计算等。 本书以Tableau Desktop的应用为中心,借工具讲解原理,以原理深化工具应用,并由点及面地介绍了业务分析的思考和原理,特别是提出了实践性的"业务 数据 分析 层次框架,并以三类"详细级别 的概念贯通数据模型、高级筛选和高级计算三大主题。 本书重点介绍工具应用背后的思考方式和原理,帮助读者建立"详细级别 的思考框架,举一反三,从而实现多维、结构化分析。
本书是一本全面关注企业数据标准化方面的工具书,主要分为5 篇。 第1 篇介绍了数据标准化是数据治理的基础,包括数据标准化与数据治理的关系,以及数据标准化主要内容、本书阅读导引。 第2 篇介绍了数据标准化框架体系,包括架构类数据标准、对象类数据标准、基础类数据标准。 第3 篇介绍了数据标准化实施流程与方法,包括建立数据标准化保障机制、现状分析及评估、技术平台和工具、数据标准化关键域实施。 第4 篇介绍了数据标准化评价,包括数据标准化评价方法、数据标准成熟度评价、数据标准化成熟度评价流程。 第5 篇介绍了数据标准化案例,包括油气行业、多元化集团、装备制造行业、核电行业、汽车行业、金融行业、政务行业、互联网行业等行业的数据治理案例,为读者提供了专业、丰富、可信的数据治理实施范例。 本书是工业大数据应
在建设新型数据中心的过程中,利用新能源、新技术加速实现节能减排,提升算力服务水平,赋能数据中心产业的节能低碳绿色发展。 本书解读了国家关于绿色低碳新型数据中心政策与节能发展要求,详细介绍了新型数据中心规划、设计和建设的要求以及旧机房DC化重构的整体思路和新技术应用案例,突出新型数据中心智能化管理平台的框架和实现方案以及低碳节能维护管理的基本要素,重点分析了电源系统和空调系统的低碳节能维护要点与管理体系以及新技术应用案例,体现了数据中心赋能经济社会。 本书是信息通信基础设施低碳节能技术的总结和新建局站节能的指南,可供数据中心工程设计、建设施工、运营管理的人员以及系统集成、智慧建筑、IT等行业的技术人员参考和阅读,也可作为大中专院校相关专业师生的参考用书。
本书提供了学习大数据技术及架构的一站式解决方案,覆盖了大数据生态圈中的完整技术体系,包含以下内容。 . 一、数据采集 日志数据采集工具(Flume 、Logstash、Filebeat ) 数据库数据采集工具(离线采集工具 Sqoop、DataX,实时数据采集工具 Canal、Maxwell 网页数据采集工具 物联网数据采集工具 消息队列中间件 . 二、数据存储 分布式文件存储之HDFS NoSQL数据库之HBase NoSQL数据库之Redis . 三、离线数据计算 离线计算引擎MapReduce 离线计算引擎Spark . 四、实时数据计算 实时计算引擎Storm 实时计算引擎Spark Streaming 新一代实时计算引擎Flink . 五、OLAP数据分析 离线OLAP引擎(Hive、Impala、Kylin) 实时OLAP引擎(Druid、ClickHouse、Doris) . 六、全文检索引擎 Lucene Solr Elasticsearch . 七、分布式任务调度系统 Azkaban Ooize DolphinScheduler . 八、分布式资源管理 YARN的原理、架构 YARN
本书探索工业大数据的 工程方法体系 并介绍了其中的关键技术,提出了多领域的工业物理对象建模方法和查询技术。全书共10章,第1章讨论了工业大数据的内涵与特点,并给出了工业大数据工程的三个要素,即数据资源、数据分析和数据应用;第2~4章提出了领域模型驱动的数据资源的建模技术,并给出了工业大系统技术与建设方法;第5、6章讨论了敏捷工业大数据分析与运维方法,并阐述了背后的分析软件技术;第7章讨论了用户驱动的数据应用的低代码开发技术;第8~10章用风电、水电、煤矿综采三个行业,展示了工业大数据工程方法的应用过程。
本书基于感知和可视化的科学,介绍了大量应用的提升可视化效果的关键原则和方法。新版增加了可视化领域的新进展,特别是增加了神经科学感知相关的可视化内容。
本书针对大学程序设计竞赛和课程教学,基于数据结构的知识体系结构和循序渐进的原则组织内容,包括基本编程能力训练、线性数据结构的编程、树的编程、图的编程。在每一章中,先介绍了相关的数据结构知识后,然后给出相应的范例;在每章的结尾给出相关题库。
互联网的出现使人们第一次能够访问大量的数据。比如,社交网络Facebook中的友谊图和互联网网站之间的链接图。这两幅图都包含超过10亿个节点,代表巨大的数据集。如果要使用这些数据集,就必须对其进行处理和分析。然而,仅仅是它们的大小就使得这种处理非常具有挑战性。特别是,为处理中等规模的数据集而开发的经典算法和技术,在面对如此大的数据集时往往需要超出常规的时间和空间。此外,在某些情况下,存储整个数据集甚至是不可行的,因此,必须在数据集的各个部分对其进行处理,然后很快丢弃每部分。 上述挑战推动了加工处理 大数据 (海量数据)的新工具和新技术的发展。在本书中,我们对这项工作采取了计算机科学理论的观点。特别是,我们将研究旨在捕捉 大数据 计算带来的挑战的计算模型,以及为应对这些挑战而开发的实际解决方案的特性。我们将通过调查
本书由浅入深、循序渐进地介绍多孔材料中波的传播及声学建模的理论和方法。首先讨论平面波在介质中传播的本质,基于线弹性理论通过应力-应变关系建立控制声传播的基本方程;用流体等效的办法介绍声阻抗的计算方法,并引入到声音在多孔材料中的传播;然后介绍多孔材料中几种简化的声学模型,进而重点介绍多孔弹性介质中声传播的Biot理论,阐述多孔弹性材料中存在的三种波,以及建立的动力学方程和波动方程;最后重点介绍传递矩阵法对多层多孔材料系统的建模,并以此进行声学指标的计算,同时介绍传递矩阵在预测声学包吸收和传输损失方面的应用。
本书是华为 HCIA-openGauss 认证考试的官方教材。本书首先对 openGauss 数据库进行概述;其次介绍了 openGauss 的体系架构及关键特性;接着讲解了 openGauss 数据库安装部署的过程,并对 openGauss数据库及核心对象进行了详细说明;还介绍了 SQL 基础,其中包括 SQL 操作符、常用函数和语法分类等;最后介绍了华为云数据库GaussDB(for openGauss)及其应用场景。除了有全面的知识讲解,本书还有综合案例,通过理论与案例结合,帮助开发者快速掌握 openGauss 数据库的开发技能。 本书不仅适合备考 HCIA-openGauss 认证的人员和从事软件开发工作的专业人员阅读,还适合高等院校相关专业的学生、准备投身数据库领域的人员及网络技术爱好者阅读。
本书共23章,包括MySQL 8基本内容、MySQL 8扩展内容、MySQL 8综合设计和流行平台开发MySQL 8应用等。MySQL 8基本内容包括安装、运行和基本工具,数据库、字符集和存储引擎,数据类型,表结构设计,表记录操作,分区、表空间和行格式,运算符、表达式和系统函数,查询、视图和索引,过程式对象程序设计,用户与权限,系统管理等。MySQL 8扩展内容包括数据安全、云数据库、数据复制、集群:NDB Cluster和NoSQL等。MySQL 8综合设计包括各流行平台共用的数据库综合实例设计,涉及数据库设计、表结构设计、视图设计、触发器设计、存储过程和自定义函数设计、事件设计、角色和用户权限设计等,在此基础上对数据库实例各对象采用样本数据进行测试。流行平台开发MySQL 8应用涉及PHP、Vue/ElementUI Spring Boot MyBatis、Android、WebService、Visual C#、Qt Python等平台,以网上商城不同应用
本书全面记载了21世纪初20年国家气象中心(中央气象台)的事业发展历程。系统总结了天气预报、数值预报、气象服务、气象信息化等业务和相关技术的进步与成就,以及科技与人才、国际交流、精神文明建设等方面的发展变化,展望了在全面建设社会主义现代化强国的新征程上,国家气象中心(中央气象台)事业高质量发展的主要方向与基本途径。本书是非常有价值的珍贵史料。本书内容全面、客观,图文并茂、通俗易懂,适合气象部门各级领导和专业技术人员、气象行业和交叉领域专业人士以及相关大专院校师生阅读和参考,也可作为各级 了解新世纪以来气象预报事业发展进步的参考书籍。
本书是以给广大量化研究者建立一个一般性的量化研究流程(主要是量化策略开发,也包括其他量化研究)为主旨来展开编写的。全部章节以流程化的形式展开,从量化研究的数据开始到终以交易结束。数据库、指标库、算法库、工具库、可视化库、报告和日常工作系统、交易系统这7个核心库/系统分别解决了量化研究中某一个环节的问题。量化研究是以上述7个核心库/系统所代表环节的一个循环,在这个循环中不断进行的改进和研究。它将数据和思想相结合,通过交易来检验研究成果是否达到预期,然后改进思想和更换数据,并投入下一次交易中。这样的循环使得每一次量化研究都更加接近理想效果。而在循环的每一个环节上,本书给出了一系列工具、算法、技术等来支撑各个核心库/系统的功能。本书在编程语言上以Matlab和Python为主,数据库一章用到了MySQL的基
数据包络分析(DEA)方法是一种应用广泛的效率评价方法。本书结合作者近年来的研究成果,将数据包络分析方法进行扩展与集成,使之成为一种开展系统综合评价的有效方法。本书重点介绍DEA公共权重配置和DMU完全排序方法、DEA中DMU结构分析和效率分解方法、不确定信息条件下的鲁棒DEA方法、径向和非径向DEA集成效率测度方法、基于DEA的资源配置和目标分解方法等DEA领域的前沿建模方法。同时本书还介绍了DEA方法在能源与环境绩效评价、银行和供应链效率分析中的应用。
结构化表征学习是机器学习研究的核心问题之一,旨在探索如何从高维可观测数据中获取有效的结构化信息表示,以实现高精度、鲁棒、快速的数据分析,是由数据到知识的关键渠道。本书重点介绍如何从具有不确定性的海量大媒体数据中挖掘和提取结构化、鲁棒、高效的特征,并实现高性能的信息挖掘和知识推断。本书内容包含近年来涌现的一些高效、鲁棒的结构化表征学习模型,介绍了基于鲁棒且紧凑的表征学习的一体化表征学习理论和方法,并为应对真实世界中的数据分析任务,如数据简约特征表达、紧凑特征压缩、有效特征筛选以及隐含知识挖掘等,提供了较为全面且切实可靠的解决方案。 本书作者所在的团队多年来一直从事机器学习、计算机视觉、多媒体分析的研究,承担过众多和省部级科研项目,具备从理论研究到工程应用的相关基础。本书是对作者
本书按照需求规划、需求实现、可视化的流程进行编排,通过项目开发的主要流程,介绍数据仓库的搭建过程。在整个数据仓库的搭建过程中,本书介绍了主要组件的安装部署、需求实现的具体思路,以及各种问题的解决方案等,并在其中穿插了许多与大数据和数据仓库相关的理论知识,包括数据仓库的概念、电商业务概述、数据仓库理论和数据仓库建模等。 本书共14章,其中,第1~3章是项目的前期准备阶段,主要介绍了数据仓库的概念和搭建需求,并初步搭建了本数据仓库项目所需的基本环境;第4~7章是项目的核心部分,详细介绍了数据仓库的建模理论,并完成了数据从采集到分层搭建的全过程,是本书的重点部分;第8~14章是对数据治理各功能模块的实现,针对数据治理的不同功能需求分模块进行实现。 本书适合具有一定编程基础并对大数据感兴趣的读者
随着数字经济的发展,大数据应用范围越来越广泛,各类大数据平台承载着海量的数据资源。大量敏感资源和重要数据要赋能数字经济的发展,可信安全地利用大数据极其重要。《大数据可信计算》汇集了作者及其研究团队的研究成果,介绍了大数据可信计算的体系及其关键技术以及相应平台系统的设计与实现,主要内容包括原位虚拟大数据中心平台体系、大数据感知与勘探技术、多源多维数据融合计算技术、基于多模型融合的信用评估技术、大数据安全的测试与评估技术、原位虚拟大数据中心平台系统、基于区块链的大数据共享与协作系统、可信金融交易风险防控系统。
利用新一代信息通信技术建立高效的灾害管理和应急处理平台是智慧城市的关键组成部分之一。新一代信息通信技术在灾害预防、救灾和灾后重建的过程中,发挥了重要的作用,不断推动着灾害应急管理走向科学化、精准化和智慧化。本书主要介绍大数据在灾害应急管理中的应用,首先介绍灾害、灾害应急管理以及灾害大数据的相关知识,其次介绍灾害大数据的定向爬取技术和自动摘要技术,然后以地震大数据为例介绍大数据分析技术,接着介绍了灾害现场数据的采集与传输技术,后介绍应急疏散路径规划和应急救援系统。