内容简介 这是一本能为数字化转型企业的数据治理提供全面指导的著作。拥有集团官方出品,得到了用友集团董事长王文京、DAMA中国区主席汪广盛等9位企业界和学术界数字化专家的一致好评 它基于国际主流的数据治理框架和用友多年的数据治理经验,从道、法、术、器4个维度全面、深入展开,不仅有数据治理在战略层面的顶层设计,还有数据治理在执行层面的实施方法,既可以作为数据治理的纲领性指南,又可作为数据治理的实操手册。 从数据治理的战略规划到落地实施,本书将各环节的核心内容凝练为 3 个战略机制、8 项关键举措、7 种技术能力、7 个治理工具 : 数据治理之道:3个战略机制 高屋建瓴地介绍了数据治理的数据战略、组织机制和数据文化。这3个机制能够帮助企业形成数据治理的自我驱动、自我进化、可持续发展和长效运营机制。 数据治理之
《数据库系统概念》是数据库系统方面的经典教材之一,其内容由浅入深,既包含数据库系统基本概念,又反映数据库技术新进展。本书基于该书第7版进行改编,保留其中的基本内容,压缩或删除了一些高级内容,更加适合作为国内高校计算机及相关专业本科生数据库课程教材。
本书从ChatGPT的基础原理讲起,逐步深入ChatGPT的基础使用和插件功能,并结合各种数据分析实战案例,重点介绍了ChatGPT在各种数据分析场景中的应用方法,让读者不但可以系统地学习ChatGPT相关知识,而且能对ChatGPT在数据分析中的实战应用有更为深入的理解。本书分为12章,涵盖的主要内容有:ChatGPT简介与基本原理;ChatGPT使用方法;ChatGPT插件应用;ChatGPT构建指标体系、ChatGPT 数据采集与清洗、ChatGPT探索性数据分析和可视化、ChatGPT推断性统计分析、ChatGPT预测分析、ChatGPT文本分析、ChatGPT分类和聚类分析、ChatGPT推荐算法、ChatGPT行业数据分析等的应用方法和实战项目案例。 本书内容通俗易懂、案例丰富、实用性强,特别适合对数据分析和人工智能感兴趣的读者,包括但不限于数据分析师、数据科学家、数据工程师、有数据分析需求的业务人员、研究人员、学生
在数字中国这一国家战略的牵引下,数据要素和数字化转型的研究和落地如火如荼。数据中台是企业开展数据要素相关实践和数字化转型的关键基础设施,本书在这样的时代背景下,以帮助企业 管好数据、用好数据 为宗旨,内容围绕数据中台架构与建设方法论、数据中台建设流程和内容、数据中台工程化交付、数据中台行业解决方案4个维度全面、深度展开。 本书一共17章,逻辑上分为四个部分: 第1部分 数据中台建设方法与架构设计(第1~3章) 首先,从产生、定义、认知、相关概念、建设方法论、架构等方面对数据中台进行了全面介绍,帮助读者建立对数据中台的清晰认识和理解,熟悉数据中台的建设机制;然后,总结了企业数据应用成熟度评估、数据中台在各个行业的应用场景,以及数据中台的成功要素。 第2部分 数据中台建设内容与运营方法(第4~10章)
本书主要介绍从高维数据中感知、处理、分析和学习低维结构的基本数学原理和高效计算方法,系统地归纳了建模高维空间中低维结构的数学原理,梳理了处理高维数据模型的可扩展高效计算方法,阐明了如何结合领域具体知识或考虑其他非理想因素来正确建模并成功解决真实世界中的应用问题。本书包括基本原理、计算方法和真实应用三个部分:基本原理部分系统地介绍稀疏、低秩和一般低维模型的基本性质和理论结果,计算方法部分介绍解决凸优化和非凸优化问题的有效算法,真实应用部分通过实例演示利用前两部分的知识改进高维数据处理和分析问题的解决方案。本书适合作为计算机科学、数据科学和电气工程专业的高年级本科生和研究生的教材,也适合学习稀疏性、低维结构和高维数据课程的学生参考。
本书从Power BI的基础功能讲起,逐步深入到Power BI进阶实战,以系统化的实操步骤和丰富的实际案例让读者快速入门Power BI数据分析,掌握Power BI在多个业务领域的实际应用。全书共8章:商业智能与数据分析概述;Power BI简介;数据分析与可视化制作全过程;Power BI数据预处理;Power BI数据建模;Power BI数据可视化;Power BI在线服务;Power BI数据分析实战案例。 本书通俗易懂、循序渐进、内容全面、讲解详细,配备全套数据集、教学课件和学习视频,既适合读者自学Power BI数据分析与可视化,也适合大专院校作为教材,更适合从事销售、产品、电商运营、仓储物流、财务管理、人力资源等岗位的职场人士提升技能。
基于内存的Redis数据库日趋红火,广受程序员关注。本书将以Redis6.2.0版本作为主讲版本,同时单独测试了Redis7.0.0版本新赠的主要功能。本书主要内容分基础篇、提高篇、实战篇,由浅入深、层层递进地进行介绍。基础篇重点介绍Redis的基础命令;提高篇主要介绍磁盘持久化、主从复制、分布式集群、事务、Lua脚本、管道、缓存、发布、订阅、Redis Stream消息队列、I/O线程、安全等各种高级技术;实战篇则介绍编程语言Java、Python、C、GO、PHP调用、大规模应用案例、实用辅助工具、电商应用实战案例。本书提供习题、实验及相关配套内容,即可供高校教学使用,又可供IT工程师自学使用。
本书以数字孪生在数据中心的应用为主题,从采用的方案、遇到的问题、解决的方法及对未来的思考等全面介绍技术实践的细节。本书共分为5章:第1章介绍数字孪生相关的知识和应用场景;第2章主要阐述数字孪生在数据中心的应用和数据中心的行业知识;第3~5章篇幅较多,主要介绍数字孪生使用的技术,并配套完整的项目代码,其中第3章介绍数据分析算法相关的技术知识,第4、5章阐述3D可视化框架ThreeJS相关的知识。 本书适合对数字孪生有兴趣的技术团队、开发和研究人员阅读。
《数据库系统概念》是数据库系统方面的经典教材之一,其内容由浅入深,既包含数据库系统基本概念,又反映数据库技术新进展。它被国际上许多大学所采用,包括斯坦福大学、耶鲁大学、得克萨斯大学、康奈尔大学、伊利诺伊大学等。
这是一本能指导企业在数字化转型和数据要素时代通过数据架构用好数据、管好数据、充分发挥数据价值的著作。 从0到1讲解了数据架构的技术栈、方法论与落地实践,揭示了数据架构的底层逻辑,总结了数据架构的核心要素和架构模型,阐述了数据治理、数据资产管理以及数据平台的搭建等全方位的内容,是作者10余年数据工作经验的总结。 本书主要分为五部分: 第一部分:架构基础,对企业架构的组成要素以及流行的企业架构框架进行了总览性质的介绍,数据架构是重点; 第二部分:数据架构基础,详细讲解了数据架构的组成、数据存储、数据调度与消息传输、Lambda架构和Kappa架构以及数据架构的辅助资源组件; 第三部分:数据架构模型,首先介绍了企业内部数据区的划分与内部数据的流向,然后讲解了数据模型的建模策略、步骤和方法,以及维度建模
全书共15个章节,包括Oracle系统、管理以及运维相关知识,内容包括oracle体系结构、数据库实例、存储结构、数据字典与动态性能视图、Oracle监控、数据库备份、数据库恢复、闪回技术以及数据库优化等;包括20个完整的项目案例。书中案例侧重应用性、趣味性强、分布合理、通俗易懂,使读者能够快速掌握Oracle系统、管理以及运维方面的的基础知识、方法、工具以及技巧。本书附有教学视频、课件、教学大纲、电子教案、教学日历、习题答案、案例源码等配套资源,可以作为大学计算机及相关专业的教材,也可以作为Oracle技术的培训教材。
【为宏观掌握Oracle基础(第1~3章)】,介绍了进程管理、内存管理及存储等基础知识,并且讲解了常用Linux操作系统性能工具的使用及结果分析方法,旨在帮助读者了从宏观视角掌握Oracle数据库体系架构和进程组织方案。【微观理解Oracle原理(第4~8章)】,围绕Oracle内部运行原理展开讲解。首先,在Oracle数据结构的基础上讨论日志和回滚。其次,引入了排队论和排队系统中的概念,对比法讲解了Oracle的数据缓冲区高速缓存和共享池设计思想及运行原理。【串联Oracle运行流程(第9~11章)】,结合实践案例将从提交SQL至结果返回的整个过程串起来,首先总结归纳了Oracle算法和数据结构的重要知识点,打通了Oracle原理与数据结构之间的桥梁。其次,通过典型案例讲解AWR报告,让读者能够了解完整的Oracle诊断思路。再次,介绍了集群技术、Oracle RAC及其日志结构。然后,对Or
本书是数据治理领域公认的标准性著作,能为各种类型企业和机构的数据治理提供全面指导。用友集团官方出品,得到了用友集团董事长王文京、DAMA中国区主席汪广盛等9位企业界和学术界数字化专家的一致好评,同时也被中国数据要素高层次人才发展大会(DGBOK)作为指定教材。 它基于国际主流的数据治理框架和用友多年的数据治理经验,从道、法、术、器4个维度全面、深入展开,不仅有数据治理在战略层面的顶层设计,还有数据治理在执行层面的实施方法,既可以作为数据治理的纲领性指南,又可作为数据治理的实操手册。 从数据治理的战略规划到落地实施,本书将各环节的核心内容凝练为 3 个战略机制、8 项关键举措、7 种技术能力、7 个治理工具 : 数据治理之道:3个战略机制 高屋建瓴地介绍了数据治理的数据战略、组织机制和数据文化。这3个机制
在数据湖仓的所有新增要素中,排名的就是可以利于数据分析和机器学习所用的分析基础设施。分析基础设施包括一众大家广为熟悉的东西,当然也包括一些可能对大家还有些陌生或略带新鲜感的概念。比如包括:元数据、数据血缘、 数据体量的度量 、数据创建的历史记录、数据转换描述。 数据湖仓的第二个新增要素,是识别和使用通用连接器。通用连接器允许合并和比较所有不同来源的数据。如果没有通用连接器,就很难(实际上是几乎不可能)将数据湖仓中的不同数据关联起来。但有了这个中西,就可以关联任何类型的数据。 使用数据湖仓,就有可能实现以往任何其它方式都不可行或不可能实现的某种程度的数据分析和机器学习。 但与其它架构一样,我们需要理解数据湖仓的架构以及它的能力,以便于我们基于这种架构创建数据分析蓝图和开展数据分析规
本书是一本系统介绍Clickhouse的指导型工具书,全书总共分为11章: 第1章 介绍ClickHouse的由来、发展历程、核心特点与核心特点。第2~6章 介绍了ClickHouse基础使用部分,包括整体架构、如何安装、数据定义、数据引擎、数据查询和函数的特性和使用方法。第7~9章介绍了ClickHouse高级特性部分,包括数据库管理操作,数据分片、数据副本和高可用的特性和使用方法。第10~11章介绍了如果自己手动实现ClickHouse中间件的思路和示例,同时也介绍了几款可视化工具与ClickHouse集成的方法。
本书对运维数据治理的概念、知识体系和底层逻辑进行了深入剖析,构建了面向运维数据特点的数据治理方法和框架。本书分为概念篇、方法篇、实施篇和案例篇,从指标体系构建、运维数据资产化、元数据管理、数据安全、数据质量、数据标准化等角度,系统阐述了开展运维数据治理的方法,以及运维数据治理平台应具备的关键能力,并介绍了构建运维数据平台相关的采集、存储、处理、计算、管理、服务、监控、消费等各方面的技术实现手段和方法。本书适合政府和企业的信息化负责人、CIO、运维主管、软件研发负责人等阅读。
随着数据被纳入第五生产要素,数据治理已成为推动社会治理进程的重要动力,也是实现高质量数字化转型的重要基础。财务部门是企业的 数据中枢 ,汇聚企业从前端业务到后端财务管理的大量数据,因此在众多企业中,财务数据成了企业整体数据治理落地实践的** 试验基地 。 财务数据治理指从财务视角出发,以资产、负债、所有者权益、收入、费用和利润的会计六要素为核心关联数据,通过一系列与信息相关联的过程来确保决策权和职责分工系统的实现。 财务数据治理的终目标是提升财务相关数据的价值。财务数据治理非常有必要,它是企业实现数字战略的基础,是一个管理体系,包括组织、制度、流程和工具。 这本书将数据治理理论应用于财务管理实践,针对财务工作场景阐释数据治理方法论,总结财务数据管理的六大常见问题,分析五大财务数据问题场
本书详细介绍Proxmox VE。Proxmox VE是一个完整的企业虚拟化开源平台,具有去中心化的超融合特性。Proxmox VE与前端负载均衡整合,可实现关键应用的高可用性。 全书共15章,大致可分为几个部分:第1章和第2章为概述部分,主要介绍Proxmox VE的基本特性及功能;第3~6章为基础部分,总览Proxmox VE部署、简单管理等操作;第7~10章为项目实战,也是本书的精华部分,介绍不同场景下如何规划、实施Proxmox VE;第11章和第12章为Proxmox VE 投入生产以后所需进行的日常工作,包括日常管理及平台升级;第13~15章为扩展部分,主要介绍以在线方式迁移其他系统到Proxmox VE平台、以Proxmox VE做底层实现桌面云,以及使用过程中一些问题的汇总。 本书适合有一定Linux基础并且正在从事系统运维的技术人员、计算机专业学生、高可用系统架构研究者阅读。
本书是一部通过提供一套易于遵守及操作的方法论来实现高质量数据管理的实践指南。内容 全面、详细,并有许多实用的建议和模板,第1版推出后,已成为全球信息质量实践者的书 籍,甚至已成为美国阿肯色大学信息质量研究生项目的教科书。 本书共7章,内容包括数据质量和依赖于数据的世界、数据质量实践、关键概念、十步法流 程、设计项目结构、其他技巧和工具,以及写在最后的话。 作者将信息质量的概念框架与改善信息质量的技术、工具、操作指南相结合,提出并详细描 述了获取高质量数据和可信信息的十步法。作为本书的最新改版,作者进一步阐明并更新了流程 步骤和支持模板,整合了一些有价值的示例和案例,说明了近些年技术和数据生产的演变。 本书内容丰富,理论和实践相结合,易读性和可操作性强,可以作为数据质量管理的入门和 进阶用
本书全面介绍了预测性分析相关方法,不仅直观地阐述了相关概念,还给出了现实的示例问题和真实的案例研究 包括从失败项目获得的经验教训。 本书理论和实践内容相对平衡,便于读者加深理解。 全书共9章,外加一个附录。 第1章为分析导论, 第2章为预测性分析和数据挖掘导论, 第3章介绍预测性分析的标准流程, 第4章介绍预测性分析的数据和方法, 第5章介绍预测性分析算法, 第6章探讨预测性建模中的高阶主题, 第7章介绍文本分析、主题建模和情感分析, 第8章介绍预测性分析使用的大数据, 第9章介绍深度学习和认知计算, 附录展望了商业分析和数据科学工具的前景。 本书适合计算机科学、数据科学和商业分析领域的相关从业人员阅读。
本书由国内资深MySQL专家亲自执笔,国内外多位数据库专家联袂推荐。作为国内一本关于InnoDB的专著,本书的第1版广受好评,第2版不仅针对 新的MySQL 5.6对相关内容进行了全面的补充,而且还根据广大读者的反馈意见对第1版中存在的不足进行了完善,全书大约重写了50%的内容。本书从源代码的角度深度解析了InnoDB的体系结构、实现原理、工作机制,并给出了大量 佳实践,能帮助你系统而深入地掌握InnoDB,更重要的是,它能为你设计管理高性能、高可用的数据库系统提供 的指导。 全书一共10章,首先宏观地介绍了MySQL的体系结构和各种常见的存储引擎以及它们之间的比较;接着以InnoDB的内部实现为切入点,逐一详细讲解了InnoDB存储引擎内部的各个功能模块的实现原理,包括InnoDB存储引擎的体系结构、内存中的数据结构、基于InnoDB存储引擎的表和页的物理存储、索
教材系统地介绍文本数据挖掘的相关概念,利用Python作为工具进行相关试验,其内容主要包括:文本挖掘产生的背景及发展;文本挖掘的概念、文本模型表示、文本内容的预处理,包括分词、去停用词以及特征抽取;文本相似度的概念等。介绍文本分类的概念及常用方法,如KNN算法、SVM算法等,并对分类结果进行评价;在介绍文本聚类聚类的概念时是,同样介绍聚类常用算法,如K均值算法、层次聚类法、密度聚类法等,作为有文本分类、文本聚类的应用,*后给出了信息抽取、社会网络中的实体关系抽取和事件抽取。
本书系统讲述数据仓库的基本概念、基本原理以及建立数据仓库的方法和过程。主要内容包括:决策支持系统的发展、数据仓库环境结构、数据仓库设计、数据仓库粒度划分、数据仓库技术、分布式数据仓库、ElS系统和数据仓库的关系,外部和非结构化数据与数据仓库的关系、数据装载问题、数据仓库与Web、ERP与数据仓库以及数据仓库设计的复查要目。 本书是数据仓库之父撰写的关于数据仓库的 权威著作,既可作为相关专业的研究生教材,也是数据仓库的研究、开发和管理人员的指南。
点云库(Point Cloud Library, PCL)是在吸收了点云相关研究基础上建立起来的跨平台开源库,可在Windows、 Linux、 Android、 Mac OS X,以及大部分嵌入式实时系统上运行,目前已经得到了广泛应用。本书为应用点云库技术的指导图书,旨在帮助读者对其以快速、有效的方式上手操作并实际应用,*大限度地节省读者的入门与技术提升时间。书中首先介绍了三维点云处理的相关理论知识,之后则重点从实际的点云处理功能模块出发,通过大量具体的实践案例介绍如何使用该项技术解决实际问题。 本书可作为计算机图形学、机器人、遥感测量、虚拟现实、人机交互、CAD/CAM逆向工程等领域的科研人员进行产品开发、科研项目、课题项目时的参考指南,也可作为大中专院校及培训班相关专业师生的学习手册。