《DAMA数据管理知识体系指南(第2版修订版)》是在DMBOK1和DMBOK2的基础上进行的第三次修订,是DAMA国际对过去30多年数据管理领域领域知识和实践的总结,是一部数据管理基础工具书。本书从数据处理道德规范、数据治理、数据架构、数据建模和设计、数据存储和操作、数据安全、数据集成和互操作性、文档和内容管理、参考数据和主数据、数据仓库和商业智能、元数据管理、数据质量管理、大数据数据科学、数据管理成熟度评估、数据管理组织和角色期望、数据管理和组织变革管理等方面对数据管理知识体系进行了系统介绍,并描述如何在数据管理功能领域中应用这些原则。
《深入浅出数据分析》以类似 章回小说 的活泼形式,生动地向读者展现优秀的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、关系数据库、数据整理技巧;正文之后,意犹未尽地以三篇附录介绍数据分析十大要诀、R工具及ToolPak工具,在充分展现目标知识以外,为读者搭建了走向深入研究的桥梁。 本书通过精心设计的实践场景,让读者不由自主地代入角色当中,真正在体验中学习、思考,将数据分析的要点融化于心,自如地应用在工作和生活中。
一本书如果没有作者自己的观点,而只是知识的堆叠,那么这类书是没有太大价值的。尤其在当前网络发达的时代,几乎任何概念和知识点都可以从网络上查到。但是有一点你很难查到,那就是统计分析的思路和观点。比如,你可以很容易地在网上查到什么是线性回归,但你却查不到怎么 做 线性回归分析,在你遇到实际数据时仍然不知道如何分析。在《白话统计》中,你可以获得这些思路和观点。尽管这些观点未必是所有人都认可的,但根据笔者多年的分析经验,它们在实践中通常是奏效的。《白话统计》凝结了作者十多年来对统计分析的理解,对各种方法的介绍采用全新的理念和思路,不再是介绍方法本身,而是试图将各种方法之间的联系阐述清楚;不再是介绍方法如何计算出结果,而是尽量说明方法背后的思想。当然,本书同时提供了如何实现结果的软件(
内容简介 这是一本能为数字化转型企业的数据治理提供全面指导的著作。拥有集团官方出品,得到了用友集团董事长王文京、DAMA中国区主席汪广盛等9位企业界和学术界数字化专家的一致好评 它基于国际主流的数据治理框架和用友多年的数据治理经验,从道、法、术、器4个维度全面、深入展开,不仅有数据治理在战略层面的顶层设计,还有数据治理在执行层面的实施方法,既可以作为数据治理的纲领性指南,又可作为数据治理的实操手册。 从数据治理的战略规划到落地实施,本书将各环节的核心内容凝练为 3 个战略机制、8 项关键举措、7 种技术能力、7 个治理工具 : 数据治理之道:3个战略机制 高屋建瓴地介绍了数据治理的数据战略、组织机制和数据文化。这3个机制能够帮助企业形成数据治理的自我驱动、自我进化、可持续发展和长效运营机制。 数据治理之
本书是国际数据管理协会(DAMA国际)组织众多国际专家对过去30多年数据管理领域知识和实践的总结,是市场上综合了数据管理方方面面的一部具有性的基础工具书。从数据治理、数据架构、数据质量、数据安全、主数据管理、参考数据管理、元数据管理、商务智能和数据参考管理、数据建模设计、数据存储和操作、数据集成和互操作、文档和内容管理、大数据、数据管理人员的道德要求等方面介绍了数据管理的知识体系。
在数字中国这一国家战略的牵引下,数据要素和数字化转型的研究和落地如火如荼。数据中台是企业开展数据要素相关实践和数字化转型的关键基础设施,本书在这样的时代背景下,以帮助企业 管好数据、用好数据 为宗旨,内容围绕数据中台架构与建设方法论、数据中台建设流程和内容、数据中台工程化交付、数据中台行业解决方案4个维度全面、深度展开。 本书一共17章,逻辑上分为四个部分: 第1部分 数据中台建设方法与架构设计(第1~3章) 首先,从产生、定义、认知、相关概念、建设方法论、架构等方面对数据中台进行了全面介绍,帮助读者建立对数据中台的清晰认识和理解,熟悉数据中台的建设机制;然后,总结了企业数据应用成熟度评估、数据中台在各个行业的应用场景,以及数据中台的成功要素。 第2部分 数据中台建设内容与运营方法(第4~10章)
本书是一本基于 Python 实现全部例题计算的统计学教材,书中例题解答均给出了详细的实现代码和结果。全书共 11 章,第1章和第2章介绍数据、Python 的下载与安装、Python的数据类型和基本操作、Python 绘图基础等。第3章和第4章介绍数据的描述性分析方法,包括数据可视化和描述统计量。第5~7章介绍数据的推断性分析方法,包括概率分布、参数估计和假设检验。第8~11章介绍实际中常用的一些统计方法,包括类别变量分析、方差分析、回归分析、时间序列分析等。 本书可作为高等院校各专业开设统计学课程的教材,也可作为数据分析工作者、Python 数据分析和可视化爱好者的参考书。
本书从Power BI的基础功能讲起,逐步深入到Power BI进阶实战,以系统化的实操步骤和丰富的实际案例让读者快速入门Power BI数据分析,掌握Power BI在多个业务领域的实际应用。全书共8章:商业智能与数据分析概述;Power BI简介;数据分析与可视化制作全过程;Power BI数据预处理;Power BI数据建模;Power BI数据可视化;Power BI在线服务;Power BI数据分析实战案例。 本书通俗易懂、循序渐进、内容全面、讲解详细,配备全套数据集、教学课件和学习视频,既适合读者自学Power BI数据分析与可视化,也适合大专院校作为教材,更适合从事销售、产品、电商运营、仓储物流、财务管理、人力资源等岗位的职场人士提升技能。
首席数据官(Chief Data Officer,CDO)是数字时代的产物,它在数字化转型的过程中,以及在转型成功后的数字经济中,都会起到关键作用。本书旨在建立一套相对完整的关于首席数据官的知识体系,帮助读者更好地参与数字时代的发展。 本书分为5篇。 第一篇 CDO概论 介绍CDO产生的背景、发展趋势、主要职责、技能和工作路径等。 第二篇 管好数据 讲解CDO如何管理好数据,涉及数据战略、数据治理、数据制度、数据标准、数据架构、数据质量、数据安全、数据合规、数据建模、数据集成、数据存储、数据分析和挖掘、数据伦理、数据开放与共享等。 第三篇 做好转型 讲解CDO如何做好数字化转型。 第四篇 建好团队 讲解CDO如何构建、领导和考核数据团队。 第五篇 新技术、新模式、新业态 介绍一些与数据及CDO相关的新技术、新模式和新业态。
《数据库系统概念》是数据库系统方面的经典教材之一,其内容由浅入深,既包含数据库系统基本概念,又反映数据库技术新进展。它被国际上许多大学所采用,包括斯坦福大学、耶鲁大学、得克萨斯大学、康奈尔大学、伊利诺伊大学等。
大模型在众多领域得到了广泛应用,促进了AI技术的整合和创新。然而,在实际应用过程中,直接将大模型应用于特定行业常常难以达到预期效果。本书详细阐述如何在游戏经营分析场景中利用大模型实现数据体系的建设。 本书分为6个部分,共16章。第1部分主要介绍大模型技术的发展与应用,从大模型的发展现状展开,重点介绍大模型与数据体系的相关知识。第2部分主要介绍大模型下的关键基础设施,涵盖湖仓一体引擎、湖仓的关键技术、实时数据写入和高效数据分析等内容。第3部分主要介绍大模型下的数据资产,围绕数据资产重塑、数据资产标准、数据资产建设、数据资产运营展开。第4部分主要介绍自研领域大模型的技术原理,涵盖领域大模型的基础、需求理解算法、需求匹配算法、需求转译算法等内容。第5部分主要介绍大模型的工程化原理,涉及工程化的
《数据库系统概念》是数据库系统方面的经典教材之一,其内容由浅入深,既包含数据库系统基本概念,又反映数据库技术新进展。本书基于该书第7版进行改编,保留其中的基本内容,压缩或删除了一些高级内容,更加适合作为国内高校计算机及相关专业本科生数据库课程教材。
内容简介商业分析有用吗?当然有用!商业分析是行走职场、创业启航的一项技能。 作者结合自己多年的工作经验,用生动的语言介绍如何用数据分析解决商业问题。 本书分为6 篇,共17 章,其中第1 篇是概念篇,讲述商业分析的基本概念;第2 篇是基础篇,讲述如何用基础的分析方法评估企业经营状况;第3 篇是进阶篇,讲述如何构建分析体系解决较复杂的问题;第4 篇是高阶篇,讲述如何应对复杂的商业难题;第5 篇是基础实践篇,通过案例讲述如何解决更复杂的商业问题;第6 篇是高阶实践篇,通过案例讲述如何解决商业分析中的疑难杂症。 本书的讲解思路是层层递进的,从简单场景到复杂场景,从基础的方法到复杂的方法。因此,无论读者是否有数据分析基础和经验,都建议从头开始阅读,这样可以一步步提升认知,更快地掌握商业分析的方法。
本书是热销书《SQL基础教程》的作者MICK为志在向中级进阶的数据库工程师编写的一本SQL技能提升指南。全书可分为两大部分。部分介绍了SQL语言不同寻常的使用技巧,带领读者重新认识CASE表达式、窗口函数、自连接、EXISTS谓词、HAVING子句、外连接、行间比较、集合运算、数列处理等SQL常用技术,发掘它们的新用法。这部分不仅穿插讲解了这些技巧背后的逻辑和相关知识,而且辅以丰富的示例程序,旨在帮助读者从面向过程的思维方式转换为面向集合的思维方式。第二部分介绍了关系数据库的发展史,并从集合论和逻辑学的角度讲述了SQL和关系模型的理论基础,旨在帮助读者加深对SQL语言和关系数据库的理解。此外,本书很多节的末尾设置有练习题,并在书末提供了解答,方便读者检验自己对书中知识点的掌握程度。
本书提供了关于如何在数据治理中建立和运行数据认责工作的适用且可操作的信息和说明,旨在为新任数据专员或数据治理经理提供在数据认责方面所需的知识,以确保其工作有效和高效。本书分为11章,包括:数据认责和数据治理:二者如何结合;了解数据认责的类型;认责管理的角色和职责;实施数据认责;培训业务型数据专员;数据认责实践;数据专员的重要角色;衡量数据认责进度:指标;数据认责成熟度评估;大数据和数据湖认责;基于数据域开展数据治理和认责。 本书内容丰富,理论和实践相结合,易读性和可操作性强,可以作为数据质量管理的入门和进阶用书,还可作为数据治理、信息技术、数据分析等领域人员的参考用书,尤其适合对数据认责感兴趣的读者和负责组织以及运行数据认责工作的人员阅读。
本书是一本全面关注工业企业数据治理方面的工具书,主要内容分为概述篇、体系篇、工具篇、实施篇及案例篇。其中概述篇主要介绍工业企业数据治理的基础概念、主流数据治理标准及框架、数据治理的发展趋势等;体系篇主要介绍数据管控、数据战略、数据架构、主数据管理等的基本原理与管理体系;工具篇主要介绍主数据管理工具、数据模型管理工具、数据资产运营工具等;实施篇主要介绍具体实施策略及路径选择、顶层架构规划与设计、数据资产运营实施等;案例篇主要介绍电力、能源化工、钢铁、制造、战略投资等行业的数据治理案例,为读者提供专业、丰富、可信的数据治理实施范例。本书是工业大数据应用技术国家工程实验室多年潜心研究的重要科研成果的总结和凝聚,既具有理论高度,也具备面向中国工业企业的可实操性。参与本书编著的作者均
本书系统论述了图数据库的理论知识与行业应用实践。本书分为理论篇和实践篇,共15章。其中,理论篇包括第1~8章,由浅入深地介绍了图数据库的概念和底层技术原理,涵盖主流图数据库的内核原理与架构设计、图查询语言、图算法 、图数据库客户端编程、图数据库服务端编程、图可视化、图数据库选型等内容;实践篇包括第9~15章,介绍了图数据库的行业应用案例,涵盖知识图谱、金融、泛政府、零售、制造业供应链管理、企业资产管理、生命科学等内容,通过这些案例,进一步启发读者深入思考和挖掘潜在的应用场景。针对行业案例,本书免费提供详尽的源代码,以便读者动手实践。 本书适合数据库应用开发人员、数据库管理人员、数据科学家以及负责数据库选型的技术专家阅读,也适合高等院校数据库专业的高年级本科生和研究生参考。
内容简介这是一部立足于当下行业实践和政策指引,从工作程序和实体法律角度,对企业数据资产入表的基本内涵、具体流程、数据交易与入表工作的合规要点进行分析归纳的专著,旨在通过深入浅出的分析帮助读者实现在数据交易、数据资产入表领域的快速认知同步。作者曾经在金融监管部门、金融机构和头部互联网平台工作,是国内较早开展数据领域法律实践的律师,曾经为众多企业在场内进行数据交易的产品提供合规评估,为多个大型数据平台企业和金融机构提供数据合规、金融科技的法律服务,包括个人信息合规自评估、证券业跨行业数据共享监管沙盒项目、垂类大模型合规项目等,具有丰富的法律实践和研究深度、广度。全书共12章,主要内容如下:第1和2章 数据要素市场与数据资产入表的内涵介绍首先,从数据要素市场出发对国家层面的政策和法律沿
这是一套数据指标体系全流程构建(从规划、框架设计、数据采集加工到应用)方法论与实践指南。它不仅深入浅出地分享了通用的数据指标体系构建策略,还通过多个行业实例展示了具体操作方法。书中从数据采集入手,借助BI工具Superset实践构建过程。本着 一切技术都是为业务服务的 这一宗旨,本书除了包含数据指标体系构建相关内容外,还结合统计学原理及Excel、Python等工具,深入剖析数据指标波动对业务的影响,旨在帮助读者深入理解数据指标与实际业务的底层关联,把数据指标体系落地到业务中。第一篇(第1章):深度解读数据指标体系的基础知识,让读者充分理解数据指标,并掌握构建策略、全流程和方法概要,其中包括数据指标体系分类标准、评判优质指标的4个标准、选择数据指标的4个注意事项、数据指标体系3要素、构建指标体系的7个策略等重
本书是数据治理领域公认的标准性著作,能为各种类型企业和机构的数据治理提供全面指导。用友集团官方出品,得到了用友集团董事长王文京、DAMA中国区主席汪广盛等9位企业界和学术界数字化专家的一致好评,同时也被中国数据要素高层次人才发展大会(DGBOK)作为指定教材。 它基于国际主流的数据治理框架和用友多年的数据治理经验,从道、法、术、器4个维度全面、深入展开,不仅有数据治理在战略层面的顶层设计,还有数据治理在执行层面的实施方法,既可以作为数据治理的纲领性指南,又可作为数据治理的实操手册。 从数据治理的战略规划到落地实施,本书将各环节的核心内容凝练为 3 个战略机制、8 项关键举措、7 种技术能力、7 个治理工具 : 数据治理之道:3个战略机制 高屋建瓴地介绍了数据治理的数据战略、组织机制和数据文化。这3个机制
这是一本从OLAP核心概念出发,以Presto为例,从整体执行流程到不同SQL的执行原理,完整呈现OLAP查询的核心流程和OLAP引擎设计思路,并指导读者形成OLAP引擎设计解决方案的专业技术工具书。本书不仅面向初级读者介绍了OLAP查询的基本原理和Presto使用方法,还从源码级剖析了OLAP引擎核心原理,包括SQL查询解析器、优化器、调度器、执行器等核心组件,并将内容扩展到OLAP引擎的常见高性能优化方案上。全书由浅入深,图文并茂,把晦涩难懂的内容讲解得透彻易懂。本书分为6篇,包括14章。第一篇(第1章和第2章)总体介绍业界常见的OLAP引擎并分析其优劣,讨论OLAP引擎的技术发展趋势及选型方法,介绍Presto背景知识及其使用方法、技巧。第二篇(第3章和第4章)串讲OLAP查询执行的整个过程,并概要性介绍查询解析器、优化器、调度器、执行器等核心模块的工作原理,
《Power Query从入门到精通》从 Excel 处理大型数据的缺点开始讲起,逐步讲解了 Excel 和 Power BI 中的 Power Query 组件,并重点介绍了Power Query 的底层 M 语言的应用知识。 《Power Query从入门到精通》分为 10 章,主要讲解了 Power Query 的入门知识和数据集成、Power Query 的 M 语法规则系列知识,针对 Power Query 如何实现数据清洗和重构系列知识做了详细的讲解,还重点介绍了目前 Power Query 的各类内置函数的功能,后介绍了如何利用自定义函数实现复杂的数据处理和重构过程。 《Power Query从入门到精通》内容通俗易懂,案例丰富,实用性强,特别适合入门级数据分析人员学习,也适合进阶阅读,相信通过阅读《Power Query从入门到精通》,读者对数据分析过程中的清洗和重构会有一个新的认识。
本书将从内部组件、外部应用和数据结构3个方面为读者介绍Redis常见、经典的用法与实例,并且所有实例均附有完整的Python代码,方便读者学习和参考。全书分3个部分:第一部分讲内部组件,介绍的实例通常用于系统内部,如缓存、锁、计数器、迭代器、速率限制器等,这些都是很多系统中不可或缺的部分;第二部分讲外部应用,介绍的实例都是一些日常常见的、用户可以直接接触到的应用,如直播弹幕、社交关系、排行榜、分页、地理位置等;第三部分讲数据结构,介绍的实例是一些使用Redis实现的常见数据结构,如先进先出队列、栈、优先队列和矩阵等。本书希望通过展示常见的Redis应用实例来帮助读者了解使用Redis解决各类问题的方法,并加深读者对Redis各项命令及数据结构的认识,使读者真正成为能够使用Redis解决各类问题的Redis专家。 本书适合对Redis有基
本书旨在建立和推动“动力学刻画的数据科学”理论和应用研究。全书共六章,内容包括:复杂动力系统理论基础、高维数据的临界预警理论及方法、短时间序列的预测理论及方法、动力学因果检测理论及方法、基于动力学的势能景观构建理论及方法、混沌反馈学习理论及深度学习方法等。全书交叉融合了数学理论、统计学方法、人工智能、计算系统生物学方法等知识,做到数学理论与实际应用并重,动力学算法与统计学方法互补,内容图文并茂、清晰易读、由浅入深,并在第2章至第6章末尾配有相关前沿领域的展望与讨论,读者可以通过阅读本书了解所涉及研究方向的发展趋势。
随着数字化的发展,数据逐渐融入生产、分配、流通、消费和社会服务管理等环节,为数据的拥有者或使用者带来经济效益,成为一种新型的生产要素,给生产方式、生活方式和社会治理方式带来了深刻的变革。 本书主要介绍数据要素化时代的数据治理。本书分为5篇。第一篇 数据治理新趋势 介绍DataOps的发展及实践,产业级数据治理新趋势,数据治理的场景化、工程化和智能化,以及数据资产的安全运营。第二篇 新理论、新方法和新技术 介绍数业的逻辑及路径、数据治理的闭环管理方法、数据资产价值的呈现、数据治理的共治共享、精益数据治理,以及数据治理的 新四化 。第三篇 新型数据基础设施 详细介绍来自平安人寿、阿里巴巴和镜舟科技3家企业的数据中台产品的创新情况。第四篇 行业数据治理与数据安全治理 首先介绍高校是如何进行数据治理的,然后