《DAMA数据管理知识体系指南(第2版修订版)》是在DMBOK1和DMBOK2的基础上进行的第三次修订,是DAMA国际对过去30多年数据管理领域领域知识和实践的总结,是一部数据管理基础工具书。本书从数据处理道德规范、数据治理、数据架构、数据建模和设计、数据存储和操作、数据安全、数据集成和互操作性、文档和内容管理、参考数据和主数据、数据仓库和商业智能、元数据管理、数据质量管理、大数据数据科学、数据管理成熟度评估、数据管理组织和角色期望、数据管理和组织变革管理等方面对数据管理知识体系进行了系统介绍,并描述如何在数据管理功能领域中应用这些原则。
这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第壹部分(第1~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数据的管理方式
《数据库内核揭秘:存储引擎的设计与实现》深入探讨数据库存储引擎内部机制,详细阐述存储引擎在数据管理中的核心作用,包括数据的存储、检索和管理方式。 《数据库内核揭秘:存储引擎的设计与实现》共分为9章,内容从基础概念到高级技术,逐步深入,旨在为读者提供全面的理解框架。前两章为读者打下坚实的基础,介绍数据库系统的概览以及操作系统和硬件设备的相关知识。接下来的章节按照自底向上的逻辑顺序,深入探讨存储引擎的关键模块。第3章讲解数据在文件系统中的组织和存储方式。第4章聚焦于缓冲池的设计和缓存替换算法。作为存储引擎的核心,索引在本书占据了3章的篇幅(第5~7章),详细介绍哈希表、LSM树和B树家族。第8章讨论数据库系统中的故障恢复问题,重点介绍了ARIES算法及其应用。第9章关注事务的并发控制,包括多种并发控制算法
《高性能MySQL(第3版)》是MySQL 领域的极佳之作,拥有广泛的影响力。第4版更新了大量的内容,全书共分为16章和6 个附录,内容涵盖MySQL架构和历史,基准测试和性能剖析,数据库软硬件性能优化,复制、备份和恢复,高可用与高可扩展性,以及云端的MySQL和MySQL相关工具等方面的内容。每一章都是相对独立的主题,读者可以有选择性地单独阅读。《高性能MySQL(第4版)》不但适合数据库管理员(DBA)阅读,也适合开发人员参考学习。不管是数据库新手还是专家,相信都能从本书有所收获。
本书是国际数据管理协会(DAMA国际)组织众多国际专家对过去30多年数据管理领域知识和实践的总结,是市场上综合了数据管理方方面面的一部具有性的基础工具书。从数据治理、数据架构、数据质量、数据安全、主数据管理、参考数据管理、元数据管理、商务智能和数据参考管理、数据建模设计、数据存储和操作、数据集成和互操作、文档和内容管理、大数据、数据管理人员的道德要求等方面介绍了数据管理的知识体系。
系统、完整,一本在手,学习工作都能用的SQL入门教程 第1部分介绍SQL的基本语法,包括查询操作、数据统计、高级查询、内置函数、表的操作、列的属性等。 第2部分主要SQL的高级技术,包括多表连接、视图、索引、存储过程、存储函数、事件、触发器、游标、事务。 第3部分通过经典案例帮助读者融会贯通。 第4部分提供了常用的数据参考。 为了让读者更好地掌握,本书还结合实际工作以及面试,精心挑选了大量高质量的练习题。 此外,本书还专门配套了课件PPT,方便老师教学使用。
《向量数据库:大模型驱动的智能检索与应用》系统地介绍向量数据库的原理、技术实现及其应用,重点分析传统数据库在处理高维向量数据时的局限性,并提供相应的解决方案。《向量数据库:大模型驱动的智能检索与应用》分为4个部分,共13章,内容涵盖从理论基础到技术实践的多个方面,详细讨论高维向量表示中的信息丢失、嵌入空间误差和维度诅咒等问题,结合FAISS和Milvus等主流开源工具,深入剖析向量数据库的索引机制、搜索算法和优化策略。通过实际案例,展示向量数据库在推荐系统、行为分析、智能诊断、语义搜索等领域的应用,并特别强调企业级语义搜索系统的开发与部署经验。 《向量数据库:大模型驱动的智能检索与应用》不仅提供深度的理论指导,还通过丰富的案例帮助读者掌握如何构建高效的向量搜索引擎,适合从事搜索引擎与推荐系统开发的
本书由一线数据分析师精心编写,通过大量案例介绍了数据分析工作中常用的数据分析方法与工具。本书包括5章内容,分别是数据分析入门、数据分析 从玩转Excel开始、海量数据管理 拿MySQL说事儿、数据可视化 Tableau的使用、数据分析进阶 Python数据分析。本书通俗易懂、通过大量贴近企业真实场景的案例,帮助读者在提高数据处理技能的同时加深对数据分析思维的理解。 本书适合有志于从事数据分析工作或已从事初级数据分析工作的人士自学,也可作为产品经理、运营人员、市场人员、对数据分析感兴趣的企业高管以及创业者的参考用书。
《数据库系统概念》是数据库系统方面的经典教材之一,其内容由浅入深,既包含数据库系统基本概念,又反映数据库技术新进展。它被国际上许多大学所采用,包括斯坦福大学、耶鲁大学、得克萨斯大学、康奈尔大学、伊利诺伊大学等。
《深入浅出数据分析》以类似 章回小说 的活泼形式,生动地向读者展现优秀的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、关系数据库、数据整理技巧;正文之后,意犹未尽地以三篇附录介绍数据分析十大要诀、R工具及ToolPak工具,在充分展现目标知识以外,为读者搭建了走向深入研究的桥梁。 本书通过精心设计的实践场景,让读者不由自主地代入角色当中,真正在体验中学习、思考,将数据分析的要点融化于心,自如地应用在工作和生活中。
内容简介 这是一本能为数字化转型企业的数据治理提供全面指导的著作。拥有集团官方出品,得到了用友集团董事长王文京、DAMA中国区主席汪广盛等9位企业界和学术界数字化专家的一致好评 它基于国际主流的数据治理框架和用友多年的数据治理经验,从道、法、术、器4个维度全面、深入展开,不仅有数据治理在战略层面的顶层设计,还有数据治理在执行层面的实施方法,既可以作为数据治理的纲领性指南,又可作为数据治理的实操手册。 从数据治理的战略规划到落地实施,本书将各环节的核心内容凝练为 3 个战略机制、8 项关键举措、7 种技术能力、7 个治理工具 : 数据治理之道:3个战略机制 高屋建瓴地介绍了数据治理的数据战略、组织机制和数据文化。这3个机制能够帮助企业形成数据治理的自我驱动、自我进化、可持续发展和长效运营机制。 数据治理之
首席数据官(Chief Data Officer,CDO)是数字时代的产物,它在数字化转型的过程中,以及在转型成功后的数字经济中,都会起到关键作用。本书旨在建立一套相对完整的关于首席数据官的知识体系,帮助读者更好地参与数字时代的发展。 本书分为5篇。 第一篇 CDO概论 介绍CDO产生的背景、发展趋势、主要职责、技能和工作路径等。 第二篇 管好数据 讲解CDO如何管理好数据,涉及数据战略、数据治理、数据制度、数据标准、数据架构、数据质量、数据安全、数据合规、数据建模、数据集成、数据存储、数据分析和挖掘、数据伦理、数据开放与共享等。 第三篇 做好转型 讲解CDO如何做好数字化转型。 第四篇 建好团队 讲解CDO如何构建、领导和考核数据团队。 第五篇 新技术、新模式、新业态 介绍一些与数据及CDO相关的新技术、新模式和新业态。
本书介绍数据分析的统计基础、种类划分,并列举大量实例以说明数据分析方法和算法。内容主要分为4部分,第1部分为第1章,介绍一些概念,简单描述数据分析方法和一些实例; 第2部分包括第2~7 章,介绍描述性分析和数据预处理的主要方法,包括描述统计、多元描述分析、聚类以及频繁模式挖掘等;第3部分包括第8~12章,介绍预测性分析的主要方法,其中包括多种回归算法、二元回归、分类的性能测量以及基于概率和距离测量的方法,以及决策树、人工神经网络和支持向量机等较为先进的方法; 第4部分为第13章,利用描述和预测这两种方法,简单讨论文本、网页以及社交媒体的应用。
在数字中国这一国家战略的牵引下,数据要素和数字化转型的研究和落地如火如荼。数据中台是企业开展数据要素相关实践和数字化转型的关键基础设施,本书在这样的时代背景下,以帮助企业 管好数据、用好数据 为宗旨,内容围绕数据中台架构与建设方法论、数据中台建设流程和内容、数据中台工程化交付、数据中台行业解决方案4个维度全面、深度展开。 本书一共17章,逻辑上分为四个部分: 第1部分 数据中台建设方法与架构设计(第1~3章) 首先,从产生、定义、认知、相关概念、建设方法论、架构等方面对数据中台进行了全面介绍,帮助读者建立对数据中台的清晰认识和理解,熟悉数据中台的建设机制;然后,总结了企业数据应用成熟度评估、数据中台在各个行业的应用场景,以及数据中台的成功要素。 第2部分 数据中台建设内容与运营方法(第4~10章)
本书根据各个公司的SQL复杂查询面试题进行编写,可以更好辅助读者进行针对性的学习。尤其每个SQL复杂查询面试题都通过步骤的形式进行解读,而非直接摆出一个答案。对比答案而言,解题思路更为重要。希望学习本书之后,读者可以拥有一份自己针对复杂查询的解题思路。 本书共13章,分别对应SQL语句的查询基础、多表联查、元数据的查询与管理、字符串的查询与处理、数字的查询与处理、日期的查询与处理、JSON和XML的查询与处理、结果集的查询与处理、视图与临时表、存储过程与预编译语句、触发器与自定义函数、事务与锁、数据库备份、复杂查询面试题等相关内容。 作者精心设计多种案例与复杂查询题目,非随意摆出的 难题 ,而是基于工作时积攒的业务场景。本书适合初学者入门,适合准备开始面试的学生进行面试准备,适合开发多年却仍然对复杂查
本书旨在向广大有志于投身芯片设计行业的人士及正在从事芯片设计的工程师普及芯片设计知识和工作方法,使其更加了解芯片行业的分工与动向。 本书共分9个章节,从多角度透视芯片设计,特别是数字芯片设计的流程、工具、设计方法、仿真方法等环节。凭借作者多年业内经验,针对IC新人关心的诸多问题,为其提供了提升个人能力,选择职业方向的具体指导。本书第1章是对IC设计行业的整体概述,并解答了IC新人普遍关心的若干问题。第2章和第3章分别对数字IC的设计方法和仿真验证方法进行了详细阐述,力图介绍实用、规范的设计和仿真方法,避免了Verilog语法书中简单的语法堆砌及填鸭式的灌输。第4章是在前两章的基础上,通过实例进一步阐述设计方法中的精髓。第5章详细介绍了作为当今数字芯片主流的SoC芯片架构和设计方法,并对比了非SoC架构的设计,
内容简介这是一部能指引零基础读者顺利完成数据资产入表的实操性著作。它不仅为读者提供了数据资产入表所需的全部知识,还给出了实际操作层面的方法指引;既是数据资产入表的初学者指南,也是企业实施数据资产入表操作的工作手册。本书由数据资产管理领域的标杆企业亿信华辰倾情奉献,同时融合了行业的先进实践经验,开创性提出 数据资产三次入表理论 (数据原始资源入表、数据产品入表、数据金融资产入表),得到了来自学术界和企业界的12位数据资产管理专家的高度评价和强烈推荐。本书分为四部分,不仅从战略、方法、工具、实操、案例等角度为读者提供了全面的数据资产入表知识体系,还前瞻性地探讨了数据资产入表后的价值挖掘、资产评估和金融创新。第一部分 数据资产入表全景概览(第1和第2章)深入分析数据资产入表的宏观背景、核
本书从Power BI的基础功能讲起,逐步深入到Power BI进阶实战,以系统化的实操步骤和丰富的实际案例让读者快速入门Power BI数据分析,掌握Power BI在多个业务领域的实际应用。全书共8章:商业智能与数据分析概述;Power BI简介;数据分析与可视化制作全过程;Power BI数据预处理;Power BI数据建模;Power BI数据可视化;Power BI在线服务;Power BI数据分析实战案例。 本书通俗易懂、循序渐进、内容全面、讲解详细,配备全套数据集、教学课件和学习视频,既适合读者自学Power BI数据分析与可视化,也适合大专院校作为教材,更适合从事销售、产品、电商运营、仓储物流、财务管理、人力资源等岗位的职场人士提升技能。
内容简介商业分析有用吗?当然有用!商业分析是行走职场、创业启航的一项技能。 作者结合自己多年的工作经验,用生动的语言介绍如何用数据分析解决商业问题。 本书分为6 篇,共17 章,其中第1 篇是概念篇,讲述商业分析的基本概念;第2 篇是基础篇,讲述如何用基础的分析方法评估企业经营状况;第3 篇是进阶篇,讲述如何构建分析体系解决较复杂的问题;第4 篇是高阶篇,讲述如何应对复杂的商业难题;第5 篇是基础实践篇,通过案例讲述如何解决更复杂的商业问题;第6 篇是高阶实践篇,通过案例讲述如何解决商业分析中的疑难杂症。 本书的讲解思路是层层递进的,从简单场景到复杂场景,从基础的方法到复杂的方法。因此,无论读者是否有数据分析基础和经验,都建议从头开始阅读,这样可以一步步提升认知,更快地掌握商业分析的方法。
这本书对GDPR进行了详细的评论,解释了您需要对数据保护和信息安全制度进行的更改,并确切地告诉您需要采取什么措施以避免严重的经济处罚。产品概述EU GDPR ?C实施和合规性指南是此新数据保护法的清晰而全面的指南,解释了该法规,并以您可以理解的术语列出了数据处理者和控制者的义务。任何组织中接触个人数据的的人员都应该掌握相关知识。
这是一套数据指标体系全流程构建(从规划、框架设计、数据采集加工到应用)方法论与实践指南。它不仅深入浅出地分享了通用的数据指标体系构建策略,还通过多个行业实例展示了具体操作方法。书中从数据采集入手,借助BI工具Superset实践构建过程。本着 一切技术都是为业务服务的 这一宗旨,本书除了包含数据指标体系构建相关内容外,还结合统计学原理及Excel、Python等工具,深入剖析数据指标波动对业务的影响,旨在帮助读者深入理解数据指标与实际业务的底层关联,把数据指标体系落地到业务中。第一篇(第1章):深度解读数据指标体系的基础知识,让读者充分理解数据指标,并掌握构建策略、全流程和方法概要,其中包括数据指标体系分类标准、评判优质指标的4个标准、选择数据指标的4个注意事项、数据指标体系3要素、构建指标体系的7个策略等重
本书以实际案例和具体应用为驱动,以培养科研统计思维为目标,借助 SPSS,系统地讲授了差异显著性检验、方差分析、相关性分析、回归分析、聚类分析、主成分分析,以及结构方程模型的概念、原理和具体使用。 全书共 8 章。第 1 章系统地讨论了科研统计思维及统计分析的相关概念,并以量化类典型论文为例抛出统计思维的核心问题。第 2 章介绍了数据的规范化及预处理,重点讲解了基于数据做论证所必需的前置操作。第 3 章介绍了统计描述及数据加工。第 4 章讲解了差异显著性检验。第 5 章介绍了方差分析及其高级应用,阐述了单因素方差分析、多因素方差分析、协方差分析、多因变量方差分析等内容,以及事后检验、均值边际图等高级应用的相关知识。第 6 章介绍了关联性分析技术和回归分析。第 7 章讲解了聚类分析技术。第 8 章介绍了因子分析与降维
本书是热销书《SQL基础教程》的作者MICK为志在向中级进阶的数据库工程师编写的一本SQL技能提升指南。全书可分为两大部分。部分介绍了SQL语言不同寻常的使用技巧,带领读者重新认识CASE表达式、窗口函数、自连接、EXISTS谓词、HAVING子句、外连接、行间比较、集合运算、数列处理等SQL常用技术,发掘它们的新用法。这部分不仅穿插讲解了这些技巧背后的逻辑和相关知识,而且辅以丰富的示例程序,旨在帮助读者从面向过程的思维方式转换为面向集合的思维方式。第二部分介绍了关系数据库的发展史,并从集合论和逻辑学的角度讲述了SQL和关系模型的理论基础,旨在帮助读者加深对SQL语言和关系数据库的理解。此外,本书很多节的末尾设置有练习题,并在书末提供了解答,方便读者检验自己对书中知识点的掌握程度。
本书分为四大部分,分别为准备篇、基础篇、提高篇和配套开源软件及架构篇。准备篇为没有数据库基础的读者准备的,如果读者已经具备了一定的数据库基础,可以跳过其中的一些内容。基础篇介绍了PostgreSQL数据库中的一些基础内容,读者学习完此篇可以完成基本的PostgreSQL数据库的日常操作工作。提高篇讲解了一些更深的内容,如PostgreSQL的一些技术内幕、特色功能、优化等方面的内容,读者仔细阅读此篇以便早日成为PostgreSQL数据库高手。第三方开源软件及架构篇讲解了与PostgreSQL数据库配套使用的一些常用的开源软件及架构设计方面的内容,通过阅读此篇,可以提高读者的眼界和数据库架构设计能力。
XGBoost是一种经过行业验证的开源软件库,为快速高效地处理数十亿数据点提供了梯度提升框架。首先,本书在介绍机器学习和XGBoost在scikit-learn中的应用后,逐步深入梯度提升背后的理论知识。读者将学习决策树,并分析在机器学习环境中的装袋技术,同时学习拓展到XGBoost的超参数;并将从零开始构建梯度提升模型,将梯度提升扩展到大数据领域,同时通过计时器的使用了解速度限制。接着,本书重点探讨XGBoost的细节,着重于速度提升和通过数学推导导出参数。通过详细案例研究,读者将练习使用scikit-learn及原始的Python API构建和微调XGBoost分类器与回归器;并学习如何利用XGBoost的超参数来提高评分、纠正缺失值、缩放不平衡数据集,并微调备选基学习器。最后,读者将学习应用高级XGBoost技术,如构建非相关的集成模型、堆叠模型,并使用稀疏矩阵、定制转换器和