《华为数据之道》 《华为数据之道》 这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在优选170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第一部分(~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细
阅读本书可以学习使用Python对数据集进行操作、处理、清洗和规整。第3版针对Python3.10和pandas1.4进行了更新,并通过实操讲解和实际案例向读者展示了如何高效地解决一系列数据分析问题。读者将在阅读过程中学习新版本的pandas、NumPy、IPython和Jupyter。 本书作者Wes McKinney是Python pandas项目的创始人。本书对Python数据科学工具的介绍既贴近实战又内容新颗,非常适合刚开始学习Python的数据分析师或刚开始学习数据科学和科学计算的Python程序员阅读。读者可以从GitHub获取数据文件和相关资料。 学完本书,你将能够: ·使用Jupyter notebook和IPython shell进行探索性计算。 ·掌握NumPy的基础功能和高级功能。 ·掌握pandas库中的数据分析工具。 ·使用灵活的工具对数据进行加载、清洗、转换、合并和重塑。 ·使用matplotlib进行信息可视化。 ·使用pandas的groupBy功能对数据集进行切片、切
本书是一部通过提供一套易于遵守及操作的方法论来实现高质量数据管理的实践指南。内容全面、详细,并有许多实用的建议和模板,第1版推出后,已成为全球信息质量实践者的推荐书籍,甚至已成为美国阿肯色大学信息质量研究生项目的教科书。 本书共7章,内容包括数据质量和依赖于数据的世界、数据质量实践、关键概念、十步法流程、设计项目结构、其他技巧和工具,以及写在最后的话。 作者将信息质量的概念框架与改善信息质量的技术、工具、操作指南相结合,提出并详细描述了获取高质量数据和可信信息的十步法。作为本书的近期新改版,作者进一步阐明并更新了流程步骤和支持模板,整合了一些有价值的示例和案例,说明了近些年技术和数据生产的演变。 本书内容丰富,理论和实践相结合,易读性和可操作性强,可以作为数据质量管理的入门和进阶
数据是组织的重要资产,做好数据管理是盘活数据资源,释放数据价值的有效手段。本书以数据管理为主题,分为背景篇、标准篇、贯标篇、评估篇和政策篇五个篇章,首先梳理了数据管理的概念、背景和发展历程,为读者建立对数据管理的总体认识;其次详细解读国家标准――数据管理能力成熟度评估模型(以下简称DCMM),帮助读者深入理解DCMM标准及其内涵,掌握开展数据管理活动所需的理论知识,指导读者应用DCMM标准构建数据管理体系,并开展数据管理贯标评估活动。
本书按照需求规划、需求实现、可视化的流程进行编排,通过项目开发的主要流程,介绍数据仓库的搭建过程。在整个数据仓库的搭建过程中,本书介绍了主要组件的安装部署、需求实现的具体思路,以及各种问题的解决方案等,并在其中穿插了许多与大数据和数据仓库相关的理论知识,包括数据仓库的概念、电商业务概述、数据仓库理论和数据仓库建模等。 本书共14章,其中,第1~3章是项目的前期准备阶段,主要介绍了数据仓库的概念和搭建需求,并初步搭建了本数据仓库项目所需的基本环境;第4~7章是项目的核心部分,详细介绍了数据仓库的建模理论,并完成了数据从采集到分层搭建的全过程,是本书的重点部分;第8~14章是对数据治理各功能模块的实现,针对数据治理的不同功能需求分模块进行实现。 本书适合具有一定编程基础并对大数据感兴趣的读者
本书是一部通过提供一套易于遵守及操作的方法论来实现高质量数据管理的实践指南。内容全面、详细,并有许多实用的建议和模板,第1版推出后,已成为全球信息质量实践者的推荐书籍,甚至已成为美国阿肯色大学信息质量研究生项目的教科书。 本书共7章,内容包括数据质量和依赖于数据的世界、数据质量实践、关键概念、十步法流程、设计项目结构、其他技巧和工具,以及写在最后的话。 作者将信息质量的概念框架与改善信息质量的技术、工具、操作指南相结合,提出并详细描述了获取高质量数据和可信信息的十步法。作为本书的近期新改版,作者进一步阐明并更新了流程步骤和支持模板,整合了一些有价值的示例和案例,说明了近些年技术和数据生产的演变。 本书内容丰富,理论和实践相结合,易读性和可操作性强,可以作为数据质量管理的入门和进阶
数据是组织的重要资产,做好数据管理是盘活数据资源,释放数据价值的有效手段。本书以数据管理为主题,分为背景篇、标准篇、贯标篇、评估篇和政策篇五个篇章,首先梳理了数据管理的概念、背景和发展历程,为读者建立对数据管理的总体认识;其次详细解读国家标准――数据管理能力成熟度评估模型(以下简称DCMM),帮助读者深入理解DCMM标准及其内涵,掌握开展数据管理活动所需的理论知识,指导读者应用DCMM标准构建数据管理体系,并开展数据管理贯标评估活动。
《学习Python(第6版)》深入浅出地讨论了大部分Python编程主题。利用从本书中学到的Python知识,读者可以掌握高质量软件研发背后的逻辑。书中采用一种易懂的、循序渐进的方法来介绍基本的编程概念,先从控制结构、函数和列表等概念开始,再深入讨论类。这有助于确保读者理解基本的编程概念,并知道如何解决现实中的问题。书中每一章都包括清晰美观的代码清单、真实世界的例子和大量练习。 《学习Python(第6版)》针对Python 3.11进行了全面更新,新增或改进了大量主题,尤其适合想要高效掌握Python新特性的读者。
《学习Python(第6版)》深入浅出地讨论了大部分Python编程主题。利用从本书中学到的Python知识,读者可以掌握高质量软件研发背后的逻辑。书中采用一种易懂的、循序渐进的方法来介绍基本的编程概念,先从控制结构、函数和列表等概念开始,再深入讨论类。这有助于确保读者理解基本的编程概念,并知道如何解决现实中的问题。书中每一章都包括清晰美观的代码清单、真实世界的例子和大量练习。 《学习Python(第6版)》针对Python 3.11进行了全面更新,新增或改进了大量主题,尤其适合想要高效掌握Python新特性的读者。
《学习Python(第6版)》深入浅出地讨论了大部分Python编程主题。利用从本书中学到的Python知识,读者可以掌握高质量软件研发背后的逻辑。书中采用一种易懂的、循序渐进的方法来介绍基本的编程概念,先从控制结构、函数和列表等概念开始,再深入讨论类。这有助于确保读者理解基本的编程概念,并知道如何解决现实中的问题。书中每一章都包括清晰美观的代码清单、真实世界的例子和大量练习。 《学习Python(第6版)》针对Python 3.11进行了全面更新,新增或改进了大量主题,尤其适合想要高效掌握Python新特性的读者。
《华为数据之道》 《华为数据之道》 这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在优选170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第一部分(~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细
《华为数据之道》 《华为数据之道》 这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在优选170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第一部分(~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细
《华为数据之道》 《华为数据之道》 这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在优选170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第一部分(~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细
本书展示了如何使用真实的数据真实地进行贝叶斯数据分析。作者从概率与程序设计的基本概念出发,逐步带你进阶,帮助你最终掌握在实际的贝叶斯数据分析中常用的高级模型。本书分为三大部分,共有25章。第一部分介绍基础知识,内容包括贝叶斯推断的基本思想、模型、概率及R语言编程。第二部分涵盖了现代贝叶斯数据分析的所有关键思想。第三部分介绍如何在实际数据上应用贝叶斯方法。 本书适合对贝叶斯数据分析感兴趣的读者阅读。
本书展示了如何使用真实的数据真实地进行贝叶斯数据分析。作者从概率与程序设计的基本概念出发,逐步带你进阶,帮助你最终掌握在实际的贝叶斯数据分析中常用的高级模型。本书分为三大部分,共有25章。第一部分介绍基础知识,内容包括贝叶斯推断的基本思想、模型、概率及R语言编程。第二部分涵盖了现代贝叶斯数据分析的所有关键思想。第三部分介绍如何在实际数据上应用贝叶斯方法。 本书适合对贝叶斯数据分析感兴趣的读者阅读。
本书展示了如何使用真实的数据真实地进行贝叶斯数据分析。作者从概率与程序设计的基本概念出发,逐步带你进阶,帮助你最终掌握在实际的贝叶斯数据分析中常用的高级模型。本书分为三大部分,共有25章。第一部分介绍基础知识,内容包括贝叶斯推断的基本思想、模型、概率及R语言编程。第二部分涵盖了现代贝叶斯数据分析的所有关键思想。第三部分介绍如何在实际数据上应用贝叶斯方法。 本书适合对贝叶斯数据分析感兴趣的读者阅读。
本书展示了如何使用真实的数据真实地进行贝叶斯数据分析。作者从概率与程序设计的基本概念出发,逐步带你进阶,帮助你最终掌握在实际的贝叶斯数据分析中常用的高级模型。本书分为三大部分,共有25章。第一部分介绍基础知识,内容包括贝叶斯推断的基本思想、模型、概率及R语言编程。第二部分涵盖了现代贝叶斯数据分析的所有关键思想。第三部分介绍如何在实际数据上应用贝叶斯方法。 本书适合对贝叶斯数据分析感兴趣的读者阅读。
不买新硬件的话,能实现应用程序性能的提升吗?答案是“可以的!”算法和数据结构的创新推动了应用程序性能的巨大进步。我们推荐你拿起这本书,去了解并掌握书中的这些高级算法和数据结构,相信会对你的开发工作有所裨益。 本书所涉及的算法可用于应对数据分析、机器学习和图计算相关的复杂编程挑战,是帮助你解决各种棘手问题的“锦囊妙计”,甚至能帮助你为需要自定义解决方案的项目设计数据结构。 要更好地掌握本书所涵盖的内容,你应有一定的编程经验,需要先掌握基本的算法和数据结构知识。 本书主要包括以下内容: 构建基本(常见)的数据结构; 配置算法,以提升应用程序的性能; 有效地存储和查询字符串; 使用MapReduce实现分布式聚类算法; 使用图和优化算法来解决物流问题。
《数据中心手册(精)》由来自7个国家的51位数据中心业内专家共同编写,中文版由国内24家企业、公司和大学的34位数据中心业内专家共同翻译并修订完成。内容涵盖了数据中心全生命周期的相关技术及运营管理策略,从数据中心规划、选址、设计、建设、测试、验收到运营和管理、灾难恢复,全面翔实,是作者及译者多年经验所得,是一本由来自全球不同国家、不同企业、不同专业领域的专家共同完成的数据中心领域的工具书。 本书可作为数据中心设计者、建设者、管理者和投资者的学习及参考材料,也可作为高校相关专业师生及其他人士了解数据中心行业的入门材料。
图数据库是NoSQL类数据库的又一大典型代表,在国内图数据库属于新兴事物,其优异的复杂关系解决方案引起了国内众多大型互联网公司及IT开发者的关注,而Neo4j是目前图形化数据库中最为出色、最为成熟的产品。本书的第一版书名是(Neo4j权威指南》,发行量超过13000册,本书在第一版的基础上补充完善了Neo4j的新特性、新功能。本书基于Neo4j4.4版本编写,共分10章,涵盖基本概念、基础入门、查询语言、程序开发技术、管理运维、集群技术、应用案例、高级应用、配置设置、内建过程、GDS、Fabrie等内容。本书内容涉及Neo4j的大部分知识,既可以作为Neo4j初学者的入门教材,也可以作为相关行业Neo4j技术专家的参考手册。
本书以工业大数据的特点和需求为牵引,阐述了工业大数据分析的算法与实现机制,使具有工科背景读者建立起数据思维,灵活利用数据分析算法进行实际问题的建模,并实现分析项目高效迭代与落地。具体主题覆盖了工业大数据分析工程思维和软件栈,工业数据的数据探索,预处理方法和常用机器学习算法,故障诊断、质量优化、流程优化的分析算法,专家规则捕获方法,工业数据分析工程等内容。
本书以国家高技术研究发展计划(863计划)“十二五”主题项目“面向对象的高可信SAR处理系统”为背景,针对合成孔径雷达数据在地貌地物、森林植被等方面的处理与解译难题,阐述利用多角度、多波段、多极化、极化干涉等多模式航空航天SAR数据,建立基于散射机理的地物特性知识库,构建地形辐射校正、极化干涉处理、立体测量、基于知识的地物解译等模型,开发高分辨率机载极化干涉SAR数据获取硬件系统与SAR影像高性能解译软件系统,实现以精度高、可靠性强、识别类型丰富为特征的SAR影像高可信处理与解译的原理、技术与方法,并对成果在测绘、林业等行业的应用示范效果进行了展示和分析。
本书是针对openGauss开源数据库的源码进行分模块解析的书籍。全书共分为10章。第1章对openGauss进行简介。第2章介绍了内核开发所需的入门知识,包括openGauss的安装、基本使用、开发、编译、参与社区开源项目等。第3~10章针对openGauss不同的功能模块分别进行源码介绍。第3章针对系统表、多线程架构、内存管理等作用于整个数据库系统的公共组件从定义、原理、流程等方面进行源码介绍;第4章介绍openGauss满足OLTP、OLAP不同业务场景的存储引擎实现及对应的源码;第5章介绍保证数据库ACID属性的事务机制的原理和源码;第6章介绍SQL引擎的SQL解析和查询优化代码主流程;第7章介绍openGauss执行器的整体架构和各类执行算子的源码;第8章介绍openGauss在人工智能与数据库结合领域探索的源码;第9章从系统整体角度出发,针对基础和高阶的安全能力进行全面介绍和源码解读;第1
三支决策是一种基于人类认知过程的粒计算研究办法。本书从大数据决策环境入手,以三支决策作为目标对象,以粒计算理论为指导思想,以大数据分析为核心技术,以机器学习相关方法为研究于段,研究三支决策与大数据分析模型的构建、算法的实现、方法的应用。本书的相关研究内容能够适应大数据分析需求和更复杂的决策环境,扩大三支决策和粒计算理论的实际应用背景,力图展现国内外三支决策与大数据分析的近期新研究成果,并在理论、方法和应用上给出一套处理不确定性大数据问题的系统研究体系。 本书可供计算机科学、管理科学与工程、控制科学与工程、信息科学、应用数学等专业的科研人员、教师、研究生、高年级本科生和工程技术人员参考。