《华为数据之道》 《华为数据之道》 这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在优选170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第一部分(~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细
阅读本书可以学习使用Python对数据集进行操作、处理、清洗和规整。第3版针对Python3.10和pandas1.4进行了更新,并通过实操讲解和实际案例向读者展示了如何高效地解决一系列数据分析问题。读者将在阅读过程中学习新版本的pandas、NumPy、IPython和Jupyter。 本书作者Wes McKinney是Python pandas项目的创始人。本书对Python数据科学工具的介绍既贴近实战又内容新颗,非常适合刚开始学习Python的数据分析师或刚开始学习数据科学和科学计算的Python程序员阅读。读者可以从GitHub获取数据文件和相关资料。 学完本书,你将能够: ·使用Jupyter notebook和IPython shell进行探索性计算。 ·掌握NumPy的基础功能和高级功能。 ·掌握pandas库中的数据分析工具。 ·使用灵活的工具对数据进行加载、清洗、转换、合并和重塑。 ·使用matplotlib进行信息可视化。 ·使用pandas的groupBy功能对数据集进行切片、切
本书根据PL/SQL的新版本进行了全面更新,涵盖从基础语法、程序控制到最新的优化和调优增强等方面的知识,通过真实的实验、大量的示例讲解了PL/SQL技能,是一本逐步分解的、详尽的PL/SQL编程教程。读者可以按照本书的步骤一步一步地完成每一个关键任务,掌握Oracle 21c PL/SQL编程技术,深度探索PL/SQL编程技术及最佳实践。本书既适合新手数据库开发人员和DBA阅读,也适合有一定经验的从业人员阅读。
本书以TiDB数据库为基础介绍分布式数据库的运行原理、性能优化和应用场景架构设计。首先,剖析分布式数据库的运行原理与架构;然后,阐述分布式数据库TiDB在表与索引的设计优化、SQL优化、系统级优化方面的方法论,通过融入多个有代表性的案例,帮助读者将方法论对应到生产实践中;最后,梳理场景选型和架构设计过程中读者应该掌握的主要知识点,并对一些分布式数据库的优势场景进行了详细介绍。 本书适合希望了解分布式数据库原理,学习TiDB数据库的开发工程师、数据库管理员和架构师阅读,也可以作为高等学校教师或学生学习分布式数据库的参考教材。
在大数据时代,我们并不缺少数据,缺少的是利用数据分析的思维和工具去解决实际问题的能力。数据化分析是运用恰当的方法和工具,对数据进行科学、有效的分析,从而提出有理有据、具有可操作性的建议,以解决现实中的难题。本书主要介绍了数据分析的9 种思维、7 种工具、学习方法、基本方法、展现方法、制作数据分析报告的方法,以及数据分析的思维模型。本书适合所有对数据分析感兴趣的读者阅读,特别是在工作或生活中需要经常跟数据接触的人,如数据分析师、产品经理、运营人员、管理人员、财务人员等。
本书系统地介绍向量数据库的原理、技术实现及其应用,重点分析传统数据库在处理高维向量数据时的局限性,并提供相应的解决方案。本书分为4个部分,共13章,内容涵盖从理论基础到技术实践的多个方面,详细讨论高维向量表示中的信息丢失、嵌入空间误差和维度诅咒等问题,结合FAISS和Milvus等主流开源工具,深入剖析向量数据库的索引机制、搜索算法和优化策略。通过实际案例,展示向量数据库在推荐系统、行为分析、智能诊断、语义搜索等领域的应用,并特别强调企业级语义搜索系统的开发与部署经验。 本书不仅提供深度的理论指导,还通过丰富的案例帮助读者掌握如何构建高效的向量搜索引擎,适合从事搜索引擎与推荐系统开发的工程师,数据科学、人工智能及相关领域的从业者、研究人员,以及对向量数据库与相似性搜索感兴趣的读者,也可作为培训
本书主要介绍从高维数据中感知、处理、分析和学习低维结构的基本数学原理和高效计算方法,系统地归纳了建模高维空间中低维结构的数学原理,梳理了处理高维数据模型的可扩展高效计算方法,阐明了如何结合领域具体知识或考虑其他非理想因素来正确建模并成功解决真实世界中的应用问题。本书包括基本原理、计算方法和真实应用三个部分:基本原理部分系统地介绍稀疏、低秩和一般低维模型的基本性质和理论结果,计算方法部分介绍解决凸优化和非凸优化问题的有效算法,真实应用部分通过实例演示利用前两部分的知识改进高维数据处理和分析问题的解决方案。本书适合作为计算机科学、数据科学和电气工程专业的高年级本科生和研究生的教材,也适合学习稀疏性、低维结构和高维数据课程的学生参考。
大数据时代,Oracle12c为云计算而改变。《名师讲坛 Oracle开发实战经典》以Oracle11g、12c版本为基础,通过丰富的实例、通俗易懂的语言、简洁明快的图示、极为详尽的视频,讲述了数据库开发的主要内容。全书分为3个部分,第1部分:Oracle开发前奏,主要包括数据库系统概述、Oracle的安装与基本使用;第2部分:SQL基础语法,主要内容有简单查询、限定查询与排序显示、单行函数、多表查询、分组统计查询、子查询、更新及事务处理、替代变量、表的创建与管理、完整性约束、其他数据库对象、用户权限及角色管理、数据库设计;第3部分:数据库编程,主要内容有PL/SQL编程基础、集合、游标、子程序、包、触发器、动态SQL、面向对象编程。。《名师讲坛 Oracle开发实战经典》还有如下特点: 1.视频极为详尽:视频长达45小时,共126讲,力求将Oracle开发知识一网打
ChatGPT能够辅助用户完成从数据收集、预处理、分析到报告撰写的全过程,大大降低了数据分析的门槛。本书共分为 12 章,内容包括ChatGPT 的注册与登录、提示词的设计、GPTs、数据的收集与预处理、特征工程、各类数据分析方法(包括对比分析、分组分析、回归分析、分类分析和聚类分析等)、数据可视化,以及如何利用 ChatGPT 撰写数据分析报告等。每章都提供了丰富的示例和实用技巧,旨在帮助读者掌握利用ChatGPT 进行数据分析的方法,提高数据处理和分析的效率。本书适合数据分析师、市场研究人员、高校师生、科研人员以及任何对数据分析感兴趣的读者。通过阅读本书,读者不仅能学习到如何使用 ChatGPT 进行数据分析,还能深刻理解数据分析的核心概念和应用场景,从而在实践中更加游刃有余。
这是一本能为数字化转型企业的数据治理提供全面指导的著作。拥有集团官方出品,得到了用友集团董事长王文京、DAMA中国区主席汪广盛等9位企业界和学术界数字化专家的一致好评它基于国际主流的数据治理框架和用友多年的数据治理经验,从道、法、术、器4个维度全面、深入展开,不仅有数据治理在战略层面的顶层设计,还有数据治理在执行层面的实施方法,既可以作为数据治理的纲领性指南,又可作为数据治理的实操手册。从数据治理的战略规划到落地实施,本书将各环节的核心内容凝练为“3个战略机制、8项关键举措、7种技术能力、7个治理工具”:数据治理之道:3个战略机制高屋建瓴地介绍了数据治理的数据战略、组织机制和数据文化。这3个机制能够帮助企业形成数据治理的自我驱动、自我进化、可持续发展和长效运营机制。数据治理之法:8项关键举措
真实世界的数据都是多模态的,真正的通用人工智能(AGI)必将超越单一模态的局限。本书基于作者多年工业界大数据技术经验,系统而全面地探讨了多模态数据技术,从基础概念到关键技术再到典型应用,全方位讲解多模态数据分析的核心技术与前沿实践。书中首先详尽介绍了多模态数据分析相关知识,涉及文本、图像、音频、视频等多模态数据;然后结合实例代码,系统介绍了统计学与数据分析、机器学习、深度学习、知识图谱、大模型等方法和模型,以及GPT与DeepSeek等大模型的多模态实践分析;最后结合医疗、直播、视频等领域的案例阐述了多模态数据分析的多种算法模型的综合应用。 本书体系化强、案例丰富,以“理论框架-技术路径-实战案例”层层递进的方式提供了完整的知识链路,主体基于Python语言的大量实例代码,可以帮助读者学以致用。 本书既可
Oracle数据库系统是数据库领域*秀的数据库之一,《Oracle 12c数据库入门与应用》以Oracle*版本12c为蓝本,系统地讲述了Oracle数据库的概念、管理和应用开发等内容。全书结构合理、内容翔实、示例丰富、语言简洁。从实际角度出发,系统地介绍了数据库和Oracle的相关概念和原理、数据维护(查询、更新和删除)、Oracle数据库管理(如安装与启动、用户权限)以及Oracle的应用开发基础,并在*后通过设计医院预约挂号系统数据库讲解开发的详细过程。《Oracle 12c数据库入门与应用》面向数据库管理人员和数据库开发人员,是初学者很好的入门教程,对Oracle管理员和应用程序开发员也有很好的学习和参考价值,也可以作为各大、中专院校相关专业的参考用书和相关培训机构的培训教材。