这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第壹部分(第1~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数据的管理方式
本书主要以项目实战为主线,从0到1的项目开发流程,教会读者如何开发全栈项目。它基于最新的Spring Boot3.1以上版本和Vue.js3.0版本的前后端分离项目开发,以及面向用户端的uni-app的小程序开发。本书基础的知识会在项目的开发过程中穿插讲解,不会单独的基础知识讲解,采用实战驱动学习知识的教学方法,并通过详细的代码示例、清晰的图解和源码解析帮助读者快速理解和掌握全栈项目开发的技巧和最佳项目实践。 本书共22章,包括Spring Boot篇、Vue篇和uni-app篇。Spring Boot篇(第1~14章)从环境搭建到项目上线,逐步深入讲解项目开发流程,并使用了众多企业级流行的开发技术,如Redis、Docker、Jenkins、Mybatis-plus等。Vue.js篇(第15~19章)使用Vue 3.0版本,采用开源的Vue.js框架Vue-Vben-Admin作为项目启动模板,帮助快速搭建后台管理系统,节约时间成本等。uni-app篇(第20~22章
本书共8章,立足于能源大数据领域核心业务,介绍了世界及中国的能源格局及能源转型背景,阐述了大数据技术的基本原理及其在能源领域的规划、预测等应用中开展实践情况,系统阐明能源大数据中心建设关键问题,深入讲解碳核算方法学。同时向读者说明了能源大数据在服务于 双碳 管理、政府治理中起到的关键作用,展示了能源大数据领域的实践成果和经验。
《Processing程序交互与数据视觉艺术实践》全面而深入地讲解了Processing在数据可视化设计领域的基础编程知识与创作实践技巧。全书共分为8章,内容包括初识数据视觉艺术、代码艺术与视觉创意、生成艺术、动态视觉效果、数据的视觉表达、数据接入与应用、传感器与数据交互,以及GUI交互设计。书中不仅展示了使用Processing处理文本和表格数据的方法、应用网络数据的技巧,而且讲解了通过Arduino传感器、摄像头、麦克风等设备进行数据采集的方式。此外,本书还详细介绍了如何利用鼠标、键盘与图形用户界面(GUI)进行交互协作的方法,旨在帮助读者创作出优秀的数据可视化新媒体作品。 本书可作为高等院校视觉传达设计、信息艺术设计、广告设计、数字媒体、新媒体艺术等专业的教材,也可作为数据信息视觉化设计从业者的参考书。
《EViews在数据分析中的应用》结合大量实战案例,全面、系统地介绍EViews软件的基本用法及其在数据分析中的应用。本书每章的最后都提供上机练习题,帮助读者提高动手能力。另外,本书提供配套教学视频,帮助读者高效、直观地学习,还提供教学PPT和大纲,方便相关高校的老师教学。 《EViews在数据分析中的应用》共13章,分为4篇。第1篇 EViews数据分析基础 ,涵盖EViews概述、EViews基本数据分析(单序列)、EViews基本数据分析(序列组)和EViews数据图形化分析;第2篇 EViews经典线性回归模型 ,涵盖经典回归模型和违背经典线性回归模型假设的修正;第3篇 EViews时间序列模型 ,涵盖时间序列模型与预测、带季节效应的时间序列模型、条件异方差模型、向量自回归模型和协整相关模型;第4篇 EViews的其他模型 ,涵盖离散和受限因变量模型,以及混合数据与面板数据分
本书系统地介绍过程挖掘的原理、方法、技术及其在教育领域的应用,重点介绍基于Petri net 的形式化挖掘技术和基于语义的挖掘技术,并举一个完整的挖掘大学校园学生行为特征的 案例。本书既有完整的理论框架又有专门的教育领域实践应用,可供计算机、大数据、人工智 能等相关专业领域的学生和研究人员参考。
本书全面介绍车辆轨迹数据的处理、分析与可视化方法,并深入探讨了基于Python的车辆轨迹数 据处理技术,旨在帮助读者快速掌握车辆时空轨迹数据处理的基本方法和编程技巧,同时提供丰富的实际案例和技术解决方案,覆盖了从数据采集到深入分析的完整技术链条,是交通时空大数据领域车辆轨迹数据处理分析的全面指南。 本书内容涵盖从车辆轨迹数据的基本特征、采集原理到预处理、质量分析、可视化,再到高级应用如路网匹配、排放计算、多智能体仿真,以及特定案例分析如电动汽车充电需求识别和无人机航拍轨迹数据分析。 本书适合计算机相关专业的学生、数据分析师、研究人员以及技术开发人员阅读。
本书旨在为包括研究生和工业从业者在内的研究人员提供有关为数据驱动的进化优化而开发的最新方法的全面描述。本书共分12章,第1~4章简要介绍了优化、进化计算和机器学习中精心挑选的重要主题和方法。第5章提供了数据驱动优化的基础知识,包括启发式算法和基于获取函数的代理模型管理。第6章介绍使用多个代理模型进行单目标优化的方法。第7~8章中描述用于求解多目标和多目标优化算法的代表性进化算法以及代理模型辅助数据驱动的进化多目标和多目标优化。第9章详细阐述了高维数据驱动优化的方法。第10章描述迁移学习和迁移优化。第11章讨论离线数据驱动的进化优化,以翼型设计优化等实际优化问题为例、原油蒸馏优化和急救系统优化。最后,第12章强调了深度神经架构搜索作为数据驱动的昂贵优化问题。
XGBoost是一种经过行业验证的开源软件库,为快速高效地处理数十亿数据点提供了梯度提升框架。首先,本书在介绍机器学习和XGBoost在scikit-learn中的应用后,逐步深入梯度提升背后的理论知识。读者将学习决策树,并分析在机器学习环境中的装袋技术,同时学习拓展到XGBoost的超参数;并将从零开始构建梯度提升模型,将梯度提升扩展到大数据领域,同时通过计时器的使用了解速度限制。接着,本书重点探讨XGBoost的细节,着重于速度提升和通过数学推导导出参数。通过详细案例研究,读者将练习使用scikit-learn及原始的Python API构建和微调XGBoost分类器与回归器;并学习如何利用XGBoost的超参数来提高评分、纠正缺失值、缩放不平衡数据集,并微调备选基学习器。最后,读者将学习应用高级XGBoost技术,如构建非相关的集成模型、堆叠模型,并使用稀疏矩阵、定制转换器和
《向量数据库:大模型驱动的智能检索与应用》系统地介绍向量数据库的原理、技术实现及其应用,重点分析传统数据库在处理高维向量数据时的局限性,并提供相应的解决方案。《向量数据库:大模型驱动的智能检索与应用》分为4个部分,共13章,内容涵盖从理论基础到技术实践的多个方面,详细讨论高维向量表示中的信息丢失、嵌入空间误差和维度诅咒等问题,结合FAISS和Milvus等主流开源工具,深入剖析向量数据库的索引机制、搜索算法和优化策略。通过实际案例,展示向量数据库在推荐系统、行为分析、智能诊断、语义搜索等领域的应用,并特别强调企业级语义搜索系统的开发与部署经验。 《向量数据库:大模型驱动的智能检索与应用》不仅提供深度的理论指导,还通过丰富的案例帮助读者掌握如何构建高效的向量搜索引擎,适合从事搜索引擎与推荐系统开发的
数据、模型与决策是应用数学建模和计算机技术帮助决策者解决问题。作为国外一本优秀的数据、模型与决策的教材,本书具有以下特色: 1.对枯燥、复杂和技术化的数学问题用简明易懂的语言予以解释,兼顾严谨的数理逻辑。 2.突出建模分析框架和基础逻辑的讲授和训练,在某种程度上实现了艺术与科学的有机融合。 3.课后习题丰富,并配有网络题库,供自学者加强训练,及时检查对理论模型及其求解方法的掌握程度。 第12版把修订重点放在企业和组织的*技术发展上,增加了商业分析(第1章)、项目风险(第8章)以及数据挖掘(第14章)等内容。
数据是数字经济的关键生产要素与核心资源。数据要素市场的培育是一个动态演化和持续迭代的过程,而信任的建立是市场建设的关键一步。本书通过“信任”这一视角,对数据流通进行全方位的解读,对中国数据要素市场的建设实践进行回顾与展望。基于“TIME”分析框架,对数据可信流通技术、数据流通机构、可信的数据流通模式以及促进数据可信流通的治理方案进行全面系统的介绍。本书旨在为数据要素市场参与者、数字经济从业者、数据治理人员以及关注数据流通交易的读者提供实用的参考,帮助他们理解数据流通的可行模式,破解数据要素市场发展难题,充分释放数据要素流通潜力,赋能实体经济高质量发展。
本书介绍了超级计算机算力和AI算力的异同,从CPU流水线开始,描述主要的众核处理器架构和功能部件设计。在GPU和NPU等加速器部分,介绍了GPU为何能从单纯的图形任务处理器变成通用处理器。GPU在设计逻辑、存储体系、线程管理,以及面向AI的张量处理器方面成为最近几年全世界科技行业最瞩目的明星。本书对华为等厂商推出的NPU芯片设计也做了架构描述,中国也拥有独立自主知识产权的高算力芯片,并且支持多芯片、高带宽互连。本书也回顾了近20年来主流的CPU、GPU芯片架构的特点,介绍了存储与互连总线技术,即大模型专用AI超级计算机的中枢核心。
这是一本教我们如何制作完美可视化图表,挖掘大数据背后意义的书。作者认为,可视化是一种媒介,向我们揭示了数据背后的故事。他循序渐进、深入浅出地道出了数据可视化的步骤和思想。本书让我们知道了如何理解数据可视化,如何探索数据的模式和寻找数据间的关联,如何选择适合自己的数据和目的的可视化方式,有哪些我们可以利用的可视化工具以及这些工具各有怎样的利弊。 作者给我们提供了丰富的可视化信息以及查看、探索数据的多元视角,丰富了我们对于数据、对于可视化的认知。对那些对设计和分析过程感兴趣的人,本书无疑就是一本书。
本书深入地探讨云原生数据仓库的理论知识与技术实践,涵盖数据仓库的发展历程、大数据处理技术、云原生数据仓库的概念与特点,以及云计算时代的数据仓库技术。书中详细介绍云原生数据仓库的架构设计,计算引擎、优化器、存储的关键技术,以及资源管理与调度等知识。同时,本书结合Redshift、Snowflake、BigQuery等典型的云原生数据仓库,以及AnalyticDB等具有代表性的国产数据仓库,介绍大量的实践案例。此外,书中针对云原生数据仓库的资源调度、查询优化、运维管理等方面进行深入的剖析,提供大量的最佳实践和应用场景。
本书介绍数据存储架构与技术,涵盖存储盘与存储介质、存储阵列、存储协议、键值存储、文件系统、网络存储体系结构、分布式存储系统、存储可靠性、存储安全、数据保护等基础内容,对存储维护、存储解决方案、存储技术趋势与发展等主题进行了深入讨论,以新的研究成果作为案例,同时提供习题帮助读者加深对数据存储的理解与运用。 本书适合计算机及相关专业高年级本科生或研究生阅读、学习,同时也可供相关专业技术人员参考。
本书共13章,分三个部分:基础篇、实战篇、提高篇。 (1)基础篇(第1~5章),第1章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。 (2)实战篇(第6~12章),重点对数据挖掘技术在金融、航空、零售、农业、制造和互联网等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过程,最后完成模型构建的顺序进行的,在建模过程关键环节,穿插程序实现代码。最后通过上机实践,加深数据挖掘技术在案例应用中的理解。 (3)提高篇(第13章),围绕去编程化的TipDM大数据挖掘建模平台,先介绍了平台每个模块的功能,再以航空公司客户价值
这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第一部分(第1~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数据的管理方式和
Apache ShardingSphere 是一个基于可插拔特性和云原生原则的新开源生态系统,将其用于分布式数据基础设施有助于增强数据库性能。本书首先简要概述数据库管理系统在生产环境中面临的主要挑战和数据库软件的内核概念;然后介绍使用分布式数据库解决方案、弹性伸缩、用户身份认证、SOL授权、全链路监控、数据库网关和 DistSOL的真实示例,全面讲解 ShardingSphere 的架构组件,以及如何利用它们配置和插入现有的基础架构并管理数据和应用;接着介绍生态系统的客户端 ShardingSphere-JDBC 和 ShardingSphere-Proxy,以及它们如何同时或独立地工作以满足实际需求;最后讲解如何定制可插拔架构以定义个性化的用户策略和无缝管理多个配置,并在各种场景下对数据库进行基准测试和性能测试。
本书是为广大数据分析师量身定制的入门读物,它旨在帮助读者站在大数据时代的制高点。数据分析处于统计学、计算机信息科学、运筹学、数据库等多个领域的交叉地带,大数据时代的到来大大丰富了数据分析的内涵,数据分析师的职责与以往相比发生了巨大的改变。本书全面介绍了经典数据分析、模式识别、机器学习、深度学习、数据挖掘、商务智能等多个领域的数据分析算法,将大数据时代的数据分析热点技术一网打尽。本书为每个数据分析算法都搭配了一个经典案例,并按照由易到难的原则构建知识框架,充分照顾了不同水平读者的阅读习惯。通过阅读本书,读者将对大数据时代下的数据分析有一个全面的认识。无论是入门级的数据分析员还是有一定基础的数据分析师,都能通过本书完善、加深对数据分析的认识。
本书通过选购笔记本电脑的案例引入数据包络分析(dataenvelopmentanalysis,DEA)的基本概念和模型,并运用简单的EXCEL模型让读者更易理解和运用DEA。本书着重阐述如何将DEA作为一种运营分析工具,进行绩效评估,找出基准标杆。探讨的主题包括:平衡的基准,昀佳实践,相对效率的概念及绩效提升。特别地,本书探讨的数据分析方法能够帮助一个组织重新审视它对生产效率高低的已有观点是否合理,并为组织不断改进提供指导。本书是市面上唯一本不要求读者具备线性规划和线性代数知识,就可以熟练应用DEA方法的DEA方法指导用书。
本书由浅入深,全面系统地介绍了Wireshark数据抓包和数据包分析。本书提供了大量实例,供读者实战演练Wireshark的各项功能。同时,对抓取的数据包按照协议层次,逐层讲解各个协议在数据包中的体现。这样,读者就可以掌握数据包抓取到信息获取的每个环节。 本书共分3篇。第1篇介绍Wireshark的各项功能,包括基础知识、Wireshark的定制、捕获过滤器和显示过滤器的使用、数据包的着色、导出和重组等;第2篇介绍基于Wireshark对TCP/IP协议族中常用协议的详细分析,如ARP、IP、UDP、TCP、HTTP、HTTPS和FTP等;第3篇介绍借助Wireshark分析操作系统启动过程中的网络通信情况。 本书涉及面广,内容包括工具使用、网络协议和应用。本书适合各类读者群体,如想全面学习Wireshark的初学者、网络管理员、渗透测试人员及网络安全专家等。对于网络数据分析人士,本书更是一
本书以LabVIEW 2017为基础,讲述LabVIEW图形化编程语言的原理,以及如何利用LabVIEW完成虚拟仪器设计。全书共15章,分为两篇,分别是基础知识篇(第1~13章)和实际应用篇(第14、15章)。第1章,综述虚拟仪器技术的构建思想和方法论。第2~7章,讲述LabVIEW图形化编程语言的基本原理以及编程方法,内容包括LabVIEW入门、基本数据类型、程序结构、复合数据类型、文件I/O、图形显示及其他技巧。第8~12章,阐述如何利用LabVIEW去控制仪器硬件以实现对被测信号的数据采集,内容包括选择专用的数据采集卡进行数据采集; 利用计算机自带的声卡实现数据采集; 利用摄像头完成图像采集; 仪器控制和控制单片机。第13章,讲述用LabVIEW实现仪器应用的若干算法和信号分析处理的相关知识。第14、15章,介绍利用LabVIEW完成有实际应用背景的两个虚拟仪器项目,分别是用LabVIEW构建函
本书由浅入深地阐述了时序大数据平台TDengine的核心原理与实战案例。首先,本书为读者提供了时序数据的基础知识和TDengine的核心特性概览,包括数据模型、数据写入、数据查询、数据订阅和流计算等;其次,详细介绍了TDengine的日常运维管理,包括安装部署、资源规划、图形化管理、数据安全等关键内容;然后,深入讲解了如何利用TDengine进行应用开发,涵盖多种编程语言的连接器使用、订阅数据,以及自定义函数的开发等高级功能;接下来,为数据库研发爱好者揭秘TDengine的内核设计,从分布式架构到存储引擎、查询引擎、数据订阅,再到流计算引擎的详细阐述;最后,通过分析典型应用场景案例,展示TDengine如何在实际业务中发挥作用。 本书架构清晰,内容丰富,理论与实践相结合,适合作为需要使用TDengine进行大数据处理的开发者、架构师和产品经理的技