首席数据官(Chief Data Officer,CDO)是数字时代的产物,它在数字化转型的过程中,以及在转型成功后的数字经济中,都会起到关键作用。本书旨在建立一套相对完整的关于首席数据官的知识体系,帮助读者更好地参与数字时代的发展。 本书分为5篇。“第一篇 CDO概论”介绍CDO产生的背景、发展趋势、主要职责、推荐技能和工作路径等。“第二篇 管好数据”讲解CDO如何管理好数据,涉及数据战略、数据治理、数据制度、数据标准、数据架构、数据质量、数据安全、数据合规、数据建模、数据集成、数据存储、数据分析和挖掘、数据伦理、数据开放与共享等。“第三篇 做好转型”讲解CDO如何做好数字化转型。“第四篇 建好团队”讲解CDO如何构建、领导和考核数据团队。“第五篇 新技术、新模式、新业态”介绍一些与数据及CDO相关的新技术、新模式和新业态。 本书适
本书以数据思维为主题,以数据分析全流程为主线,融合了编程语言、统计学基础及案例分析等内容,全书分为4篇,囊括了数据思维的概念和培养方法、数据来源及体系建设、数据分析三大思维方式及用户流失、用户转化实战等共11章的内容。本书囊括了数据分析中常用的分析方法,包括经典的海盗(AARRR)模型、麦肯锡的MECE模型、逻辑树、漏斗分析、路径分析、对比分析、A/B试验、RFM模型、K-Means算法、5W2H等分析方法,还包括各类方法的实践案例及Python实操项目。可以说本书是数据分析方法论与统计学知识、编程语言及应用案例的完美结合。
在数字中国这一国家战略的牵引下,数据要素和数字化转型的研究和落地如火如荼。数据中台是企业开展数据要素相关实践和数字化转型的关键基础设施,本书在这样的时代背景下,以帮助企业“管好数据、用好数据”为宗旨,内容围绕数据中台架构与建设方法论、数据中台建设流程和内容、数据中台工程化交付、数据中台行业解决方案4个维度全面、深度展开。 本书一共17章,逻辑上分为四个部分: *第1部分数据中台建设方法与架构设计(第1~3章) 首先,从产生、定义、认知、相关概念、建设方法论、架构等方面对数据中台进行了全面介绍,帮助读者建立对数据中台的清晰认识和理解,熟悉数据中台的建设机制;然后,总结了企业数据应用成熟度评估、数据中台在各个行业的应用场景,以及数据中台的成功要素。 *第2部分数据中台建设内容与运营方法(第4~10章)
本书深入剖析了组织中数据质量的重要性及提升方法,为组织打造优质数据提供了全面的指导。书中首先揭示了糟糕的数据质量对企业流程、决策及合规的潜在影响,进而阐述了提高数据质量的核心要素和端到端的实践流程。详细解析了数据质量提升方案的每个步骤,从构建业务案例到管理初期的繁忙阶段,再到确定关键利益相关者并明确数据规则,为读者提供了清晰的操作路径。此外,书中还介绍了数据监控与修正的有效方法,并探讨了如何将良好的数据实践融入企业日常运营。最后,作者总结了一份提升数据质量的完整纲要,配以实例和模板工具,以点燃读者的探索热情,并助力数据质量工作持续高效推进。 本书是企业数据质量管理的推荐指南,适合各类组织的数据从业者和管理者阅读参考。
本书分为两部分。第一部分为第1~7章,介绍了Python的语法、编程基础和对常见错误的处理。第二部分为第8~14章,介绍了Python的各种实践应用,分别是对目录和文件的操作,对Excel、Word和PDF文件的操作,在图像处理、网络爬虫领域的应用,以及Python的图形用户接口编程。本书以实践应用为目的,希望读者能够前后对应,根据例题举一反三。 本书可供Python爱好者和技术人员参考和自学,也非常适于用作高等院校的自动化类、电子信息类、机械类、计算机类等相关专业的教材。
本书作为循证医学微专业系列丛书的第一本,阐述了Meta分析与网状Meta分析以及GRADE分级方法的基础知识,并结合案例介绍了19种Meta分析软件如何实现单臂、双臂、网状和诊断试验准确性研究Meta分析,同时介绍了5种文献自动化检索软件、5种文献自动化筛选软件、2种偏倚风险评估辅助软件、3种数据辅助提取软件、4种辅助撰写软件以及2种证据分级软件。本书系统全面呈现了37种软件,实现了Meta分析数据分析和呈现一体化;力求“教了就会用”,利用图片把每个软件使用过程中遇到的核心问题与难点展示给读者,图文并茂,讲解深入浅出,可操作性强;内容实用性强,贴近前沿进展,具有指导意义。
这是一本能为数字化转型企业的数据治理提供全面指导的著作。拥有集团官方出品,得到了用友集团董事长王文京、DAMA中国区主席汪广盛等9位企业界和学术界数字化专家的一致好评它基于国际主流的数据治理框架和用友多年的数据治理经验,从道、法、术、器4个维度全面、深入展开,不仅有数据治理在战略层面的顶层设计,还有数据治理在执行层面的实施方法,既可以作为数据治理的纲领性指南,又可作为数据治理的实操手册。从数据治理的战略规划到落地实施,本书将各环节的核心内容凝练为“3个战略机制、8项关键举措、7种技术能力、7个治理工具”:数据治理之道:3个战略机制高屋建瓴地介绍了数据治理的数据战略、组织机制和数据文化。这3个机制能够帮助企业形成数据治理的自我驱动、自我进化、可持续发展和长效运营机制。数据治理之法:8项关键举措
本书在基本数据结构的基础上,围绕一些常用的高级数据结构,结合大量实战例题,深入分析“数据结构是如何服务于算法的”,这也是本书编写的一个核心理念:学习数据结构是为了“用好”数据结构。本次修订除了改错,主要是更换全书的程序代码为(C++)。本书的适用对象包括:中学信息学竞赛选手及辅导老师、大学ACM比赛选手及教练、高等院校计算机专业的师生、程序设计爱好者等。
本书共分为四篇。前三篇分别对应数据血缘的理论、实现和应用:第一篇阐明数据血缘的概念,主要介绍有关数据血缘概念的综合知识;第二篇介绍如何实现数据血缘,包括一些关于实现数据血缘的可行性见解和建议;第三篇介绍如何使用数据血缘,利用数据血缘结果实现不同的业务目的。第四篇是关于“构建数据血缘业务案例”的研究,介绍如何将数据血缘落地到业务案例中。本书主要面向数据开发人员和数据管理人员,用于针对数据血缘及其应用领域拓宽思路。本书也适合具有技术背景的数据业务人员参考阅读,便于更好地理解业务需求和数据血缘需求。
这是一本从业务和技术双重视角解读数智化风控的著作,是企业界和学术界强强合作的重要成果。本书贯穿风控全链路,深度剖析了各业务环节所面对的核心风险,以及基于数据资源和智能技术来管控多重风险的解决方案。除了介绍通常关注的贷前、贷中、贷后风险管理,本书还讨论了反欺诈、反洗钱、特殊名单管理、多头风险管控等其他类型风险的应对方案,以及基于联邦学习的数据孤岛打通、基于关系网络的数据挖掘与风险建模等前沿方案。与同类书相比,本书以更完整的体系涵盖了营销、准入、授信、定价、定额、监控、处置等各个环节,以更开阔的视野涉及了信用、欺诈、洗钱等各类风险,以更丰富的维度拆解了核心业务的场景、问题、数据、技术和解决方案,既是对一线技术与业务实践经验的总结,也是对当下解决方案发展趋势的概括。
全书分为 8 章, 主要内容如下:第1章介绍学术论文插图绘制的规范性和基本原则以及学术论文插图的配色基础;第2章介绍绘制学术论文插图的主要工具,并重点介绍 Matplotlib、Seaborn、ProPlot 以及 SciencePlots 工具包的语法及其重要特征;第3章介绍学术论文中常见的单变量图及其绘制方法,包括直方图、密度图、Q-Q 图等;第4章介绍学术论文中常见的双变量图及其绘制方法, 具体包括误差线、柱形图、箱线图、相关性散 点图以及矩阵热力图等;第5 章介绍学术论文中常见的多变量图及其绘制方法,包括等高线图、点图系列、 三元相图、 3D 图系列以及 RadViz 图等;第 6 章介绍学术论文中常见的空间数据型图及其绘制方法,包括分 级统计地图、连接线地图、等值线地图以及子地图等;第 7 章介绍学术论文中常见的可视化图及其绘制方法,包括配对图系列、韦恩图、泰勒图
《基于大数据卫勤循证决策研究》旨在完善大数据理论和方法在“平战非”卫勤循证决策中的应用,应用“卫勤决策支持”全国重点实验室中的调研、建模与干预实验技术,将大数据引人循证决策,改变了证据分析方法,实现了数据信息实时化、全面化、科学化,从而为决策者提供快速、准确的大数据支持,提升了循证决策效率与质量,为后期“平时、战时、非战争”决策提供了坚实的理论依据。
这是一部讲解企业如何利用指标推动数字化转型和实现数字化经营的著作,详细讲解了指标体系的设计方法、指标平台的产品设计和技术架构、指标在各行业落地应用的方法。本书由行业领先的数据智能产品提供商数势科技官方出品,融合了其创始人在百度、平安、等头部企业的技术研发经验和其团队服务近百家企业的实战经验,得到了来自清华大学、信通院、腾讯、、百度等10余位专家的鼎力推荐。具体地,本书主要讲解了以下五个方面的内容:(1)从指标驱动的数字化经营新模式开始,介绍指标管理对企业经营的重要意义。(2)指标体系的设计方法论,带着设计思维模拟指标拆解、设计、落地的全过程。(3)指标管理平台的产品设计与技术架构,介绍了作者团队在多年实践中总结出的“一处定义、全局使用”的指标平台建设方法。(4)深入零售、金融、制造
DolphinDB不仅支持海量数据的高效存储与查询,更开创性地提供了功能完备的编程语言以支持复杂分析,以及高吞吐、低延时、开发便捷的流数据分析框架,是计算能力不错的数据库系统之一。本书不仅介绍了如何使用DolphinDB这一兼有存储和高性能计算功能的数据库系统进行数据分析实践,还提供了大量金融和物联网等场景的实践案例,使读者通过借鉴和修改案例中的解决方案,将它们应用于自己的数据分析系统之中。本书从入门概念到实践应用分析均讲解得深入浅出、易于理解,是一本具有实践意义的数据分析工具书。即使是零基础的读者,也能通过学习本书,快速上手实践。
本书介绍了数字孪生的概念和流程,帮助读者了解当前数字化的环境和趋势,并快速建立MicroStation直觉式绘图环境。本书分为13章,从数字孪生基础概念讲到数字孪生生态环境,然后进一步讲述如何使用MircoStation。内容包括使用方法、工作环境、空间定位、对象创建与修改、视图、三维操作、引用、单元对象、图纸输出、注释对象、打印输出。本书不仅适合作为广大学习、使用MicroStation软件人员的参考书,而且也可作为建筑行业的专业人员、研究人员、软件开发工程师、BIM爱好者及高校师生的常备参考书。
高质量的数据关乎企业运营、合规、决策和业绩的关键,哈佛商业评论的一项研究发现,企业中只有3%的数据符合质量标准,绝大多数公司都在寻求切实可行的指导来提高数据质量。本书作者基于多年在数据、数据分析和人工智能方面的实践经验,阐述了4步构建高质量数据体系。他提出了高质量数据的四阶段DARS方法(定义、评估、实现、持续)和10个数据质量很好实践案例,以此来提高业务中的数据质量水平,为业务提供数据价值,保证生成的数据可以有效支持高级分析和人工智能。在本书中,您将学习定义和评估数据质量的技术、标准和度量指标,了解如何确保公司的数据收集实践避免常见的陷阱。本书适合数据科学家、数据分析师、商业智能专业人士、首席技术官和数据官,以及对收集和使用高质量数据感兴趣的人士。对于有志成为首席数据官的各位读者,这
本书结合数据科学的具体应用场景,由浅入深、循序渐进地引导读者入门数据科学,覆盖了数据获取、数据预处理、数据分析等方面的内容,共10章。本书首先概括性地介绍各章的主要内容,然后通过一个个生动的案例讲解数据获取、数据预处理、自然语言处理、机器学习和深度学习等方面的典型应用,最后为读者提供进一步学习Python的方向和方法建议。本书各章的案例均基于具体应用场景,以简单、清晰的方式对数据科学相关的技术原理和实际操作进行讲解。 本书适合高等院校的理工科、管理学科的本科生、研究生学习,尤其适合非计算机专业但对计算机编程感兴趣的学生参考学习,同时也适合数据科学行业的从业者阅读。
《零基础学Python数据分析》(升级版)以数据分析“三剑客”Pandas、Matplotlib和NumPy为主线,从学习与应用的角度出发,全面介绍了数据分析推荐入门知识,帮助读者快速掌握数据分析技能,拓宽职场道路。本书通过大量的示意图辅助讲解,力求使读者能够快速理解晦涩难懂的专业术语,同时通过快速示例将知识与应用相结合,并给出实际项目的数据分析案例,让读者能够轻松学习,从而将数据分析与预测知识应用到实际工作中。 全书共10章,包括数据分析基础、搭建Python数据分析环境、Pandas入门、Pandas进阶、可视化数据分析图表、图解数组计算模块NumPy、数据统计分析案例、机器学习Scikit-Learn、Python股票数据分析(Jupyter Notebook版)、电商销售数据分析与预测。本书提供丰富的资源,包含快速示例、案例、项目、视频讲解,力求为读者打造一本“知识讲解+快速示例+综合
本书以Python3.10.7为平台,以实际应用为背景,通过概述+算法+经典应用的形式,深入浅出地介绍Python数据分析的相关知识。全书共9章,主要内容包括Python概述、科学计算库、开源科学集、数据分析利器、数据分析的可视化、基于回归的数据分析、基于分类的数据分析、基于聚类的数据分析、数据特征分析等。通过学习本书,读者可领略到Python的简单、易学、易读、易维护等特点,同时也可感受到利用Python实现数据分析应用领域广泛,功能强大。 本书可作为高等学校相关专业本科生和研究生的教学用书,也可作为相关专业科研人员、学者、工程技术人员的参考用书。
随着三维激光扫描传感设备硬件的快速发展,可保留三维空间中原始语义信息(几何信息、颜色、反射强度等)的点云已成为代表性的新型数据源之一。语义分割作为三维场景语义分析与解译的重要前提,在无人驾驶、高精地图、智慧城市等国家重大需求的推动下,已成为测绘遥感、计算机视觉等领域的重大研究课题。《点云数据语义分割的理论与方法》以语义分割的理论与方法为研究内容,以点云为研究对象,从点云类型、深度学习基础知识、点云的组织与管理、融合点云与图像的语义分割以及直接基于点云的语义分割等方面进行介绍,是一部多学科交叉、融合的点云语义分割著作。 本书可作为高等院校测绘遥感、卫星导航、计算机视觉、地理信息等学科的教学参考书,也可供科研院所、企业相关专业从业人员参考。
深度学习技术的引入使得多模态信息处理领域取得了巨大的突破。本书在介绍多模态信息处理的基础概念和典型任务的基础上,重点介绍最通用、最基础的基于深度学习的多模态信息处理技术。本书内容包括初识多模态信息处理、单模态深度学习表示技术、多模态深度学习基础技术、多模态预训练技术4部分:初识多模态信息处理部分介绍多模态信息处理的基础概念和典型任务;单模态深度学习表示技术部分介绍多模态深度学习模型中常用的文本表示和图像表示技术;多模态深度学习基础技术部分介绍多模态表示、对齐、融合和转换这4种技术;多模态预训练技术部分介绍多模态预训练技术。此外,为了让读者更好地理解理论的细节并实践这些多模态深度学习技术,本书提供了4个可运行的完整的实战案例,分别对应多模态表示、对齐、融合和转换这4种技术。 本书既
全书的知识点讲解主要分为4部分:第1部分主要介绍MySQL的基本语法,包括数据库简介、SQL语法、查询操作、数据统计、高级查询、内置函数、数据修改、表的操作、列的属性等;第2部分是高级技术,主要介绍MySQL的高级技术,包括多表查询、视图、索引、存储程序;第3部分提供了经典案例,供读者体会技术的应用;最后本书还提供了常用的参考资料。 为了让读者更好地掌握知识,本书结合实际工作以及面试需求,精心挑选了大量高质量的练习题。此外,本书还赠送配套的课件PPT以及各种资源供各大中专院校老师教学以及学生自学使用。
本书以案例的形式,介绍从思维模型分析到场景实践的数据分析方法。全书围绕“数据分析”与“运营增长”两大关键要素,在系统介绍数据分析思维、数据分析方法、数据采集技能、数据清洗技能等基础知识的同时,以问题为导向,解读运营与增长的关键性业务内容,在获客、激活、留存、变现、自传播循环等各个核心运营环节展开数据分析实战。 本书提供案例相关数据集与源码包,适合数据分析、产品运营、市场营销等行业有数据分析具体业务需求的人士阅读,也适合相关专业的师生阅读。
本书就Python基础知识和交易策略的基本原理为切入点,由浅入深介绍了如何从零基础使用vn.py搭建自己交易系统。本书从原理着手到代码实践,内容由最基本的Python基础知识与Python中金融分析的常用包,逐步由浅入深介绍常用的指标并将使用vn.py进行实现。本书共分为8章,第1章与第2章介绍vn.py的环境搭建与Python常用的工具包,为后面使用vn.py实现交易策略做准备;第3章与第4章介绍vn.py框架和量化交易的基础知识;第5章到第7章从易到难介绍不同的交易策略并配合大量的实例讲解,进一步巩固vn.py代码的使用,第8章讲解如何在实盘中运行交易策略。本书面向零基础的新手和有一定计算机与金融知识基础的读者,以通俗易懂的语言和示例阐述量化交易的实现原理,适于对于量化交易有兴趣的读者。带有详细注释的代码将帮助读者进一步理解vn.py的框架和交易策略。