这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第壹部分(第1~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数据的管理方式
数据、模型与决策是应用数学建模和计算机技术帮助决策者解决问题。作为国外一本优秀的数据、模型与决策的教材,本书具有以下特色: 1.对枯燥、复杂和技术化的数学问题用简明易懂的语言予以解释,兼顾严谨的数理逻辑。 2.突出建模分析框架和基础逻辑的讲授和训练,在某种程度上实现了艺术与科学的有机融合。 3.课后习题丰富,并配有网络题库,供自学者加强训练,及时检查对理论模型及其求解方法的掌握程度。 第12版把修订重点放在企业和组织的*技术发展上,增加了商业分析(第1章)、项目风险(第8章)以及数据挖掘(第14章)等内容。
本书的主要内容包括网络数据的定义及相关指标、大规模网络中的链路预测、网络聚类分析、网络数据中的空间自回归模型、大规模网络数据中的模型估计方法、网络数据中的空间自回归模型的拓展及应用、网络中的空间自回归模型的其他研究方向等。本书关注大规模网络数据分析中的模型方法。除模型方法本身的理论拓展之外,在估计方法等方面会涉及大规模数据中的快速计算方法。由于网络分析本身的范围非常广泛,故本书涉及的内容仅局限于作者及团队研究工作中使用到的一部分。在本书的后,为了启发读者思路,对于部分已有网络研究进行了梳理。
本书的主要内容是作者及其合作者在复杂数据模型这一领域近些年的研究成果, 以及相关的最新进展. 全书共 6 章. 第 1 章简要介绍几类复杂数据模型和 bootstrap 等预备知识和相关研究问题. 第 2~6 章, 系统讨论各种复杂数据统计推断中的 bootstrap 基本理论、方法及其应用, 包括 Behrens-Fisher问题、异方差回归模型、异方差 ANOVA 和 MANOVA 模型、混合效应模型及高维数据分析中的 bootstrap 统计推断.
从统计学科与计算机科学的性质认知,大数据是指那些超过传统数据系统处理能力、超出经典统计思想研究范围、不借用网络无法用主流软件工具及技术进行单机分析的复杂数据的集合,对于这一数据集合,在一定的条件下和合理的时间内,我们可以通过现代计算机技术和创新的统计方法,有目的地进行设计、获取、管理、分析,揭示隐藏在其中的有价值的模式和知识。 《大数据:统计理论、方法与应用》共分五章,其内容包括大数据下的统计理论体系、大数据下的数据集整合分析、大数据下的高维变量选择方法、大数据下的统计方法并行计算和大数据下的统计方法应用——网络舆情分析。 本书内容新颖,取材国内外资料,同时认真总结了作者近年来的科研成果,重点反映统计学对大数据发展的影响,突出五大特点: (1)充分体现学科融合; (2)
本书系统讲授数据挖掘的原理、主要方法及其Python实现,共分三部分:第一部分包含第1~2章,介绍数据挖掘的基本概念、流程和数据预处理;第二部分包含第3~11章,介绍经典的分类算法(包括朴素贝叶斯分类器、决策树、k-近邻、支持向量机等)、经典的聚类分析、关联分析、人工神经网络和Web挖掘等方法;第三部包含第12~14章,共有3个综合案例,包括泰坦尼克号生存数据分析、心脏病预测分析和旅游评论倾向性分析。
《高维数据的特征学习》是根据国家青年基金、重庆市科委、重庆市*的专项研究结果,系统全面地阐述了*的高维数据特征学习理论及相应算法。主要通过大间隔理论、迹比(trace-ratio)理论、自动编码、稀疏编码等方法来研究高维数据(如图像,基因等)的特征选择,特征变换,特征提取等内容。本书将理论与应用相结合,通过引入*的分布式算法和并行算法来解决在大规模高维数据集特征学习算法的有效性、可用性。
本书以一个故事开始,阐释制作可视化数据图表的基本方法论,以及如何结合D3高效、快速地创建可视化图表。本书首先解释了可视化的基本涵义,以及D3的适用人群,然后从一个具体的例子入手,告诉我们如何去挑选合适的数据集,以什么样的形式来展现数据,同时对SVG进行了基础铺垫。在D3部分,本书介绍了D3的核心概念 选择集 与 数据连接 ,同时对数据连接的几个经典场景进行了演绎,还结合D3介绍了绘图所要掌握的坐标系统、比例尺等基本概念。在数据加载方面,本书讲解了D3可以解析的多种数据格式,以及从后端加载数据的多种方法,同时解释了D3动画的制作方式,为制作交互式图表奠定了基础。*后,本书揭示了掌握D3的不二法门,并希望读者能够不断实践、持之以恒。全书写作风格生动有趣、内容通俗易懂,既适合D3初学者入门,也有助于有一定经验的前
《从零进阶!数据分析的统计基础》共 6 章,分别讲解了数据分析的步骤和方法、描述性统计分析、抽样估计、假设检验、方差分析、相关与回归分析,使用简单的语言介绍了这些数据分析基本方法的核心思想和涉及的统计学、概率论等方面 的理论内容,并使用图示的方法详细介绍了使用 Excel 2013 进行简单的描述性统计分析和使用 SPSS 进行相 关的数据分析的过程与结果分析。 《从零进阶!数据分析的统计基础》适合需要提升自身数据分析理论和实践能力的职场新人;在市场营销、金融、财务、人力资源管理中需要数据分析的人士;从事咨询、研究、分析等的专业人士。也可以作为数据分析师职业培训的教材,普通高等院校非统计专业数据分析的选修教材。
如何分析数据,让营销更精准,让成本更低,实现利润极大化?本书以 零基础 为起点,以 实战操作 为主线,通过7大数据分析方法、7种美化数据方式、8大专题全程讲解、75个专家提醒、408张图片全程图解,帮助读者实现数据分析从入门到精通,从新手成为数据分析高手。本书内容丰富、实战性强,适合于对数据分析感觉兴趣的读者,特别是数据分析人员、销售策划人员等阅读参考。
从数据中心机房监控系统的自定制技术、监控系统可信方法等方面,综述国内外研究进展,确定研究内容。第1章,主要讲述智能绿色数据中心机房监控系统的内涵;第2章,主要讲述基于大批量定制的绿色数据中心机房的自定制机理与方法;第3章,主要讲述绿色数据中心机房的用户身份认证、完整性等可信方法;第4章,给出了绿色数据中心机房智能监控技术应用,研制绿色智能机房监控系统,在该绿色智能机房监控系统架构上实施用户自定制技术、可信增强技术模块功能,并测试各项技术及整个系统的应用效果。 本书是作者长期从事数据中心机房监控系统,特别是数据中心机房监控系统自定制、可信性研究工作的方法和应用成果的总结,本书所研究技术应用到实际数据中心机房运行,这些实践工作对本书的形成具有十分重要的意义。
测试驱动开发(TDD)的实践已经帮助众多软件开发人员提高了软件开发的质量、敏捷性、生产力和速度,《测试驱动数据库开发》将展示如何对TDD进行调整,以便在数据库设计与开发工作中获得同样强大的优势。《测试驱动数据库开发》共4个部分,全面介绍测试驱动数据库开发(TDDD)技术。第1章至~第4章重点讨论数据库的类的基本概念,第5章至第9章讨论如何用面向对象的方式来精益地做数据库的类的设计以及修复设计的错误,第10章至第13章讨论使用mocking和重构来应对由传统方法开发出来的遗留数据库的两种方法,第14章和第15章讨论如何使一个数据库应用系统能够满足不同客户的不同需求,以及如何将本书的技术运用到其他数据持久化方案之中。 《测试驱动数据库开发》适合没有接触过测试驱动开发且正在开发规模较大、需求多变的数据库应用系统的开发
如果你是一名IT工程师,CTO希望你在一周内提交一份公司未来IT系统基础架构的初步建议; 如果你是一位IT营销人员,客户需要你在一周内向他汇报未来大数据系统的大致技术方向; 在这个信息严重过剩的时代,一周内从浩渺的技术细节的海洋中抓住关键的技术脉络,并进一步提出有一定理论依据的技术思考,这几乎是不可能完成的任务。 您是否想过阅读一本关于大数据的图书帮助解决如上问题? 浩如烟海的大数据领域图书可以大致归纳为三类:*类是描述大数据的应用前景与社会意义;第二类是研讨大数据作为一个大型IT系统的系统架构与技术架构;第三类是研讨大数据领域的具体技术,例如HADOOP相关的编程等。 对于需要快速掌握大数据系统技术脉络,或者是需要对未来IT系统做系统思考的技术工作者来说,*需要的是第二类图书所提供的系统化知
本书是目前有关数据挖掘在数据化运营实践领域比较全面和系统的著作,也是诸多数据挖掘书籍中为数不多的穿插大量真实的实践应用案例和场景的著作,更是创造性地针对数据化运营中不同分析挖掘课题类型,推出一一对应的分析思路集锦和相应的分析技巧集成,为读者提供“菜单化”实战锦囊的著作。作者结合自己数据化运营实践中大量的项目经验,用通俗易懂的“非技术”语言和大量活泼生动的案例,围绕数据分析挖掘中的思路、方法、技巧与应用,多方面整理、总结、分享,帮助读者深刻领会和掌握“以业务为核心,以思路为重点,以分析技术为辅佐”的数据挖掘实践应用宝典。 全书共19章,分为三个部分:基础篇(靠前~4章)系统介绍了数据分析挖掘和数据化运营的相关背景、数据化运营中“协调配合”的核心,以及实践中常见分析项目类型;实战篇(
大数据的统计计算是进行数据探索和分析挖掘的基础,在实际应用中会遇到两个问题:一个是需要使用多少资源;另一个是计算时间,它关系到数据探索分析的效率和效果。人们都希望花更少的钱,并且希望计算时间更短,但对于某个确定的计算过程,它们是成反比的。《重构大数据统计》作者就是从统计计算的算法入手,重构其计算过程,从而同时降低资源使用量和计算时间。《重构大数据统计》提出了一套完整的关于大数据统计的计算理论,包括常用的各种统计量和统计方法。基于《重构大数据统计》内容开发的数据分析工具已经在*集团内部的多个部门使用,并取得显著效果。另外,《重构大数据统计》还提供大量的示例程序代码帮助读者进一步了解算法细节,便于将书中的方法运用于实际计算。 《重构大数据统计》适合对大数据分析感兴趣的读者
本书主要介绍了商务智能一些核心技术的应用,包括数据仓库、业务报表与企业绩效管理、数据挖掘、文本与Web分析、大数据分析等内容,通过大量的案例和练习使读者容易理解和掌握商务智能在业务决策中的应用。第3版的改进主要集中在以下方面:文本与Web挖掘、大数据与分析以及商务分析的趋势与前景等。本书可以作为管理科学、电子商务和企业管理等专业的MBA、研究生以及本科生商务智能、决策支持系统等课程的教材,也可以作为管理信息系统、商务数据分析等课程的辅助教材,还适合从事企业信息管理、业务分析的人士阅读。
《滇西学术文丛:数据挖掘及其应用研究》全面介绍了数据挖掘的背景信息、相关概念及其所使用的主要技术,针对关联规则数据挖掘,系统深入地描述了Apriori算法和FP-growth算法,并比较了各自的优缺点。《滇西学术文丛:数据挖掘及其应用研究》基于关系代数的关联规则挖掘,讨论该算法的实现过程,并对该算法作复杂性分析,在聚类分析数据挖掘、序列模式挖掘等方面也有介绍。对网络入侵检测的拒绝服务攻击类型进行了序列模式挖掘和聚类分析,为进一步开发入侵检测系统提供决策依据,数据挖掘在农作物病虫害预警、居民消费结构分析、多媒体图像挖掘等方面都有应用。
在信息技术革命之后,我们将迎来数据革命。在大数据的概念、性质和价值已得到政府和社会的认可之后,大家关注的是数据如何获取,以及有了数据以后如何挖掘数据的价值。仅适合特定行业、满足特定需求的技术不足以应对一场革命,大数据不但是超出计算机软硬件处理的能力,更是超出人类的认知能力。只有实现对数据的认知,利用数据辅助决策,才是适合不同行业数据价值实现的通用手段。本书描述了数据革命的起源、实现的思路、所用的技术和要达到的目标,针对当今社会热点描述了在数据时代的应对之策。本书宏观和微观、人文和技术、启迪思想和关注实用并举,既适合宏观层面的领导启迪思维,提出工作目标,又适合微观层次的执行人员找到实现的方法和路径。本书介绍的理论和技术均可在智慧城市、智能制造领域实际使用。本书适合政府、企业决
本书共16章,共三篇。基础篇(第1~5章),第1章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具MATALB进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。实战篇(第6~15章),重点对数据挖掘技术在电力、航空、医疗、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过程,最后完成模型构建的顺序进行的,在建模过程关键环节,穿插程序实现代码。最后通过上机实践,加深数据挖掘技术在案例应用中的理解。提高篇(第16章),介绍了基于MATLAB二次开发的数据挖掘应用软件——TipDM数据挖掘建模工具,并以此工具为例详细介绍了基于MATLAB接口完成数据挖掘二次开发的各
改变命运的不只是努力,比努力更重要的是决策。过去的决策决定了现状,正在做的决策注定将影响未来。如何汲取前人的预测和决策智慧?利用大数据技术提高决策质量和效率?本书围绕上述问题,介绍决策与生活和工作的关系、决策的历史渊源、传统文化中的决策智慧,阐述现代决策理论与基本过程、如何提高决策质量和效率,探索大数据时代的预测与决策。本书不是 决策操作手册 ,而尝试为各类组织机构的管理者、涉及数据技术的科技工作者和具有一定传统文化基础的普通读者提供可资借鉴的智慧。
空间关联和并置模式被统称为空间模式,空间模式发现是空间数据挖掘中重要的任务之一。本书围绕挖掘的目标(如关联或并置)和对象(如经典数据、区间数据、不确定性数据或模糊数据等),系统地介绍了作者在空间模式挖掘领域的主要研究成果。内容包括:绪论;空间模式挖掘基础;空间关联规则挖掘;经典数据的空间colocation模式挖掘(1)、(2);不确定性数据的空间colocation模式挖掘;区间数据的空间colocation模式挖掘;模糊数据的空间colocation模式挖掘;加权colocation模式及其挖掘算法;负colocation模式挖掘及SCPMiner开发等。 本书可供高等院校计算机及相关专业的本科生、研究生参考,对从事计算机开发及应用的科技人员及开发人员也有较大的参考价值。
本书主要提出云模型、数据场、地学粗空间和空间数据挖掘视角等新技术,构建空间数据挖掘金字塔,研究空间数据挖掘的数据源,导出空间观测数据清理的“李德仁法”,研究基于空间统计学的图像数据挖掘,提出“数据场一云”聚类、基于数据场的模糊综合聚类和基于数学形态学的聚类知识挖掘算法,研究基于归纳学习的空间数据挖掘、基于概念格的遥感图像数据挖掘和地理信息系统(GIS)数据挖掘,结合滑坡监测、银行经营收益分析及选址评价、遥感图像土地利用分类、土地资源评价、火车运行安全检测等实例系统研究空间数据挖掘可操作性,并在此基础上自主研制了空间数据挖掘原型系统GISDBMiner和RSImageMiner。 本书可供空间数据挖掘、计算机科学、地球空间信息科学、GIS、遥感(RS) 、全球定位系统(GPS)、数据分析、人工智能、认知科学、空间资源规划、土地
数据挖掘是人工智能、机器学习、数据库技术等多学科相结合的产物。本书系统介绍了数 据挖掘技术的基本原理、主要方法、挖掘模式、发展及应用,重点对基于粗糙集方法的数据挖 掘过程进行了系统的阐述,全面地分析了静态与增量式的相容性与不相容性决策系统的数据 挖掘主要算法、基于有序与无序决策系统的数据挖掘主要算法、粗糙集合的扩展模型。本书可 作为系统工程、控制工程及计算机类专业研究生的学习工具,也可作为相关专业技术人员的 参考书。