这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第壹部分(第1~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数据的管理方式
数据、模型与决策是应用数学建模和计算机技术帮助决策者解决问题。作为国外一本优秀的数据、模型与决策的教材,本书具有以下特色: 1.对枯燥、复杂和技术化的数学问题用简明易懂的语言予以解释,兼顾严谨的数理逻辑。 2.突出建模分析框架和基础逻辑的讲授和训练,在某种程度上实现了艺术与科学的有机融合。 3.课后习题丰富,并配有网络题库,供自学者加强训练,及时检查对理论模型及其求解方法的掌握程度。 第12版把修订重点放在企业和组织的*技术发展上,增加了商业分析(第1章)、项目风险(第8章)以及数据挖掘(第14章)等内容。
现今,数据已无处不在、无时不用,数据驱动管理决策、科学研究、技术发明、经济生活,数据驱动创新发展,数据成为企业资产、成为生产要素。开发大数据应用、实现数字化转型、提升核心竞争力是各类主体所希望的。开发一个大数据应用项目,需要进行充分的数据准备和技术准备,设计好实施方案,解决实际应用中的问题。本书介绍了多个领域的大数据应用案例研究与实践,包括工业、农业、金融、物流、旅游、气象、医疗、城市管理、城市交通等领域。这些应用案例涵盖了大数据应用的大部分领域,也从一个侧面展示了大数据在实际应用中的挑战。
本书系统地阐述信息传播问题中所涉及的各种传播模型、数学优化方法以及计算方法等,并通过对大量信息传播的实际问题进行了建模与分析。该著作将为人工智能、大数据、管理科学、运筹学、人文社会科学等领域开展相关研究的本科生、研究生以及学者提供重要的参考。
内容简介这既是一本系统讲解数据资产价值变现的入门书,又是一本全面介绍数据要素的科普书,它能帮助零基础的读者厘清数据要素各种概念并建立系统的知识体系,同时还能掌握数据资产价值变现的认知、实现路径和实操方法。本书由凯捷咨询前亚太区副总裁、阿里云中国区前咨询总经理撰写,全球数据资产理事会(DAC)联合出品。本书是《精益数据方法论:数据驱动的数字化转型》一书的姊妹篇,后者讲了如何制定数据战略、梳理数据场景、开发数据产品,如何利用精益数据方法转型为数字化企业;前者为数字化企业的数据资产变现给出了方案。全书一共17章,分为5篇。第一篇 数据要素基础与政策环境首先详细介绍了数据要素的定义、特征以及20余个该领域的相关概念,彻底厘清读者对数据要素的认知;然后全面分析了国家在数据要素领域的布局以及与之相
本书的主要内容有:研究数据管理趋势,包括技术发展、法规要求和隐私问题。深?了解可拓展架构,学习各组件之间如何协同?作。探索数据治理和数据安全、主数据管理、?助式数据市场,以及元数据的重要性。
本书的主要内容包括网络数据的定义及相关指标、大规模网络中的链路预测、网络聚类分析、网络数据中的空间自回归模型、大规模网络数据中的模型估计方法、网络数据中的空间自回归模型的拓展及应用、网络中的空间自回归模型的其他研究方向等。本书关注大规模网络数据分析中的模型方法。除模型方法本身的理论拓展之外,在估计方法等方面会涉及大规模数据中的快速计算方法。由于网络分析本身的范围非常广泛,故本书涉及的内容仅局限于作者及团队研究工作中使用到的一部分。在本书的后,为了启发读者思路,对于部分已有网络研究进行了梳理。
本书的主要内容是作者及其合作者在复杂数据模型这一领域近些年的研究成果, 以及相关的最新进展. 全书共 6 章. 第 1 章简要介绍几类复杂数据模型和 bootstrap 等预备知识和相关研究问题. 第 2~6 章, 系统讨论各种复杂数据统计推断中的 bootstrap 基本理论、方法及其应用, 包括 Behrens-Fisher问题、异方差回归模型、异方差 ANOVA 和 MANOVA 模型、混合效应模型及高维数据分析中的 bootstrap 统计推断.
从统计学科与计算机科学的性质认知,大数据是指那些超过传统数据系统处理能力、超出经典统计思想研究范围、不借用网络无法用主流软件工具及技术进行单机分析的复杂数据的集合,对于这一数据集合,在一定的条件下和合理的时间内,我们可以通过现代计算机技术和创新的统计方法,有目的地进行设计、获取、管理、分析,揭示隐藏在其中的有价值的模式和知识。 《大数据:统计理论、方法与应用》共分五章,其内容包括大数据下的统计理论体系、大数据下的数据集整合分析、大数据下的高维变量选择方法、大数据下的统计方法并行计算和大数据下的统计方法应用——网络舆情分析。 本书内容新颖,取材国内外资料,同时认真总结了作者近年来的科研成果,重点反映统计学对大数据发展的影响,突出五大特点: (1)充分体现学科融合; (2)
在传统的数据处理流程中,总是先收集数据,然后将数据放到DB中。当人们需要的时候通过DB对数据做query,得到答案或进行相关的处理。这样看起来虽然很好合理,但是结果却很好的紧凑,尤其是在一些实时搜索应用环境中的某些具体问题,类似于MapReduce方式的离线处理并不能很好地解决问题。这就引出了一种新的数据计算结构---流计算方式。它可以很好地对大规模流动数据在不断变化的运动过程中实时地进行分析,捕捉到可能有用的信息,并把结果发送到下一计算节点。本书讲解流计算原理。
本书基于主题划分章节,每一章归纳总结了对应的常见问题和解决方法。本书第1章是R基础知识,包括包安装和数据加载;第2章是绘图概述,帮助读者快速绘制基本图形;第3章至第6章具体介绍绘制几种不同图形(如条形图、折线图和散点图等)的方法;第7章至 2章讨论如何修改图形的各个元素(如注解、坐标轴、标题、图例和配色等); 3章介绍其他难以清晰分门别类的图形; 4章介绍将R绘制的图形以不同的格式导出的方法; 5章讨论数据处理的相关问题。 本书由浅入深,脉络分明,适合数据分析、数据处理和数据可视化的初学者;此外,本书对有一定数据分析、数据处理和数据可视化工作经验的读者,也是一本方便的速查手册。
本书分为:绪论、智能风控的理论基础、基于大数据的智能风控系统技术架构、数据结构化表示与实时融合技术、知识工程及知识图谱技术应用、机器学习及人工智能在风控中的应用、规则引擎技术应用及优化、智能风控技术实战应用案例、总结与展望。 本书的目的是通过总结税收征管与风先甄别项目的实施经验,将项目的核心技术架构抽象为一个通用的智能风控系统解决方案,并对方案中用到的理论基础、具体技术、常见问题及解决办法等进行较为详细的说明,为其他行业开展风控系统建设提供有价值的借鉴。
本书系统讲授数据挖掘的原理、主要方法及其Python实现,共分三部分:第一部分包含第1~2章,介绍数据挖掘的基本概念、流程和数据预处理;第二部分包含第3~11章,介绍经典的分类算法(包括朴素贝叶斯分类器、决策树、k-近邻、支持向量机等)、经典的聚类分析、关联分析、人工神经网络和Web挖掘等方法;第三部包含第12~14章,共有3个综合案例,包括泰坦尼克号生存数据分析、心脏病预测分析和旅游评论倾向性分析。
《数据挖掘算法与Clementine实践》主要介绍了几种最成熟的数据挖掘方法,并针对每种方法,,介绍了应用最广泛的几种实现算法。书中以Clementine12.0为平台,用实例介绍了每种算法的具体应用。全书各章分别介绍了数据挖掘和Clementine软件、决策树分类方法(包括ID3、C4.5、c5.o、CART等算法)、聚类分析方法(包括K-Means算法和TwoStep算法)、关联规则挖掘方法(包括Apriori算法、CARMA算法和序列模式挖掘算法)、数据筛选算法(包括特征选择算法和异常检测算法)、回归分析方法(包括线性回归算法和二项Logistic回归)、神经网络构建方法(包括多层感知器网络、RBF网络以及Kohonen网络的构建算法)、时间序列分析方法(包括指数平滑法和ARIMA模型构建方法)。