这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第一部分(第1~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数据的管理方式和
本书回顾了与现有人脸识别尤其是三维人脸图像识别研究相关的大量研究成果,探讨和总结了三维人脸识别研究需要着重解决的技术要点和以待克服的困难及问题,并在此基础上创新性地提出并实现了一种基于三维曲面形状描述符的三维人脸图像自动识别的技术框架,实现了从原始粗糙的三维人脸图像数据到 终完成人脸识别的各项必需任务。在技术框架的 阶段,关键的人脸特征(尤其是鼻尖)需要被极其 地识别和定位,从而为进行后续的人脸识别 终关键任务奠定良好的图像数据处理基础。
内容提要 《漫画数据库》是欧姆社学习漫画系列之一。本书通过漫画情节先拉近读者与数据库的距离,再以循序渐进的方式为大家说明数据库的相关知识、生活中数据库的动用、如何创建数据库等。如果您正为艰深的数据库知识伤透脑筋,那么本书将能协助您快速掌握学习诀窍,取得突飞猛进的进展。本书适合学习数据库知识的学生、初级电脑入门者阅读,同时也可供对数据库相关知识感兴趣的读者阅读。
本书以项目实践作为主线,结合必需的理论知识,以任务的形式进行内容设计,每个任务都包含任务描述及任务实施的步骤,读者按照实施步骤进行操作就可以完成相应的学习任务,从而不断提升项目实践能力。本书主要内容涉及机器学习的基础知识,模型评估与选择,回归、分类、聚类等机器学习算法,数据挖掘的基础知识,数据分析与应用,以及通过用户行为分析预测项目学习如何将机器学习与数据挖掘应用到实际中。本书适合使用机器学习与数据挖掘技术进行大数据处理的程序员、架构师和产品经理作为技术参考和培训资料,也可作为高校本科生和研究生的教材。
本书是SQL入门书籍,通过大量图解向新手读者介绍SQL入门知识,内容生动有趣、简单易懂。本书编写形式以一到两页为一个知识点,同时避免使用大段理论文字,而是通过易懂的图解来解释技术问题,让读者可以轻松学习SQL。本书主要讲解了数据库、SQL基础、运算符、函数、数据操作、保护数据等重点知识。对于想要学习SQL的读者来说,本书是一本不可多得的SQL入门参考用书。
冯丹、曾令仿编著的这本《信息存储技术专利数据分析》基于 973和863相关项目成果,采用汤森路透德温特世界专利创新索引数据库作为统计数据来源,对信息存储领域的专利文献进行检索分析,从存储器件、设备、系统等层面,选取了目前信息存储领域中的多项重要技术,利用专利统计分析的方法对其发展态势进行了研究,特别是对信息存储领域相关专利进行宏观统计分析以及核心专利的具体分析,可以 了解信息存储技术的发展历程、专利的 或地区分布、重要专利权人的竞争态势,为制定相关战略提供决策参考。本书结合华为、中兴、联想、浪潮、IBM、EMC、三星、美光等 外知名企业的实际案例,从中国本土和 的布局两个角度分别分析了专利产出、主要竞争者、热点技术和研发重点以及竞争态势,力求找到信息存储技术专利申请对技术产业化与企业发展的作用
大数据治理是传统信息治理的延续和扩展,其涉及的内容 广泛。大数据治理确保以正确的方式对数据和信息进行管理,为大数据的有效应用保驾护航,使得数据成为一个有机整体而不是各自为政。大数据治理所需的技术支撑需要涵盖大数据管理、存储、质量、共享与开放、安全与隐私保护等多个方面。本书首先对大数据治理的背景和基本概念进行简要介绍,尝试为读者提供对大数据治理的基础认识;然后从政策、管理和技术等多个方面对大数据治理相关的概念和方法加以介绍,对数据架构管理、元数据管理、主数据管理、大数据集成、数据质量管理、数据的标准化、数据资产化、数据安全与隐私保护等进行深入探讨,以期为读者提供一个比较全面的大数据治理的场景。本书适合作为高等院校“数据科学与大数据”专业的本科生、研究生的教材,也可供大数据领域的
内容简介 智能仓储大数据分析(中级)
这是一本关于“ /进阶”算法和数据结构的图书,主要介绍了用于Web应用程序、系 程和数据处理领域的各种算法,旨在让读者了解如何用这些算法应对各种棘手的编码挑战,以及如何将其应用于具体问题,以应对新技术浪潮下的“棘手”问题。 本书对一些广为人知的基本算法进行了扩展,还介绍了用于改善优先队列、有效缓存、对数据进行集群等的技术,以期读者能针对不同编程问题选出 好的解决方案。书中示例大多辅以图解,并以不囿于特定语言的伪代码以及多种语言的代码样本加以闸释。 学完本书,读者可以了解 算法和数据结构的相关内容,并能运用这些知识让代码具备 优性能,甚至能够独立设计数据结构,应对需要自定义解决方案的情况。 本书可作为高等院校计算机相关专业本科高年级学生以及研究生的学习用书,也可供从事与算法相关工作的
本书是数据分析与数据挖掘课程的实验指导书,结合大量实例全面阐述了使用SPSS系列软件进行数据分析与挖掘的原理方法和步骤全书分为两个部分,第YI部分为数据分析实验,主要介绍如何利用SPSS Statistics软件进行统计分析,具体包括T检验方差分析相关分析等十三项实验科目,第二部分为数据挖掘实验,主要介绍如何利用Clementine(SPSS Modeler)软件进行数据挖掘,具体包括关联规则挖掘决策数据分类神经网络等五项实验科目
本书的主角是在大数据时代应运而生的数据处理与分析利器——Spark。你将通过丰富的示例学习如何使用Spark的结构化数据API,利用Spark SQL进行交互式查询,掌握Spark应用的优化之道,用Spark和Delta Lake等开源工具构建可靠的数据湖,并用MLlib库实现机器学习流水线。随着Spark从2.x版本升级到3.0版本,本书第2版做了全面的 新,以体现Spark生态系统在机器学习、流处理技术等方面的发展,另新增一章详解Spark 3.0引入的新特性。
《数据分析师手记:数据分析72个核心问题精解》从底层认知、思维方法、工具技术、项目落地及展望出发,使用问答的形式对数据分析中的72个核心知识点进行讲解,构建了数据分析的知识框架,带领读者认识数据分析背后的奥妙。读者可以用本书作为学习地图,针对具体的方法、技术进行延伸学习。