这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第一部分(第1~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数据的管理方式和
《Python数据分析与大数据处理从入门到精通》主要讲解数据分析与大数据处理所需的技术、基础设施、核心概念、实施流程。从编程语言准备、数据采集与清洗、数据分析与可视化,到大型数据的分布式存储与分布式计算,贯穿了整个大数据项目开发流程。本书轻理论、重实践,目的是让读者快速上手。1篇首先介绍了Python的基本语法、面向对象开发、模块化设计等,掌握Python的编程方式。然后介绍了多线程、多进程及其相互间的通信,让读者对分布式程序有个基本的认识。第2篇介绍了网络数据采集、数据清洗、数据存储等技术。第3篇介绍了Python常用的数据分析工具,扩展了 多的数据清洗、插值方法,为 终的数据可视化奠定基础。第4篇是大数据分析的重点。首先介绍了Hadoop的框架原理、调度原理,MapReduce原理与编程模型、环境搭建,接着介绍了Spark框架原理
《数据库原理及新技术研究》对数据库理论、方法及新型数据库技术等知识进行阐述,内容涉及数据模型、系统结构、研究领域、关系模型及关系操作、SQL语言基础及数据库操纵功能、关系数据的查询优化、关系数据规范化理论、数据库安全、恢复及并发控制技术等,同时还对一些新型数据库技术进行了讨论,包括XML数据管理、实时数据库、多媒体数据库、移动对象数据库、时态数据库、空间数据库、主动数据库、数据挖掘等。 《数据库原理及新技术研究》内容丰富、取材先进、文字表述简单扼要,是一本比较适合数据库领域研究爱好者的实用性强的学术著作类图书,同时对相关领域的研究人员也是一本颇为有益的参考书。
《企业数据治理与SAPMDG实现》从讲解大数据与企业数据治理之间的重要关系出发,首先阐述数据治理在企业数字化转型过程中的定位与作用。然后通过讲述数据治理框架以及企业数据管理规划等方面的基础内容来阐述数
本书涵盖数据分析与数据挖掘的基础知识、推荐工具和有效实践方法,能让读者充分掌握数据分析与数据挖掘的基本技能。本书共分为15章,主要内容包括大数据获取、数据预处理、探索性数据分析、用Sklearn估计器
暂无内容简介。。。。。。
想真正学会数据科学,你不仅要掌握工具——数据科学库、框架、模块和工具包——还要理解它们背后的思想和原理。 新的《数据科学入门》第2版为你展示了这些工具和算法是如何从零开始实现的。 如果你具备数学能力和一些编程技能,作者Joel Grus将会帮你熟悉数据科学相关的核心数学和统计学知识,以及作为一名数据科学家所需的黑客技巧。这本 新的书还包含了关于深度学习、统计学和自然语言处理的新资料,为你展示了如何在日常繁杂冗余的数据中找到宝石。 快速入门Python 学习线性代数、统计学和概率的基础知识——以及它们在数据科学中的使用场景 收集、探索、清理、管理和操作数据 深入研究机器学习的基础知识 实现k近邻、朴素贝叶斯、线性回归、逻辑回归、决策树、神经网络和聚类等模型 探索 系统、自然语言处理、网络分析、Map
本报告为系列成果之一,是基于欧洲可持续发展需要,对欧洲能源互联网发展的系统谋划。内容共分7章:第1章介绍欧洲经济社会、资源环境和能源电力发展现状;第2章分析欧洲可持续发展和能源转型面临的挑战,并提出欧洲能源互联网发展思路;第3章在实现 2摄氏度温控目标的指引下,展望欧洲能源电力转型发展趋势,提出情景预测;第4章研究清洁能源资源分布和大型发电基地布局;第5章基于电力平衡分析,研究提出电网互联总体格局和互联方案;第6章评估构建欧洲能源互联网所能带来的综合效益;第7章展望实现 1.5摄氏度温控目标的欧洲能源电力清洁发展路径与情景方案。 希望本报告能为政府部门、 组织、能源企业、金融机构、研究机构、高等院校和相关人员开展政策制定、战略研究、技术创新、项目开发、 合作等提供参考。
本书是一本专门论述大数据采集与处理相关技术及应用的著作,也是一线研发工程师的实战经验结晶。本书依次介绍了大数据采集、大数据预处理、大数据存储与计算、大数据安全等相关内容,并结合大数据应用各行业背景,介绍了电商、煤炭、教育、医疗、电信、交通等行业的大数据采集与处理。 ,本书以某电商网站数据分析为背景,介绍一个完整的数据采集、清洗、处理的离线数据分析案例,以期给读者展示一个系统的实践操作过程。与本书所述技术相关的论著较少,所著内容新颖、系统全面、实践指导性强。
本书通过系统、科学的调查和诊断,通过系统的规划和研究, 提升宣传工作人员的政治理论素质和专业工作能力,并结合媒体融合生态下大数据、跨学科、超学科等发展特征,对宣传工作人员的拓展能力进行了归纳和展望, 好地适应企业新闻宣传和品牌建设工作需要,成为宣传工作人员的日常工具书。
Calcite 是一款开源的动态数据管理框架,其目标是一种方案适应所有需求场景,能为不同计算平台和数据源提供统一的查询引擎,它对于没有高并发、低延时的多数据源间的数据管理有着天然的优势,是解决多数据源统一管理问题的利器。 本书围绕Calcite,结合其数据库基础知识、核心理论以及相关的项目实践情况,从SQL 的解析、校验、优化、执行等流程,对Calcite 组件进行介绍。同时本书为部分章节配置对应的代码和实例,帮助读者加深理解。 本书内容由理论到实践,将源码解析与实际案例相结合,可以作为Calcite 新手的入门图书以及快速上手的参考书,也可以作为大数据开发人员和从业人员的学习用书,还可以作为相关培训机构以及高等院校的教学用书。
Calcite 是一款开源的动态数据管理框架,其目标是一种方案适应所有需求场景,能为不同计算平台和数据源提供统一的查询引擎,它对于没有高并发、低延时的多数据源间的数据管理有着天然的优势,是解决多数据源统一管理问题的利器。 本书围绕Calcite,结合其数据库基础知识、核心理论以及相关的项目实践情况,从SQL 的解析、校验、优化、执行等流程,对Calcite 组件进行介绍。同时本书为部分章节配置对应的代码和实例,帮助读者加深理解。 本书内容由理论到实践,将源码解析与实际案例相结合,可以作为Calcite 新手的入门图书以及快速上手的参考书,也可以作为大数据开发人员和从业人员的学习用书,还可以作为相关培训机构以及高等院校的教学用书。
随着信息化技术的快速发展与普及,大数据迅速发展成为科技界、企业界甚至政府关注的热点,并在搜索引擎、互联网金融、电子商务、医疗卫生等诸多领域已经开始产生重大影响。专利作为 自主创新成果的重要载体,专利大数据具有重要的启发性、可靠性和准确性,从而成为 有研究价值的大数据体系之一。 本书通过以数据为核心的分析理念,以专利服务运营为导向的大数据思维和分析方法,以容器为载体的数据优化集成,汇聚专利智慧,助力专利服务和运行。本书从专利大数据的特点出发,基于容器思想的精髓,将容器思想引入专利大数据的处理,将专利分析中常用的两种服务类型与容器结合,实现容器与专利分析、专利运营的结合,利用容器技术为专利分析和专利运营的过程服务,对专利分析和专利运营的全生命周期进行分析,对专利数据进行建模
随着信息化技术的快速发展与普及,大数据迅速发展成为科技界、企业界甚至政府关注的热点,并在搜索引擎、互联网金融、电子商务、医疗卫生等诸多领域已经开始产生重大影响。专利作为 自主创新成果的重要载体,专利大数据具有重要的启发性、可靠性和准确性,从而成为 有研究价值的大数据体系之一。 本书通过以数据为核心的分析理念,以专利服务运营为导向的大数据思维和分析方法,以容器为载体的数据优化集成,汇聚专利智慧,助力专利服务和运行。本书从专利大数据的特点出发,基于容器思想的精髓,将容器思想引入专利大数据的处理,将专利分析中常用的两种服务类型与容器结合,实现容器与专利分析、专利运营的结合,利用容器技术为专利分析和专利运营的过程服务,对专利分析和专利运营的全生命周期进行分析,对专利数据进行建模