《华为数据之道》 《华为数据之道》 这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在优选170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第一部分(~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细
本书是一本全面关注工业企业数据治理方面的工具书,主要内容分为概述篇、体系篇、工具篇、实施篇及案例篇。其中概述篇主要介绍工业企业数据治理的基础概念、主流数据治理标准及框架、数据治理的发展趋势等;体系篇主要介绍数据管控、数据战略、数据架构、主数据管理等的基本原理与管理体系;工具篇主要介绍主数据管理工具、数据模型管理工具、数据资产运营工具等;实施篇主要介绍具体实施策略及路径选择、顶层架构规划与设计、数据资产运营实施等;案例篇主要介绍电力、能源化工、钢铁、制造、战略投资等行业的数据治理案例,为读者提供专业、丰富、可信的数据治理实施范例。 本书是工业大数据应用技术国家工程实验室多年潜心研究的重要科研成果的总结和凝聚,既具有理论高度,也具备面向中国工业企业的可实操性。参与本书编著的作者均
Microsoft Excel 365功能卓越,全球无数企业和个人用户使用Excel365来收集、理解和解读数据。Excel办公系列书籍在广大读者中引起热烈反响,一直畅销不衰。本书对上一版做了全面细致的更新,娓娓道来,指引你创建和使用电子表格,编写公式和自定义函数,可视化数据,以及基于组织的数据创建报表和预测。本书既适合初级用户,也适合高级用户,将帮助你解锁数据的价值和潜力。
本书主要介绍从高维数据中感知、处理、分析和学习低维结构的基本数学原理和高效计算方法,系统地归纳了建模高维空间中低维结构的数学原理,梳理了处理高维数据模型的可扩展高效计算方法,阐明了如何结合领域具体知识或考虑其他非理想因素来正确建模并成功解决真实世界中的应用问题。本书包括基本原理、计算方法和真实应用三个部分:基本原理部分系统地介绍稀疏、低秩和一般低维模型的基本性质和理论结果,计算方法部分介绍解决凸优化和非凸优化问题的有效算法,真实应用部分通过实例演示利用前两部分的知识改进高维数据处理和分析问题的解决方案。本书适合作为计算机科学、数据科学和电气工程专业的高年级本科生和研究生的教材,也适合学习稀疏性、低维结构和高维数据课程的学生参考。
本书以敏捷分析工具Tableau为基础,部分章节辅以SQL讲解,系统介绍了数据可视化分析的体系和方法,内容涵盖问题分析方法、数据合并和建模、可视化图形的选择和构建、多种交互方式及其组合、仪表板设计与高级交互、基本计算和高级计算等。 本书以Tableau Desktop的应用为中心,借工具讲解原理,以原理深化工具应用,并由点及面地介绍了业务分析的思考和原理,特别是提出了实践性的"业务―数据―分析”层次框架,并以三类"详细级别”的概念贯通数据模型、高级筛选和高级计算三大主题。 本书重点介绍工具应用背后的思考方式和原理,帮助读者建立"详细级别”的思考框架,举一反三,从而实现多维、结构化分析。
本书提供了全面、实用的建议,以保证在复杂的生产环境中,能可靠且高效地运行Oracle数据库。七位主要的Oracle专家对Oracle12c、11g和其他很近版本的Oracle数据库汇集了一系列经过验证的解决方案、实践的例子以及循序渐进的技巧。每一个解决方案都是精心设计的,以帮助有经验的OracleDBA和DMA尽可能快地理解和修复严重的问题。本书不仅涵盖了LOB段、undo表空间、高GC缓冲区等待事件、糟糕的查询响应时间、闩锁争用、索引、XA分布式事务、RMAN备份/恢复等内容,还深入地讲解了DDL优化、VLDB调优、数据库取证、自适应游标共享、数据泵、数据迁移、SSD、索引等内容,并介绍了如何解决OracleRAC问题。
本书全面、系统、深入地讲解了Oracle12c数据库原理、应用和开发,也讲解了Oracle12c常用的管理知识,以Oracle12c数据库云计算为线索,详细讲解了CDB和PDB。本书共分16章。第1章介绍了Oracle12c的基本知识、系统性能和特点,以及如何支持云计算;第2章介绍了Oracle12c的系统结构,重点阐述了CDB和PDB的概念、两者的关系以及如何创建CDB和PDB;第3章介绍了运行Oracle12c所需要的服务、这些服务的作用,以及如何启动和配置,并对SQLPLUS语言进行了较为详细的阐述;第4章介绍了PL/SQL编程;第5章介绍了数据库的表空间、概要、用户、角色,以及如何创建和使用这四个对象;第6章对Oracle12c支持的常用类型的数据表,以及如何对这些表做修改操作进行了详细介绍;第7章介绍了数据查询;第8章介绍了对表的DML操作,如何对表进行Insert、Delete、Update和Merge操作;第9章介绍了视图和物化视
本书以企业传统数据仓库的改造和全新的大数据平台建设为出发点,讨论了内存计算技术带来的根本性变革及其对企业传统数据仓库架构设计的改变,并详细介绍了在应用Hadoop等数据湖技术条件下的数据获取、数据建模、数据服务应用及管理方法。全新的大数据平台架构超越单个系统的物理界限,更多地采用虚拟建模与逻辑建模的方法,对企业内外、本地云端的全体数据进行统一的管理和应用调度,并使用机器学习技术进行各类创新应用的开发。
企业数字化转型中最适合的数据资产组织方式是什么样的? 为什么越来越多的企业在讨论标签化和标签体系? 数澜专利的标签类目体系方法论有何独到之处? 数据资产化是企业数字化转型的必经之路,也是数据中台的重要组成部分。 标签类目体系是数据中台理念落地的核心组成部分,是实现数据资产可复用、柔性组合使用、降低数据应用试错门槛的强力支撑。 数据作为第五生产要素参与分配,数据资本化的重要前提是数据商品化,数据商品化的很好载体就是标签。因此,学习如何将数据转化、映射为标签,并通过对标签的管理、应用实现数据资产的价值运营,对于商业化企业来说显得尤为重要。 本书旨在培养资深的数据资产架构师及数据运营专家,以方法教育而非工具实施的方式助力企业建立自身的数据资产化能力,将数据能力优选限度地转化为商业价值。 全
在Oracle认证大师Richard Niemiec的帮助下,系统地识别和排除数据库的性能问题:《Oracle Database 12cR2性能调整与优化(第5版)》详细介绍近期新的监控、故障排除和优化方法,取自现实世界的案例研究和很好实践贯穿全书,从中可以探悉如何鉴定和解决本地部署和云环境的瓶颈问题、如何配置存储设备、如何有效运行查询以及如何开发无错误的SQL和PL/SQL代码。此外还介绍了有关测试、报表和提高安全性等方面的内容。学会如何:? 正确运用 Oracle 12cR2数据库的索引和分区技术? 有效使用Oracle云、Oracle Exadata和Oracle企业管理器? 有效地管理磁盘驱动器、ASM、磁盘阵列和内存? 运用Oracle的SQL提示和Trace实用工具来优化查询? 运用V$视图和X$表对数据库实施故障排除? 创建少有云数据库服务并为混合云做好准备? 运用Oracle的Statspack和AWR等工具来生成报表? 运用sar、vmstat和iostat来监控操作系
《数据合规:入门、实战与进阶》结构清晰、体系完整,可使读者快速获得数据合规工作的全景式认知。开篇 明确了企业数据合规工作的基本工作范围和避坑红线。入门篇 梳理了我国及美欧的数据保护立法体系与监管情况,作为入门推荐。进阶篇 介绍了企业数据合规工作的推荐通用场景,如个保法落地、隐私政策开发、账号注销、员工个人信息保护等。高阶篇 讲解企业数据合规工作中的高难复杂场景,如个性化推荐、数据共享、生物识别信息使用、出海业务的跨境传输、企业上市中的数据合规问题等,并展望了数据合规律师向数据保护官转变的跨越式发展路径和能力要求。附 录 提供了一线数据合规工作的实用工具,如常用法条清单、数据本地存储的要求汇总等。 《数据安全实践指南》从大数据基本概念开始引入,简介大数据目前的技术应用以及技术流程,从而
本书介绍如何使用CockroachDB创建可扩展的应用,并在为最终用户提供无缝交付能力的同时保障系统性能。全书共15章,分为三部分:第一部分(第1~4章)介绍CockroachDB的历史背景,包括数据库的演进和分布式云数据库的出现,内容涵盖分布式SQL的核心概念、CockroachDB的架构和功能、CockroachDB适用场景下的用例;第二部分(第5~8章)介绍CockroachDB中模式设计的基本原理,涵盖应用的设计和实现,以及与其他数据库的集成;第三部分(第9~15章)涵盖单区域和多区域部署的规划和执行,核心内容包括备份和灾难恢复、安全、可观测性、管理和故障排除以及集群优化。
本书详细阐述了与Python数据预处理相关的基本解决方案,主要包括NumPy和Pandas简介、Matplotlib简介、数据、数据库、数据可视化、预测、分类、聚类分析、数据清洗、数据融合与数据集成、数据归约、数据转换等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。 本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学用书和参考手册。
《大数据应用发展报告》2019年卷分为总报告、指数报告、热点篇、案例篇四个部分。2019年种种迹象表明,大数据在社会生产管理实践中正日益发挥着巨大的价值和效益。本书总报告从政府大数据应用和实体经济大数据应用两个角度观察大数据当下动态。在政府大数据应用方面,本书收录了上海和合肥两篇案例文章,分别围绕政府数据开放力度加大,政府利用数据的广度及深度增加展开描述。在实体经济大数据应用方面,本书还收集了包括能源、农业、建筑、金融、5G应用、线下实体、食品、新零售等大数据应用实践案例,展现了大数据在实体经济应用方面的探索与尝试。我国目前正处于新旧动能持续转换进程中,大数据被认定为中国经济增长的新动能。本书认为,从2019年大数据整体形势看,中国大数据正在进入广泛深层次应用阶段,体现在以下几方面。一是国家
面对日渐复杂的大数据,科技工作者很难用单一的统计软件高效、完美地完成从数据挖掘、数据清洗、统计分析到结果呈现的全部工作,因此需要熟悉和掌握多种统计工具,各取所长、整合使用。本书立足于大数据研究的现状,基于实际医疗案例,介绍数学基础知识和统计学基础知识,SAS、R语言、Stata和Python这4款大数据常用分析工具的基础编程知识及实践操作。 本书主要面向在校本科生、研究生,以及要掌握SAS、R语言、Stata和Python的数据工作者,熟悉四个软件的任意一个且想要在短时间内掌握其他软件的读者,也适合医科学生、临床医生或药企人员等医疗相关人员学习使用。
《Python文轩数据分析与运营,从小白到专家,从技术到业务,一本书搞定(全2册)》由周志鹏等著
本书是“鸢尾花数学大系——从加减乘除到机器学习”丛书的第三板块(实践板块)中的一本关于数据科学的分册。“实践”这个板块,我们将会把学到的编程、可视化,特别是数学工具应用到具体的数据科学、机器学习算法中,并在实践中加深对这些工具的理解。 本书可以归纳为7大板块——数据说、数据处理、时间数据、图论基础、图的分析、图与矩阵、图论实践。这7个板块(共25章内容)都紧紧围绕一个主题——数据! 本书以数据为名,以好奇心和疑问为驱动,主动使用“编程+可视化+数学”工具进行探索。本书将会回顾鸢尾花书前五本主要的工具,让大家对很多概念从似懂非懂变成如数家珍;同时,我们还会掌握更多工具,用来扩展大家的知识网络。 依照惯例,本书提供代码和视频教学。 本书读者群包括数据科学从业者、大数据从业者、高级数据分析师、机器
《Python数据分析与挖掘,张良均老师作品,畅销10万册,200余所高校选做教材(套装)(全2册)》由张良均等著
本书详细阐述了与Pandas数据分析相关的基本知识,主要包括数据结构、数据的输入和输出、Pandas数据类型、数据选择、数据探索和转换、理解数据可视化、数据建模、在Pandas中使用时间、探索时间序列、Pandas数据处理案例研究等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。 本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学用书和参考手册。
《精益数据方法论:数据驱动的数字化转型》 这是一本用精益思想指导企业以数据为核心进行数字化转型的著作,它将帮助企业事半功倍地找到正确的数字化转型战略、方法与路径。 作者结合自己20余年的实战经验,将精益思想与数据利用深度融合,总结了一套从业务目标出发,以价值场景为抓手,以数据为驱动的精益数据方法论。进一步以该方法论为基础,衍生出精益数据花瓣模型、精益数字化转型三步法、数据驱动的六大能力模型,精益数字化转型共创工作坊,四大精益数据画布,数据驱动的成熟度评估模型,从认知到实践、从工具到方法,从路径到指南,全方位指导企业将数字化转型落地,在数字化转型大浪潮中有里程碑意义。 《精益数据分析:数据驱动商业决策与业务增长》 这是一本能指导不同业态、不同阶段的产品、项目和企业利用精益数据分析方法实
《数据中台:让数据用起来》 在数字中国这一国家战略的牵引下,数据要素和数字化转型的研究和落地如火如荼。数据中台是企业开展数据要素相关实践和数字化转型的关键基础设施,本书在这样的时代背景下,以帮助企业“管好数据、用好数据”为宗旨,内容围绕数据中台架构与建设方法论、数据中台建设流程和内容、数据中台工程化交付、数据中台行业解决方案4个维度全面、深度展开。 《华为数字化转型之道》 本书由华为公司质量与流程IT团队官方出品,从认知、理念、转型框架、规划和落地方法、业务重构、平台构建等多个维度全面总结和阐述了华为自身的数字化转型历程、方法和实践,能为准备开展或正在开展数字化转型的企业提供系统、全面的参考。
本书以企业传统数据仓库的改造和全新的大数据平台建设为出发点,讨论了内存计算技术带来的根本性变革及其对企业传统数据仓库架构设计的改变,并详细介绍了在应用Hadoop等数据湖技术条件下的数据获取、数据建模、数据服务应用及管理方法。全新的大数据平台架构超越单个系统的物理界限,更多地采用虚拟建模与逻辑建模的方法,对企业内外、本地云端的全体数据进行统一的管理和应用调度,并使用机器学习技术进行各类创新应用的开发。
本书以敏捷分析工具Tableau为基础,部分章节辅以SQL讲解,系统介绍了数据可视化分析的体系和方法,内容涵盖问题分析方法、数据合并和建模、可视化图形的选择和构建、多种交互方式及其组合、仪表板设计与高级交互、基本计算和高级计算等。 本书以Tableau Desktop的应用为中心,借工具讲解原理,以原理深化工具应用,并由点及面地介绍了业务分析的思考和原理,特别是提出了实践性的"业务―数据―分析”层次框架,并以三类"详细级别”的概念贯通数据模型、高级筛选和高级计算三大主题。 本书重点介绍工具应用背后的思考方式和原理,帮助读者建立"详细级别”的思考框架,举一反三,从而实现多维、结构化分析。