《华为数据之道》 这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 ============= 《华为数字化转型之道》 本书由华为公司质量与流程IT团队官方出品,从认知、理念、转型框架、规划和落地方法、业务重构、平台构建等多个维度全面总结和阐述了华为自身的数字化转型历程、方法和实践,能为准备开展或正在开展数字化转型的企业提供系统、全面的参考。
《数据库系统概念》是数据库系统方面的经典教材之一,其内容由浅入深,既包含数据库系统基本概念,又反映数据库技术新进展。它被国际上许多大学所采用,包括斯坦福大学、耶鲁大学、得克萨斯大学、康奈尔大学、伊利诺伊大学等。
《华为数据之道》 《华为数据之道》 这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在优选170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第一部分(~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细
本书英文原版由全球数据中心业内专家共同编写,中文版由国内数据中心业内专家共同翻译并修订完成。内容涵盖了数据中心全生命周期的相关技术及运营管理策略。从数据中心规划、选址、设计、建设、测试、验收、运营到灾备,内容全面详实。是作者及译者多年经验所得。是一本来自全球不同国家、不同企业、不同专业领域的专家共同完成的杰作。 本书可作为数据中心设计者、建设者、管理者以及投资者的学习及参考材料,亦可作为高校相关专业学生及其他人士了解数据中心行业的入门材料。
本书以敏捷分析工具Tableau为基础,部分章节辅以SQL讲解,系统介绍了数据可视化分析的体系和方法,内容涵盖问题分析方法、数据合并和建模、可视化图形的选择和构建、多种交互方式及其组合、仪表板设计与高级交互、基本计算和高级计算等。 本书以Tableau Desktop的应用为中心,借工具讲解原理,以原理深化工具应用,并由点及面地介绍了业务分析的思考和原理,特别是提出了实践性的"业务 数据 分析 层次框架,并以三类"详细级别 的概念贯通数据模型、高级筛选和高级计算三大主题。 本书重点介绍工具应用背后的思考方式和原理,帮助读者建立"详细级别 的思考框架,举一反三,从而实现多维、结构化分析。
本书介绍了数据工程生命周期,并展示如何组合运用各种云技术来满足下游数据消费者的需求。本书分为三部分:第一部分介绍了数据工程的定义、数据工程的生命周期、合理的架构设计和帮助技术选型的框架;第二部分深入介绍了数据工程生命周期的每个阶段 数据生成、存储、获取、转换和服务;第三部分讨论了数据工程的重要部分 安全和隐私。附录还介绍了与处理数据文件和评估数据系统的性能有关的序列化和压缩,以及云网络。本书适合软件工程师、数据科学家、数据工程师和数据分析师等相关技术人员阅读。
作为数据仓库和商业智能(DW/BI)行业中有影响力的领军人物,RalphKimball、MargyRoss得到了世界范围内的认可和尊重,他们在《数据仓库与商业智能宝典(第1版)》中确立了行业标准。现在,在《数据仓库与商业智能宝典(第2版)成功设计、部署和维护DW/BI系统》中已经更新了65篇DesignTip和白皮书,从而汇集了DW/BI技术创新前沿的著作。 从项目规划和需求收集,到维度建模、ETL和BI应用,《数据仓库与商业智能宝典(第2版):成功设计、部署和维护DW/BI系统》涵盖了你在数据仓库和商业智能中将会遇到的所有内容。这些无与伦比的文章提供了成功地设计、部署和维护DW/BI系统的重要建议。 启动DW/BI项目和收集需求的注意事项 集成式企业数据仓库的要素,其中包括总线架构和矩阵 事实表的粒度性和三种基本类型 渐变维度技术 星型模式、
本书是一本指导DBA进行数据库开发和运维的实用手册,本书共9章,包括漫谈数据库、如何提升数据库性能、如何运维好数据库、如何进行数据库设计、如何做好数据库之间的数据同步、认识HTAP技术、认识数据库的功能原理、认识数据库中的数学(逻辑与算法),以及DBA的日常:数据库管理及开发的最佳实践。另有附录DBA杂谈。 本书内容是资深DBA多年实践经验的归纳总结,涵盖DBA日常工作中的主要方面,通过剖析众多的真实案例,并解读原理、分享技巧、提供思路,内容具备较强的启发性和指导性。 本书的受众包括但不限于想要了解如何提升数据库性能的应用开发人员、DBA、业务架构师、IT架构师、数据架构师、数据分析师、系统架构师、解决方案架构师和企业高级管理人员。
本书详细介绍了Oracle、MySQL、PostgreSQL、SQL Server、DB2等各种关系数据库的SQL查询技巧和一些基础的SQL查询语句,并且通过短小精悍的实例,不仅讲解了如何插入、更新和删除数据,还介绍了如何检索记录、为查询结果排序、同时操作多张数据库表、查询元数据、处理涉及字符串和数值的操作、根据时间数据和日期数据进行运算、执行层次查询和区间查询等。随着多种SQL实现大量采用窗口函数,本书第2版针对相关实例做了优化,还新增了为数据科学家和算法工程师量身定制的实例。
本书提供了学习大数据技术及架构的一站式解决方案,覆盖了大数据生态圈中的完整技术体系,包含以下内容。 . 一、数据采集 日志数据采集工具(Flume 、Logstash、Filebeat ) 数据库数据采集工具(离线采集工具 Sqoop、DataX,实时数据采集工具 Canal、Maxwell 网页数据采集工具 物联网数据采集工具 消息队列中间件 . 二、数据存储 分布式文件存储之HDFS NoSQL数据库之HBase NoSQL数据库之Redis . 三、离线数据计算 离线计算引擎MapReduce 离线计算引擎Spark . 四、实时数据计算 实时计算引擎Storm 实时计算引擎Spark Streaming 新一代实时计算引擎Flink . 五、OLAP数据分析 离线OLAP引擎(Hive、Impala、Kylin) 实时OLAP引擎(Druid、ClickHouse、Doris) . 六、全文检索引擎 Lucene Solr Elasticsearch . 七、分布式任务调度系统 Azkaban Ooize DolphinScheduler . 八、分布式资源管理 YARN的原理、架构 YARN
《 区块链知识 大众普及版 》 本书只从外部来介绍区块链这个事物,注重的是普通人的理解,基本不涉及技术内容。内容覆盖了区块链常见知识的95%,适合大众了解和认识区块链。从区块链技术的诞生、特点、主要发展历程、热点概念、相关原理等内容都做了完整的介绍,并介绍了当前典型的区块链应用,如区块链电子发票,DCEP等。还介绍了区块链领域的监管、安全、危害等内容。同时分析了国内外对区块链的态度与指导思想,鼓励方向与政策等内容。 《区块链知识 技术普及版》 本书覆盖了区块链的技术基础知识,适合技术从业者从技术角度认知区块链。技术普及版用一种类似庖丁解牛的方式,将区块链技术的肌肉、骨骼、灵魂,逐一分解来讲解,是当前区块链知识技术分解比较完整和全面的一本书。 《图灵区块链》 有了《区块链知识-大众普及版
看似佛系,其实只是不思进取;在朋友圈假装热爱生活,真实的自我只敢去微博展露;年初列了无数计划,年底全成了打脸的笑话;人前装得无懈可击,活得却比谁都软弱无力 本书作者赵德昊, 毒鸡汤 公众号创始人,凭借《不会偷懒还假装勤奋,怪不得你又累又穷》《你这不是抑郁,是没钱和缺爱的正常表现》《就算朋友遍天下,你还是个nobody》等爆文圈粉无数。 这些热辣酸爽的金句,引起无数年轻人共鸣,也映照出他们在当下焦虑生活中无力挣扎的现实。61篇犀利扎心的硬核文章,不卖情怀只给解药,愿这些狠话能为你打破思维桎桔,重塑人生。 生活虽不易,但请你干万别假装。
数据包络分析(DEA)方法是一种应用广泛的效率评价方法。本书结合作者近年来的研究成果,将数据包络分析方法进行扩展与集成,使之成为一种开展系统综合评价的有效方法。本书重点介绍DEA公共权重配置和DMU完全排序方法、DEA中DMU结构分析和效率分解方法、不确定信息条件下的鲁棒DEA方法、径向和非径向DEA集成效率测度方法、基于DEA的资源配置和目标分解方法等DEA领域的前沿建模方法。同时本书还介绍了DEA方法在能源与环境绩效评价、银行和供应链效率分析中的应用。
本书以MySQL 8.0为主,全面系统地阐述了MySQL日常使用及管理过程中的一些常用知识点:安装、复制、binlog、备份、监控、DDL、线程池、中间件、常用工具、组复制、InnoDB Cluster、JSON、MySQL 8.0的新特性。 本书定位于实战,目的是让读者拿来即用,快速上手MySQL。除了实战,本书还花费了大量的篇幅来讲解MySQL中一些常见操作、常用工具的实现原理。 组复制是MySQL官方推荐的高可用方案,本书会从源码角度分析组复制的一些核心模块的实现细节,包括分布式恢复、冲突检测、事务一致性以及流量控制机制等。
在当今社会,高效管理数据是一种思维方式,也是一种能力。越来越多的公司和岗位看重这一点。本书的核心理念是基于MySQL将学习数据管理的过程自然融入日常生活,使学习变得轻松,而不再是一项艰巨的任务。本书采用引入故事场景的方式来呈现SQL语句的适用情景,并以此来解释其使用原理,帮助读者更好地理解SQL语言的本质。本书不仅是一本技术入门指南,也是一次走进SQL世界的探索之旅,旨在为初学者提供全面、易于理解、实用的学习体验。
《Oracle PL SQL程序设计(第6版)》基于Oracle数据库12C,从用PL SQL编程、PL SQL程序结构、PL SQL程序数据、PL SQL中的SQL、构造PL SQL应用程序、**PL SQL主题这6个方面详细而系统地讨论了PL SQL以及如何有效地使用它。本书能够帮助你充分利用PL SQL来解决数据库开发中遇到的各种问题,引导你掌握各种构建应用的技巧和技术,以便使你编写出高效、可维护的代码。本书不但介绍了*量Oracle数据库12C的PL SQL新性能,还提供了许多优化PL SQL性能的新方法。 《Oracle PL SQL程序设计(第6版)》结构清晰,示例丰富,实践性强,适用于Oracle数据库开发人员、Oracle数据库管理员等相关数据库从业人员,也可以作为各*、中专院校相关专业师生的参考用书和相关培训机构的培训教材。
本书按照需求规划、需求实现、可视化的流程进行编排,通过项目开发的主要流程,介绍数据仓库的搭建过程。在整个数据仓库的搭建过程中,本书介绍了主要组件的安装部署、需求实现的具体思路,以及各种问题的解决方案等,并在其中穿插了许多与大数据和数据仓库相关的理论知识,包括数据仓库的概念、电商业务概述、数据仓库理论和数据仓库建模等。 本书共14章,其中,第1~3章是项目的前期准备阶段,主要介绍了数据仓库的概念和搭建需求,并初步搭建了本数据仓库项目所需的基本环境;第4~7章是项目的核心部分,详细介绍了数据仓库的建模理论,并完成了数据从采集到分层搭建的全过程,是本书的重点部分;第8~14章是对数据治理各功能模块的实现,针对数据治理的不同功能需求分模块进行实现。 本书适合具有一定编程基础并对大数据感兴趣的读者
本书结合理论和实践,由浅入深,全方位介绍了Hadoop这一高性能的海量数据处理和分析平台。全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。第Ⅱ部分介绍MapReduce,主题包括MapReduce应用开发;MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。第Ⅲ部分介绍Hadoop的运维,主题涉及构建Hadoop集群、管理Hadoop。第Ⅳ部分介绍Hadoop相关开源项目,主题涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供了三个案例,分别来自医疗卫生信息技术服务商塞纳(Cerner)、微软的人工智能项目ADAM(一种大规模分布式深度学习框架)和开源项目Cascading(一个新的针对MapReduce的数据处理API)。本书是一本权威、全面的Hadoop参考书和工具书,阐述了Hadoop生态圈的近期新发展和应用,程序员可以从
本书结合理论和实践,由浅入深,全方位介绍了Hadoop这一高性能的海量数据处理和分析平台。全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。第Ⅱ部分介绍MapReduce,主题包括MapReduce应用开发;MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。第Ⅲ部分介绍Hadoop的运维,主题涉及构建Hadoop集群、管理Hadoop。第Ⅳ部分介绍Hadoop相关开源项目,主题涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供了三个案例,分别来自医疗卫生信息技术服务商塞纳(Cerner)、微软的人工智能项目ADAM(一种大规模分布式深度学习框架)和开源项目Cascading(一个新的针对MapReduce的数据处理API)。本书是一本权威、全面的Hadoop参考书和工具书,阐述了Hadoop生态圈的近期新发展和应用,程序员可以从
本书针对大多数企业常见的Oracle数据库管理任务,如安装Oracle Database 11g数据库软件、创建和升级数据库、导入和导出数据、数据库的备份与恢复以及性能调优等,全面深入地介绍了Oracle Database 11g数据库管理工作。书中详细介绍了Oracle的安装、用户管理、备份和恢复、数据库管理、性能调优等内容。 本书是Oracle管理方面的权威指南,适合各个层次的Oracle数据库应用开发人员或DBA。
This comprehensive introduction to SQL Server 2005 programming serves as a useful guide for the novice as well the advanced SQL Server user.With the extensive redesign of SQL Server for the 2005 release, it proves itself to be a solid review and reference book intended to be useful well beyond your days as a beginning programmer. Covering all the fundamentals of SQL Server 2005, this developer-oriented guide begins with an exploration of the foundation objects of SQL. Each chapter builds on the previous one, gradually progressing to increasingly advanced topics. By the time you've completed this book, you will be prepared to perform as an efficient SQL Server 2005 programmer, and, when ready, move on to the more advanced Professional title. 作者简介: Robert Vieira is one of the leading authorities on Microsoft SQL Server and author of the bestselling title from Wrox Press, Professional SQL Server 2000 Programming, with nearly 40,000 copies in print. Vieira is currently a Software Architect for
本书基于 Spark 2.4.X版本,以 Spark商业案例实战和 Spark在生产环境下几乎所有类型的性能调优为核心,以 Spark内核解密为基石,对企业生产环境下的 Spark商业案例与性能调优抽丝剥茧地进行剖析。全书共分 4篇,内核解密篇基于 Spark源码,从一个实战案例入手,循序渐进地全面解析 Spark 2.4.X版本的新特性及 Spark内核源码;商业案例篇选取 Spark开发中*代表性的经典学习案例,在案例中综合介绍 Spark的大数据技术;性能调优篇覆盖 Spark在生产环境下的所有调优技术;Spark AI解密篇讲解深度学习实践、 Spark PyTorch案例实战、Spark TensorFlow实战以及 Spark上的深度学习内核解密。 本书适合所有 Spark学习者和从业人员使用。对于有分布式计算框架应用经验的人员,本书也可作为 Spark高手修炼的参考用书。本书还适合作为高等院校的大数据课程教材。