本书介绍了超级计算机算力和AI算力的异同,从CPU流水线开始,描述主要的众核处理器架构和功能部件设计。在GPU和NPU等加速器部分,介绍了GPU为何能从单纯的图形任务处理器变成通用处理器。GPU在设计逻辑、存储体系、线程管理,以及面向AI的张量处理器方面成为最近几年全世界科技行业最瞩目的明星。本书对华为等厂商推出的NPU芯片设计也做了架构描述,中国也拥有独立自主知识产权的高算力芯片,并且支持多芯片、高带宽互连。本书也回顾了近20年来主流的CPU、GPU芯片架构的特点,介绍了存储与互连总线技术,即大模型专用AI超级计算机的中枢核心。
作为数据仓库和商业智能(DW/BI)行业中有影响力的领军人物,RalphKimball、MargyRoss得到了世界范围内的认可和尊重,他们在《数据仓库与商业智能宝典(第1版)》中确立了行业标准。现在,在《数据仓库与商业智能宝典(第2版)成功设计、部署和维护DW/BI系统》中已经更新了65篇DesignTip和白皮书,从而汇集了DW/BI技术创新前沿的著作。 从项目规划和需求收集,到维度建模、ETL和BI应用,《数据仓库与商业智能宝典(第2版):成功设计、部署和维护DW/BI系统》涵盖了你在数据仓库和商业智能中将会遇到的所有内容。这些无与伦比的文章提供了成功地设计、部署和维护DW/BI系统的重要建议。 启动DW/BI项目和收集需求的注意事项 集成式企业数据仓库的要素,其中包括总线架构和矩阵 事实表的粒度性和三种基本类型 渐变维度技术 星型模式、
智慧城市是5G和人工智能(artificialintelligence,AI)等前沿科技密集应用的新兴领域,也是我国实现可持续发展的重大战略选择。城市大数据的分析与应用是构建智慧城市的关键技术。城市大数据不仅具有典型的海量、异构和高价值密度的特点,还具有独特的时空感知特征和社会感知特征,这为数据建模带来了全新的挑战,但也为构建从微观到宏观的智慧城市应用带来了前所未有的机遇。本书系统地介绍了城市大数据的概念及其核心建模方法,并以作者及其所带领的科研团队近年来的研究成果为例,围绕智能预测与规律探索两类典型智慧城市应用场景,详细地阐述了国内外在该领域的前沿热点和发展趋势。本书共分7章,内容包括城市大数据概述,基于城市大数据的城市人口管理、交通管理与位置服务等微观问题,以及基于城市大数据的城市规划管理、经济发展、战略
看似佛系,其实只是不思进取;在朋友圈假装热爱生活,真实的自我只敢去微博展露;年初列了无数计划,年底全成了打脸的笑话;人前装得无懈可击,活得却比谁都软弱无力 本书作者赵德昊, 毒鸡汤 公众号创始人,凭借《不会偷懒还假装勤奋,怪不得你又累又穷》《你这不是抑郁,是没钱和缺爱的正常表现》《就算朋友遍天下,你还是个nobody》等爆文圈粉无数。 这些热辣酸爽的金句,引起无数年轻人共鸣,也映照出他们在当下焦虑生活中无力挣扎的现实。61篇犀利扎心的硬核文章,不卖情怀只给解药,愿这些狠话能为你打破思维桎桔,重塑人生。 生活虽不易,但请你干万别假装。
本书介绍Spark应用开发的面向对象和函数式编程概念,讨论RDD和DataFrame基本抽象,讲述如何使用SparkSQL、GraphX和Spark来开发可扩展的、容错的流式应用程序,*后介绍监控、配置、调试、测试和开发等高级主题。通过本书的学习,你将能使用SparkR和PySpark API开发Spark应用程序,使用Zeppelin进行交互式数据分析,使用Alluxio进行内存数据处理,将透彻理解Spark,并能对海量数据执行全栈数据分析,*终成为数据科学家。
本书中文版分为基础篇和进阶篇,深入探讨了数据挖掘的各个方面,从基础知识到复杂的数据类型及其应用,涉及数据挖掘的各种问题领域。它超越了传统上对数据挖掘问题的关注,引入了高级数据类型,例如文本、时间序列、离散序列、空间数据、图数据和社交网络数据。到目前为止,还没有一本书以如此全面和综合的方式探讨所有这些主题。 基础篇(包括原书的第1-13章)详细介绍了针对数据挖掘的四个主要问题(聚类、分类、关联模式挖掘和异常分析)的各种解决方法、用于文本数据领域的特定挖掘方法,以及对于数据流的挖掘应用。 进阶篇(包括原书的第14-20章)主要讨论了用于不同数据领域(例如时序数据、序列数据、空间数据、图数据)的特定挖掘方法,以及重要的数据挖掘应用(例如Web数据挖掘、排名、推荐、社交网络分析和隐私保护)。 本书在
本书基于主题划分章节,每一章归纳总结了对应的常见问题和解决方法。本书第1章是R基础知识,包括包安装和数据加载;第2章是绘图概述,帮助读者快速绘制基本图形;第3章至第6章具体介绍绘制几种不同图形(如条形图、折线图和散点图等)的方法;第7章至 2章讨论如何修改图形的各个元素(如注解、坐标轴、标题、图例和配色等); 3章介绍其他难以清晰分门别类的图形; 4章介绍将R绘制的图形以不同的格式导出的方法; 5章讨论数据处理的相关问题。 本书由浅入深,脉络分明,适合数据分析、数据处理和数据可视化的初学者;此外,本书对有一定数据分析、数据处理和数据可视化工作经验的读者,也是一本方便的速查手册。
《深入浅出MySQL:数据库开发、优化与管理维护(第3版)》源自网易公司多位资深数据库专家数年的经验总结和MySQL数据库的使用心得,在之前版本的基础之上,基于MySQL 5.7版本进行了内容升级,同时也对MySQL 8.0的重要功能进行了介绍。除了对原有内容的更新之外,本书还新增了作者在高可用架构、数据库自动化运维,以及数据库中间件方面的实践和积累。 《深入浅出MySQL:数据库开发、优化与管理维护(第3版)》分为 基础篇 开发篇 优化篇 管理维护篇 和 架构篇 5个部分,共32章。基础篇面向MySQL的初学者,介绍了MySQL的安装与配置、SQL基础、MySQL支持的数据类型、MySQL中的运算符、常用函数等内容。开发篇面向的是MySQL设计和开发人员,内容涵盖了表类型(存储引擎)的选择、选择合适的数据类型、字符集、索引的设计和使用、开发常用数据库对象、事务控制和
《Spark大数据商业实战三部曲:内核解密 商业案例 性能调优(第2版)》基于 Spark 2.4.X版本,以 Spark商业案例实战和 Spark在生产环境下几乎所有类型的性能调优为核心,以 Spark内核解密为基石,对企业生产环境下的 Spark商业案例与性能调优抽丝剥茧地进行剖析。全书共分 4篇,内核解密篇基于 Spark源码,从一个实战案例入手,循序渐进地全面解析 Spark 2.4.X版本的新特性及 Spark内核源码;商业案例篇选取 Spark开发中具代表性的经典学习案例,在案例中综合介绍 Spark的大数据技术;性能调优篇覆盖 Spark在生产环境下的所有调优技术;Spark+AI解密篇讲解深度学习实践、 Spark+PyTorch案例实战、Spark+TensorFlow实战以及 Spark上的深度学习内核解密。 该书适合所有 Spark学习者和从业人员使用。对于有分布式计算框架应用经验的人员,该书也可作为 Spark高手修炼的参考用书。该书还
这是一本关于如何更好、更有效地进行数据可视化的书。本书分为3个部分。部分是创建有效可视化的通用指导原则,我们将了解受众的重要性,以及思考哪类图表能更好地契合他们的需求。第2部分是本书的核心部分,我们将定义和讨论80多张图表,这些图表分为八大类:比较、时间、分布、地缘、关系、构成、定性和表格。我们将看到各类图表是如何起作用的,以及它们的优缺点。第3部分整合了两块内容,一是构建数据可视化样式指南,二是如何结合不同的经验对图表进行重新设计。
本书以经济系统效率分析为研究背景,探讨如何进一步拓展和完善DEA理论、模型及其应用.其中,第1章主要介绍效率与生产力分析中的一些概念.第2章介绍一些基本DEA模型及广义DEA模型.第3章探讨广义DEA模型的有效性度量方法.第4章分析DEA效率悖论产生的原因,并给出克服“效率悖论”出现的修正DEA模型.第5章给出一种含有中性指标的DEA模型,并讨论其在经济结构调整中的应用.第6章给出测算时间序列决策单元效率的DEA模型.第7章提出一种评价多层次复杂系统的DEA模型.第8章给出一种基于决策单元合作与竞争博弈的DEA模型.第9章给出一种用于测算个体对群体效率贡献的DEA模型. 0章给出权重受限的超效率DEA模型及投影方法. 1章给出一种用于电影衍生品市场前景综合评价的DEA模型. 2章建立一种评价大型超市选址合理性的DEA模型. 3章和 4章分别对中国省级经济发展效率和高技术产业创