在云计算和互联网快速发展的驱动下,分布式技术领域产生了很多新的热点,分布式数据库就是其中之一。但是,目前对分布式数据库的理解和研究多停留在理论层面,本书以Greenplum分布式数据库为例,深入剖析分布式技术在工业级产品里的实现细节,为读者呈现从理论到实践的 全景图 。 本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。 本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现,实践性强。本书主要面向数据库领域的科研工作者
数据建模指的是对现实世界各类数据的抽象组织,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库。而数据模型是构建应用系统的核心,是尽可能精准地表示业务运转的概念性框架。本书通过平实的语言,对数据模型及建模过程进行了深入浅出的介绍。全书内容分为5个部分,对数据建模简介、数据模型要素,概念、逻辑和物理数据模型、数据模型质量以及数据建模的进阶内容等方面进行讲解,全面细致地为读者解答与数据建模相关的知识点和疑问。除此之外,本书的zui后还对各类专业术语进行了细致的解释,方便读者参考。本书是一本经典的数据建模指南,非常适合对数据建模感兴趣的读者以及从事数据科学等相关工作的专业人士参考阅读。
本书详细介绍了意大利那不勒斯菲里德里克第二大学Massimo Aria和Corrado Cuccurullo基于R语言开发的BIBLIOMETRIX工具包。该R工具包基本上涵盖了进行科学计量和知识可视化的功能,可以满足爱好R软件,并试图使用R进行科学计量和知识图谱分析的读者。在此基础上,本书对于科学计量与知识图谱相关的一些R工具包,包括rAltmetric、wordcloud2、gender以及tidytext等工具包进行了简要介绍。
如今,推荐算法已经普遍应用于在线各个领域和场景,越来越多的商品、服务、用户通过推荐算法高效地连接彼此,每个人都享受到更加个性化的内容和服务。推荐已深刻地改变了我们与世界连接的方式。 本书聚焦在产品运营的角色上,探讨产品运营人员应该如何理解推荐算法,如何在不同的功能场景下应用推荐算法,如何从平台业务的角度对算法结果进行干预和再平衡。此外,本书着重于阐述不同功能场景下推荐的应用,辅以内容、电商、社交等业务下的应用实例。在每个章节中,都会枚举市面上已有产品功能或作者本人经历过的业务实践,以期给读者提供可以实操落地的借鉴。
本书主要介绍了数据可视化的基础知识、可视化工具的入门和应用、使用Python流行的库创建美观的数据可视化效果,并总结了了7大类40种不同的可视化图形,从基本信息、构成与视觉通道、适用数据、使用场景、注意事项、变体等多方面详细介绍了每种可视化图形的使用权方法,可作为常用可视化图形的使用手册。本书还提供了6个贴近大学生学习生活的可视化案例,为读者自由灵活应用可视化参考提供了有力的参考。 本书可作为高等院校数据科学与大数据技术、统计学及其相关专业的本科课程教材,也可供有一定实践经验的软件开发人员、管理人员作为自学和参考用书。
技术文档翻译关乎企业全球化进程,是我国语言服务行业重要但却长期被忽视的领域,其翻译质量受制于译员对专业领域知识的系统理解。为帮助译员高效习得领域知识,本书借助知识本体技术,模拟人类认知思维过程,以云计算领域为例,构建了面向技术文档翻译的知识服务平台,论述了其构建原理、模型、流程及应用前景等。本书的研究源于技术写作行业实践,诉求于翻译人才专业知识水平的提高,延伸于企业国际形象建设,落脚于知识服务体系探索,回归于技术文档翻译质量。此过程体现了应用翻译研究与其他学科交叉融合的发展本质,更体现了数字人文建设的旨归。
近年来,针对互联网数据滥用、平台垄断、隐私泄漏等问题,全球兴起了Web3.0探索热潮,力图通过区块链等技术重构新一代互联网。2021年,国家《 十四五 数字经济发展规划》中指出,要推动数字技术在数据流通中的应用,鼓励企业、研究机构等主体基于区块链等数字技术探索数据授权使用、数据溯源等应用,提升数据交易流通效率;2022年,国务院《关于数字经济发展情况的报告》中也指出,数字经济成为重组全球要素资源、重塑全球经济结构、改变全球竞争格局的关键力量,其发展离不开区块链等数字产业。区块链的分布式账本和智能合约实现了数据的确权、定价、交易和赋能,是Web3.0中数字经济的 新基建 ,也是元宇宙的创作者所有权经济的基础。本书以笔者团队负责的真实区块链应用案例为蓝本,深度剖析了区块链如何赋能金融科技、智慧能源、企业管理和
本书是由斯普林格出版社2018年出版的介绍物联网雾计算前沿技术的书籍,全书详细介绍了物联网雾计算发展的背景及驱动因素,系统分析了雾计算的计算服务、存储服务和通信服务;从雾层管理方面,阐述了雾计算中物联网资源评估所面临的挑战及模型,分析了雾计算的分层处理在物联网超大规模系统中的作用;从雾层服务方面,阐述了雾计算隐私保护的现状和未来,描绘了隐私保护领域自感知雾计算的发展,探讨了城市物联网边缘计算;以信息物理能源系统、医疗保健领域为例分析了雾计算应用实践。
本书定位是HBase从入门到应用的简明教程,特色是以实战案例为主,内容系统全面,讲解深入浅出,操作步骤清晰明了。本书配套示例源码、PPT课件、开发环境、教学视频、习题及答案以及其他丰富的教学 资源。 本书共分为8章,内容包括NoSQL数据库、HBase体系架构、HBase的接口、MapReduce与HBase、HBase表设计、HBase和Hive、HBase深入剖析、论坛日志分析实战。 本书既适合HBase初学者、大数据分析与挖掘初学者阅读,也适合作为高等院校和培训机构人工智能、大数据等相关专业师生的教学参考书。
《大数据相似查询关键技术研究》由清华大学计算机科学与技术系博士、华为数据库专家孙佶撰写。全书首先介绍了相似查询问题的现实应用和价值,以及面临的技术挑战;然后提出一个相似查询系统,并且介绍了高效相似查询索引、相似查询代价估算及人在回路实体相似匹配的核心技术和创新思考。全书提供了丰富的实验数据和结果,分析了各种技术的优劣,也为实际产品的技术选型提供了重要参考。 《大数据相似查询关键技术研究》共五章: 第1章绪论,介绍了全书的研究背景、研究内容及主要贡献,并概述了全书的结构安排。 第2章分布式内存相似查询系统Dima,介绍了分布式内存相似查询系统Dima。 第3章基于学习的相似查询基数估计,提出了一种基于学习的相似查询技术估计技术,使用这种基数可以帮助相似查询系统进行查询执行计划优化。 第4章基于相似
本书针对具备Linux基础的人群,主要介绍了关系型数据库MySQL、非关系型数据库 MongoDB的相关知识与应用,以生动详细的理论讲解、深入浅出的实战项目案例,帮助读 者掌握现代主流数据库的应用。本书内容包括MySQL数据库基础、索引与事务、数据库管理、 完全备份与恢复、增量备份与恢复、存储引擎等基础知识,之后的项目案例包括MySQL主 从复制与读写分离、MongoDB群集部署。 本书通过通俗易懂的原理讲解及深入浅出的案例分析,并配以完善的学习资源和支持 服务,为读者带来全方位的学习体验,包括视频教程、案例素材下载、学习交流社区、讨 论组等终身学习内容,更多技术支持请访问课工场www.kgc.cn。
本书详细介绍了一个大数据应用案例——电影推荐系统(Scala版),案例涉及数据预处理、数据存储与管理、数据分析和数据可视化等流程,涵盖Linux、MySQL、Hadoop、Spark、IntelliJ
本书为新形态教材,是一本数据分析工具书,也是一本数据可视化实践手册。涵盖了数据可视化在各行各业的重要应用,并将DataFocus软件的使用贯穿全书,既可以作为大学生理论教学的有益补充,也可以作为已进入社会、拟从事数据可视化工作的学员的工具参考书。全书共分为3个部分, 部分简单介绍了实践中常用的统计学基础知识和数据可视化的背景知识;第2部分详细介绍了DataFocus软件的安装和使用方法;第3部分包含了大量章节,运用翔实的企业数据,分多个不同的行业,讲述了企业在实际应用中所需要的数据分析和可视化的技巧、方法。
本书系统阐述了数据库系统的基础理论、基本技术和基本方法。本书在内容的编排上注重理论与实际的联系;在内容的介绍上则结合具体案例,通过专业术语和通俗易懂的案例分析的结合,由浅人深地解读数据库原理的基础理论知识。 本书共分10章。 ~5章主要介绍数据库的基础知识、基本术语、结构化程序设计语言SQL的基本语法结构、关系数据库模型及其运算基础等内容;第6~8章介绍数据库安全、并发控制、恢复技术和安全控制;第9~10章介绍数据库新技术、未来发展趋势以及数据库应用。本书每章后面都附有习题,以便学生 好地理解理论知识。 本书可作为高等院校计算机及相关专业学生的教科书,同时也可作为自学数据库的教材以及从事数据库设计的人员的参考书。
盛志伟、方睿、王宁编著的《数据库原理及应用(高等学校电子信息类十三五规划教材)》结合笔者多年的数据库教学和信息系统开发经验编写而成,详细地介绍了数据库的基础知识和数据库应用开发的相关技术。全书共10章,内容包括数据库概论、关系数据库理论、SQLServer2014的使用、数据库与基本表的创建和管理、数据库设计和建模工具、SQL语言、数据库 对象的使用、数据库系统的安全、Oracle的使用、MySQL的使用。本书主要结合MicrosoftSQLServer2014讲解数据库的应用, 介绍了Oracle11g和MySQL数据库的安装与使用方法。 本书内容丰富、注重实用,给出的许多例子来自工程实践项目,例如使用数据库建模工具ER-Studio设计数据库、分页存储过程、统计报表等。为加深读者对内容的理解和掌握,本书每章后面均附有习题,并设计了5个综合性的过程化考核题目。 本书可
本书作者在数据及对象技术方面都有很深造诣,多年的经验使他深刻地认识到:数据专业人员常常过于专注数据而忽视对象开发人员所面临的困难;而对象开发人员又没有或有很少的数据方面的经验。本书作者探索了有机结合数据和对象两个开发团队的方式,将敏捷方法拓展到了应用程序开发的一个关键领域——数据库,阐述了数据架构设计师、数据库管理员掌握敏捷方法进行面向数据开发的必要性。 本书分四部分。部分描述数据专业人员和对象专业人员所需的基本技能和方法,第二部分介绍进行渐进式数据库开发的方法,第三部分概述有效地结合使用对象技术、关系数据库技术和XML技术撤离法,第四部分总结如何成功地采用本书所描述的技术方法。本书适合应用程序开发人员及数据处理人员阅读。
C语言已经成为.NET平台中很流行的编程语言。本书以Visual Studio 2012和SQL Server 2008为开发平台,从实际应用的角度出发,重点介绍了使用C开发Windows应用程序的方