本书从云存储的需求出发讲述对象存储的原理,循序渐进地建立起一个分布式对象存储的架构,并且将软件实现出来。全书共8章,分别涉及对象存储简介、可扩展分布式系统、元数据服务、数据校验和去重、数据冗余处理、断点续传、数据压缩和数据维护等。本书选择用来实现分布式对象存储软件的编程语言是当前流行的Go语言。 本书适合从事云存储方面工作的工程师或架构师,也适合想要学习和实现分布式对象存储的读者。
《Serverless架构:无服务器单页应用开发》讲授如何利用AWSLambda创建Serverless单页应用。这里,Serverless的意思是应用开发者无须管理服务器,将应用构建在服务之上,而不是运行在需要人工配置和维护的服务器之上。这种新的开发方式带来很多好处,比如节省成本,可扩展性与可靠性高,以及开发者可以专注于实现应用的业务逻辑等。全书共8章,BenRady带领读者采用这种新方法从零开始开发一个JavaScript解题应用,并且对其进行测试,最终完成部署。 对于创业者以及中小企业的开发者来说,《Serverless架构:无服务器单页应用开发》讲述的Serverless设计是一个值得了解和学习的新方法,可以从中获得启示,抓住先机。
“大数据”已连年入选IT领域的热点话题,人们每天都会通过互联网、移动设备等生产大量数据。如何从海量数据中洞悉出隐藏其后的见解是当今社会各领域人士极为关注的话题。本系列图书以“大数据分析师”应掌握的IT技术为主线,共分两卷,以7个模块(卷含4个模块,第2卷含3个模块)分别介绍大数据入门,分析和R编程入门,使用R进行数据分析,用R进行高级分析,机器学习的概念,社交媒体、移动分析和可视化,大数据分析的行业应用等核心内容,全面且详尽地涵盖了大数据分析的各个领域。 本书为第2卷,首先介绍机器学习的类型和方法,R上的图模型和贝叶斯网络、人工神经网络、使用PCA和因子分析降维法以及支持向量机,并讲解如何用R语言实现各种网络,然后介绍大数据解决方案工程、社交媒体分析和文本分析、移动分析和大数据可视化,最后通过
《大数据技术丛书·大数据治理与安全:从理论到开源实践》主要从理论和实践两个部分对大数据治理与安全技术展开详尽描述。其中理论篇主要从大数据治理的概念、作用、重要性,以及大数据治理的原则、范围及评估内容做出了详细介绍;之后从大数据安全、隐私和审计三个方面,探讨了大数据安全所面临的挑战,以及解决这些问题的技术与方案、作用与意义。开源实践篇分别从Apache的四个开源组件Falcon、Atlas、Ranger和Sentry以及Kerberos软件框架与工具介绍其在大数据治理与安全方面的功能与实践应用方案。 《大数据技术丛书·大数据治理与安全:从理论到开源实践》适用于大数据应用技术爱好者以及具有开发经验的读者,也可以作为大数据相关课程的教学参考书,供云计算、大数据相关专业方向的本科生、研究生阅读,亦可作为相关从业人员与一线软件开发
“大数据”已连年入选IT领域的热点话题,人们每天都会通过互联网、移动设备等生产大量数据。如何从海量数据中洞悉出隐藏其后的见解是当今社会各领域人士极为关注的话题。本系列图书以“大数据分析师”应掌握的IT技术为主线,共分两卷,以7个模块(卷包括4个模块,第2卷包括3个模块)分别介绍大数据入门,分析和R编程入门,使用R进行数据分析,用R进行高级分析,机器学习的概念,社交媒体、移动分析和可视化,大数据分析的行业应用等核心内容,全面且详尽地涵盖了大数据分析的各个领域。 本书为卷,首先提供大数据的概览,介绍大数据概念及其在商业中的应用、处理大数据的技术、Hadoop生态系统和MapReduce的相关内容,然后介绍如何理解分析、分析方法与工具,重点讲解流行分析工具R,介绍如何将数据集导入R和从R导出数据、在R中如何操纵和处理数据
数据仓库专家KrishKrishnan以清晰和简明的阐述,带领我们了解在大数据时代如何升级数据仓库并帮助企业做出智能决策。全书分为三部分:部分讨论大数据技术及其应用案例;第二部分讲解数据仓库技术,包括数据仓库的架构选择、工作负载和新兴技术;第三部分讨论大数据和数据仓库的集成,包括数据分析、数据可视化、信息生命周期管理、数据科学家的角色变迁等。本书适合从事数据架构、分析、挖掘等工作的技术人员和管理人员阅读,也适合学习相关专业的学生参考。
本书系统阐述了环境大数据的概念、战略规划、平台搭建、关键技术、案例应用,以及产业发展。全文共分为部分,部分为概述,介绍"互联网+”与大数据、环境大数据;第二部分为技术篇,介绍了环境大数据的平台构建、数据分析、数据采集、组织管理、分析预测、共享与服务、信息安全、运行保障;第三部分为应用篇,介绍行业案例和产业发展。