在集团内,数据人员面临的现实情况是:集团数据存储已经达到EB级别,部分单张表每天的数据记录数高达几千亿条;在2016年“购物狂欢节”的24小时中,支付金额达到了1207亿元人民币,支付峰值高达12万笔/秒,下单峰值达17.5万笔/秒,媒体直播大屏处理的总数据量高达百亿级别且所有数据都需要做到实时、准确地对外披露……巨大的信息量给数据采集、存储和计算都带来了极大的挑战。《大数据之路——大数据实践》就是在此背景下完成的。本书中讲到的大数据系统架构,就是为了满足不断变化的业务需求,同时实现系统的高度扩展性、灵活性以及数据展现的高性能而设计的。本书由数据技术及产品部组织并完成写作,是分享对大数据的认知,与生态伙伴共创数据智能的重要基石。相信本书中的实践和思考对同行会有很大的启发和借鉴意义。
本书由数据中心IT建设和运营管理(ITBOM)联盟基于国家标准GB/T 33136- 2016《信息技术服务 数据中心服务能力成熟度模型》编写。全书选取业界代表性单位,从流程关键管控点、管理要求和电子化工具等角度,对战略发展、运营保障和组织治理等各流程的真实情况进行详细说明,以期为业界的服务能力建设与成熟度提升提供参考与指导。
Spark SQL 是 Spark 技术体系中较有影响力的应用(Killer application),也是 SQL-on-Hadoop 解决方案 中举足轻重的产品。《Spark SQL内核剖析》由 11 章构成,从源码层面深入介绍 Spark SQL 内部实现机制,以及在实际业务场 景中的开发实践,其中包括 SQL 编译实现、逻辑计划的生成与优化、物理计划的生成与优化、Aggregatio算子和 Joi算子的实现与执行、Tungste优化技术、生产环境中的一些改造优化经验等。 《Spark SQL内核剖析》不属于入门级教程,需要读者对基本概念有的了解。在企业中任职的系统架构师和软件开发人员,以及对大数据、分布式计算和数据库系统实现感兴趣的研究人员,均适合阅读《Spark SQL内核剖析》。
本书是Microsoft SQL Server 2008系列中的一本。书中全面深入地介绍了T-SQL的基本元素,以及SQL Server 2008中新增加的一些特性。主要包括SQL的基础理论、逻辑查询处理、SELECT查询、连接和子查询、表表达式、过滤和分组、透视转换、修改数据、事务和一致性的处理、可编程对象等内容。 书中并非系统地罗列T-SQL的各种语法元素,而是结合实践中的各种问题,教读者如何用SQL作为语言工具来思考问题,揭示基于集合查询的强大威力。本书内容丰富、文字简洁明快,列举的实例具有的难度,而且实用性较强,可以把它们作为解决实际问题的标准模板。阅读本书,可以充分地理解T-SQL语言和获得良好的编程实践,学会如何编写更加有效而强大的查询。书中大部分章节后面都提供了练习题目,可以帮助读者更好地掌握所学的内容。 本书适合须要学习T-SQL的各级程序员和数据库
理解数据库类型、模型、设计,以及设计的术语;发现良好的数据库设计能为你带来什么好处,以及为什么不好的数据库设计会给你带来痛苦;为你的数据库设定目标,并将其付诸实际的设计;分析一个现有的数据库,以便于你掌握改进它的方法;创建表结构和表关系,设定主键,设置字段说明,并设定视图;确保每一个应用有恰当水平的数据完整性;明确和建立业务规则。
不管你愿意不愿意,我们每天都在制造和分享数据;不管你关心不关心,我们已经生活在大数据的包围之中。大数据,这个在2012年突然火爆起来的词汇,我们究竟该如何解读?《大数据(大价值、大机遇、大变革)》介绍了大数据产生的背景、特征和发展趋势,从实证的角度探讨了它对社会和商业智能的影响,并认为大数据正影响着商业模式的转变,将带来新的商业机会。能否对大数据进行处理、分析与整合将成为提升企业核心竞争力的关键!大数据,既是一场大机遇,也将引发一场大变革!《大数据(大价值、大机遇、大变革)》由李志刚主编。
Oracle是目前全球应用最广泛、功能大的关系型数据库。本书结合大量实例,详细地讲述了Oracle数据库各方面的知识。全书内容包括Oracle安装配置、Oracle常用开发工具、SQLPlus、数据表、视图、约束、函数与存储过程、触发器、序列、索引、用户与角色、内置函数、控制语句、SQL查询及更新语句、并发与锁定、正则表达式、与编程语言结合使用。为了便于读者学习与把握,在每章都使用了单独的小节来展示实例,并给出习题和答案。本书光盘附带书中所涉及的源文件和数据库脚本。同时,光盘还附带配套全程视频,以便于读者更好地掌握本书内容。本书适合Oracle数据库开发人员、基于Oracle数据库的软件程序员、Oracle数据库管理员、大专院校学生,以及对Oracle开发有兴趣的人员。本书浅显易懂、实例丰富,尤其适合广大程序员自学。
三位经验丰富的Oracle DBA联手为读者呈现这本Oracle数据库性能优化攻略。《Oracle Database 12c性能优化攻略》由表及里地深入分析了造成Oracle数据库性能缓慢的各种原因,然后给出标本兼治的性能调优方案。作者将多年的实践经验和个人智慧与读者分享,帮助读者诊治影响数据库性能的各种疑难杂症。 《Oracle Database 12c性能优化攻略》可帮助数据库管理员解决各种Oracle数据库性能问题。
理解数据库类型、模型、设计,以及设计的术语;发现良好的数据库设计能为你带来什么好处,以及为什么不好的数据库设计会给你带来痛苦;为你的数据库设定目标,并将其付诸实际的设计;分析一个现有的数据库,以便于你掌握改进它的方法;创建表结构和表关系,设定主键,设置字段说明,并设定视图;确保每一个应用有恰当水平的数据完整性;明确和建立业务规则。
Oracle数据库在关系数据库市场上一直处于领先的地位,它在数据库领域已经扩展到空间数据库方向,它的产品OracleSpatial占据着空间数据库的绝大部分市场,在地理信息系统、地图系统、工程CAD系统等大型系统中得到广泛应用。Oralce数据库的先进技术和高效性能已经备受广大用户的青睐。本书详细介绍了Oracle数据库中的两项关键开发技术OracleSpatial以及OCI(OracleCallInterface)。全书共分3部分,分别介绍Oracle数据库基础、OracleSpatial和OCI编程。本书读者对象为Oracle数据库C/C语言中开发人员(大型系统开发)、OracleSpatial应用开发人员(GIS、CAD和工程图形领域)。本书还可供空间数据库领域的研究人员作参考。
本书以Oracle数据库高阶技术为主,版本跨越9i\\10g\\11g,详细讲解了各种重要概念以及相关知识点,使得读者从新的层面和角度理解Oracle技术内涵,其中原理架构的讲解更侧重数据库管理和优化的内容,从系统层面看待架构的组成以及各类组件的作用。本书讲解了当前Oracle的主流技术,如基于SOA理念的RAC,用于灾备的DG,以及优化技术,内容覆盖Oracle几乎所有重要的知识点,用于全面系统地学习Oracle、获得技术提升以及知识拓展,书中穿插了作者(OCM)学习Oracle的心得,以及作为DBA经常思考的问题,以期望与读者共鸣。对于准备OCM考试的读者,OracleDBA,以及打算系统深入学习Oracle的读者,本书都是很好的书籍和手头工具书。
本书全面介绍了数据挖掘的理论和方法,旨在为读者提供将数据挖掘应用于实际问题所必需的知识。本书涵盖五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都包含两章:前面一章讲述基本概念、代表性算法和评估技术,后面一章较深入地讨论高级概念和算法。目的是使读者在透彻地理解数据挖掘基础的同时,还能了解更多重要的高级主题。此外,书中还提供了大量示例、图表和习题。本书适合作为相关专业高年级本科生和研究生数据挖掘课程的教材,同时也可作为数据挖掘研究和应用开发人员的参考书。
目前大部分软件开发平台都基于Linux,很多互联网公司都把MySQL作为后端数据存储的数据库。如果把MySQL比喻成数据库界的一条巨龙,则本书涵盖的所有知识点就是这条巨龙的组成部分。本书深入剖析MySQL数据库体系结构,实战演练备份恢复、主从复制,详解高可用集群架构的设计与实践过程,详细梳理优化思路,展现新版本的特性,并与真实生产案例相结合,通过核心原理到“王者”实战,全面覆盖MySQL数据库的知识点。
《运筹帷幄DB2(从Oracle运维转型)》由王飞鹏、王富国、刘旭、孙岳等所著,本书是舞动DB2系列的第三本。全书用通俗易懂的语言诠释了DB2数据库的管理和维护工作,提出了DB2运维的新思路,并从实战角度阐述了DB2数据库在运维过程中的常见问题、分析思路和解决方案,配以典型的行业案例,环环相扣,精彩纷呈,是一本值得拥有的DB2学习书籍。《运筹帷幄DB2(从Oracle运维转型)》适合数据库管理员、数据库运维人员、数据库架构师、数据库咨询顾问以及学习数据库运维技术的高校学生或者从事相关课程教学的教师阅读使用。