在集团内,数据人员面临的现实情况是:集团数据存储已经达到EB级别,部分单张表每天的数据记录数高达几千亿条;在2016年“购物狂欢节”的24小时中,支付金额达到了1207亿元人民币,支付峰值高达12万笔/秒,下单峰值达17.5万笔/秒,媒体直播大屏处理的总数据量高达百亿级别且所有数据都需要做到实时、准确地对外披露……巨大的信息量给数据采集、存储和计算都带来了极大的挑战。《大数据之路——大数据实践》就是在此背景下完成的。本书中讲到的大数据系统架构,就是为了满足不断变化的业务需求,同时实现系统的高度扩展性、灵活性以及数据展现的高性能而设计的。本书由数据技术及产品部组织并完成写作,是分享对大数据的认知,与生态伙伴共创数据智能的重要基石。相信本书中的实践和思考对同行会有很大的启发和借鉴意义。
Python凭借其简单、易读、可扩展性以及拥有巨大而活跃的科学计算社区,在需要分析、处理大量数据的金融行业得到了广泛而迅速的应用,并且成为该行业开发核心应用的编程语言。《Python金融大数据分析》提供了使用Python进行数据分析,以及开发相关应用程序的技巧和工具。 《Python金融大数据分析》总计分为3部分,共19章,部分介绍了Python在金融学中的应用,其内容涵盖了Python用于金融行业的原因、Python的基础架构和工具,以及Python在计量金融学中的一些具体入门实例;第2部分介绍了金融分析和应用程序开发中重要的Python库、技术和方法,其内容涵盖了Python的数据类型和结构、用matplotlib进行数据可视化、金融时间序列数据处理、高性能输入/输出操作、高性能的Python技术和库、金融学中需要的多种数学工具、数生成和过程模拟、Python统计学应用、Python和Excel
本书在系统地介绍各种类型RAID的结构和工作原理的基础上,深入浅出地讲解了RAID数据恢复的方法和技巧,同时,针对市场上主流的Windows、Linux、UNIX和Apple等多种文件系统,提供了大量RAID数据恢复的实际案例供读者学习。采用自然形象的方式描述RAID系统的抽象概念;同一个恢复案例,注重对不同的恢复方法进行比较分析。 本书概念清楚,逻辑性强,图文并茂,内容新颖。 本书适合数据恢复、信息安全等领域的从业人员以及对RAID数据恢复技术感兴趣的人员阅读,也可作为大专院校计算机相关专业学生的或参考书。
本书完整全面地讲述数据挖掘的概念、方法、技术和近期新研究进展。本书对前两版做了全面修订,加强和重新组织了全书的技术内容,重点论述了数据预处理、频繁模式挖掘、分类和聚类等的内容,还全面讲述了OLAP和离群点检测,并研讨了挖掘网络、复杂数据类型以及重要应用领域。 本书是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都推荐阅读的参考书,是一本适用于数据分析、数据挖掘和知识发现课程的优秀教材,可以用做高年级本科生或者一年级研究生的数据挖掘导论教材。
在集团内,数据人员面临的现实情况是:集团数据存储已经达到EB级别,部分单张表每天的数据记录数高达几千亿条;在2016年“购物狂欢节”的24小时中,支付金额达到了1207亿元人民币,支付峰值高达12万笔/秒,下单峰值达17.5万笔/秒,媒体直播大屏处理的总数据量高达百亿级别且所有数据都需要做到实时、准确地对外披露……巨大的信息量给数据采集、存储和计算都带来了极大的挑战。《大数据之路——大数据实践》就是在此背景下完成的。本书中讲到的大数据系统架构,就是为了满足不断变化的业务需求,同时实现系统的高度扩展性、灵活性以及数据展现的高性能而设计的。本书由数据技术及产品部组织并完成写作,是分享对大数据的认知,与生态伙伴共创数据智能的重要基石。相信本书中的实践和思考对同行会有很大的启发和借鉴意义。
随着Python应用领域的拓展,越来越多的人将Python用于处理大型数值数据集,使用标准格式来进行数据的存储和通信也显得越来越重要,而HDF5也正迅速成为人们存储科学数据的选择。本书向任何有Python数据分析基本背景的人介绍如何在Python下使用HDF5。 本书将着重于HDF5的本地功能集,而不是Python的高层抽象。熟悉Python和NumPy的读者,更容易阅读和掌握本书的内容。本书适合有基础的Python开发者,尤其适合要使用Python开发数据存储和处理等相关应用的读者阅读参考。
MongoDB自2009年推出以来,历经了近十年的发展,在这十年中,数据库领域可谓经历了翻天覆地的变化。本书深入剖析MongoDB新旧版本的特性,结合生产案例详细讲解MongoDB的常见故障;学习MongoDB索引,以便更好地掌握MongoDB性能调优技巧;描述备份恢复的重要性,让读者掌握MongoDB备份恢复技巧;充分利用MongoDB的水平扩展能力,详解MongoDB复制集、分片架构环境;很后讲解如何使用PMM性能监控平台,做好线上MongoDB的监控工作。
postgresql是目前广泛应用的开源数据库管理系统。《PostgreSQL 数据库内核分析》从postgresql数据库的源代码入手,深入分析了该数据库管理系统的底层实现细节,揭示了数据库运行的基本原理。《PostgreSQL 数据库内核分析》的主要内容包括:postgresql数据库的体系结构、 存储管理、索引机制、查询编译、查询执行、并发控制机制以及安全等。每个主题都引用了大量的数据结构、图表等进行说明,使读者对实现过程和机理一目了然。 《postgresql数据库内核分析》适合从事数据库领域相关研究的技术人员、高等院校相关专业高年级本科生或研究生阅读,有助于读者进行数据库的高级开发、基于postgresql定制满足需求的数据库系统,或者在数据库内核中实现并验证数据库新技术。
本书以作者在自然计算领域的研究成果为基础,全面、系统地介绍了一种基于量子谐振子物理模型的新的智能优化算法—MQHOA算法,该算法的物理模型明确、算法结构简单,无需复杂的初始条件设定和参数设置。将MQHOA算法用于求解函数优化问题和组合优化问题,并对算法的物理模型、迭代收敛性和并行性进行理论分析和实验验证。全书共7章,每章都包含了作者近年的科研成果。本书可作为自然计算算法、人工智能领域开发人员和技术人员的参考书。