本全书内容主要包括11章和三个附录,其中11章又分为两大部分,部分是一些基础的介绍性的内容,章和第二章完整地讲述了元数据的意义以及一些基本的概念,第三章则从总体上分明绍了当前主要的元数据标准。第二部分则根据无数据的仓储项目生命周期的各个阶段,分别在第四章到第九章介绍了元数据的工具的评估,元数据仓储项目的组织和人员的配置,如何制定元数据的项目计划,元数据体系的结构的设计,如何通过元数据来提高数据的质量以及元模型的构造,此外,第十章还详细地介绍了开发周期的各个阶段该交付的产品以及取得的阶段性的成果,第十一章展望了元数据的未来发展的趋势。
在集团内,数据人员面临的现实情况是:集团数据存储已经达到EB级别,部分单张表每天的数据记录数高达几千亿条;在2016年“购物狂欢节”的24小时中,支付金额达到了1207亿元人民币,支付峰值高达12万笔/秒,下单峰值达17.5万笔/秒,媒体直播大屏处理的总数据量高达百亿级别且所有数据都需要做到实时、准确地对外披露……巨大的信息量给数据采集、存储和计算都带来了极大的挑战。《大数据之路——大数据实践》就是在此背景下完成的。本书中讲到的大数据系统架构,就是为了满足不断变化的业务需求,同时实现系统的高度扩展性、灵活性以及数据展现的高性能而设计的。本书由数据技术及产品部组织并完成写作,是分享对大数据的认知,与生态伙伴共创数据智能的重要基石。相信本书中的实践和思考对同行会有很大的启发和借鉴意义。
《生态学数据分析:方法、程序与软件》介绍了生态学数据处理方法,包括数据转换和标准化、物种和遗传水平的多样性、种群空间分布格局、生态位、聚类分析、主成分分析、除趋势对应分析、典范对应分析、基于熵模型的物种分布区预测,以及生态学实验中的单因素与双因素方差分析、成对样本T-检验、独立样本T-检验等。对于每一种方法,提供了相应的程序和软件,《生态学数据分析:方法、程序与软件》的重点不是介绍生态学数据处理方法的理论基础和数学公式推导,而是在简要介绍方法的基础上,利用案例数据,手把手地教大家如何利用《生态学数据分析:方法、程序与软件》介绍的程序和软件实现数据定量分析。可作为生态学、环境科学及其他相关领域(例如植物学、动物学、农学和土壤科学)本科生和研究生的教材,也可作为相关专业科研人员的自学参