本书主要围绕南京图书馆非物质文化遗产影像资源的采集、制作、加工、传播以及数据库建构这几个方面展开,对近十年来的工作加以总结和思考,对非遗影像的制作和收藏提出建设性的意见。本书共分为九章,层层递进。第一章主要介绍公共图书馆与非物质文化遗产的关系,阐述其中的渊源,引出公共图书馆的非遗影像制作工作的必要性和重要性。第二章主要介绍南京图书馆十年来非遗影像数据库的建构历程,介绍工作经验和基本情况。第三章从《何处忆江南》这个项目来分析非遗影像专题中对非遗项目的选择标准。第四章从技术层面介绍南京图书馆外拍团队的拍摄技术和后期剪辑技术。第五章以《何处忆江南》这个项目分析非遗影像中非遗传承人的选择和人物的形象架构。第六章从视听语言角度,分析非遗影像的声音和画面,如何做到声画的统一。第七章从精
数据作为新型生产要素,推动经济发展、提升生产力。本书从数据的基础认知、数据圈的诞生和发展以及数据蕴含的未来等角度开始谈起,进一步讨论了数据全生命周期管理的核心节点,以及企业数据应用和管理的难点与重点,最后从数据传统应用的不同领域进行解读分析,全面阐释了什么是数据、数据的应用以及数据的未来等内容。通过本书,读者可以感受到数据开启的美好新时代,也可以预期在各行各业中,数据拥有将不可能变为可能的超能力。全书共9章。第1章为基础章节,着重介绍了数据基本认知,包括数据起源、概念以及不断膨胀的数据圈;第2章对数据的不同类型、数据来源以及数据的创建位置等进行了深入介绍,让读者对数据有更全面的认知;第3章对于当前的数据以及数据的未来进行了分析和探讨; 第4~9章重点着墨于数据的应用,介绍了数据全生命
时间序列分析是统计学科的一个重要分支,它主要研究随着时间的变化,事物发生、发展的过程,寻找事物发展变化的规律并预测未来的走势。在日常生产和生活中,时间序列比比皆是,所以目前时间序列分析方法广泛应用于经济、金融、天文、气象、海洋、物理、化学、医学、质量控制等诸多领域,成为众多行业经常使用的统计方法。 本书是基于Python编写的入门级时间序列分析教材,主要内容包括时间序列分析简介、时间序列的预处理、ARMA模型的性质、平稳序列的拟合与预测、无季节效应的非平稳序列分析、有季节效应的非平稳序列分析、多元时间序列分析。
在数据为知名品牌的今天,对于一种已经成型的模型,“怎么用”通常不是问题,用个软件或者编几行程序就能得到结果了,问题一般都出在模型“什么时候用”和“用完了,然后呢”。《数据分析师养成宝典》就集中讨论后面两件事情。《数据分析师养成宝典》共27章,分为业务理解篇(靠前~4章)、指标设计篇(第5~7章)、数据建模篇(第8~16章)、价值展现篇(靠前7~19章)和实战进阶篇(第20~27章)。业务理解篇的目的是让读者建立正确的思维观,理解数据,熟悉业务;指标设计篇学习把数据转换为专家数据的一些技巧;数据建模篇以R语言为计算平台实施数据分析全过程;价值展现篇主要讨论如何撰写有价值的数据分析报告;实战进阶篇通过对8个经典案例的分析,使读者能够把学到的思维方法、实施工具应用到解决实际问题中,把数据变成价值。本书可供数据
本书是一本介绍数据分析相关算法的学习指南,主要包括数据分析及数据挖掘相关概念介绍、数据思维及各种数据分析算法的原理及实现方法。本书的每个数据分析算法都介绍了数学原理、Python代码实现以及实战案例,内容丰富、容易理解。本书共9章,第1章介绍了数据挖掘与数据分析、机器学习之间的关系;第2章介绍了数据分析人员应该具备的数据思维,包括数据思维认知、数据挖掘“定律”;第3~9章介绍了各种数据分析算法的原理、实现方法及实战案例,其中包括逻辑回归、决策树、朴素贝叶斯、聚类分析、关联规划、人工神经网络、集成学习。本书适合从事数据分析工作的读者自学,也可作为产品经理、运营人员、市场人员和对数据分析感兴趣的读者的参考用书。
这是一本适合教学和零基础自学的Hadoop与大数据挖掘的教程,即便你接近没有Hadoop编程基础和大数据挖掘基础,根据本书中的理论知识和上机实践,也能迅速掌握如何使用Hadoop进行大数据挖掘。全书主要分为两篇:基础篇(1-7章),首先从宏观上介绍了大数据相关概念和技术,然后逐一对Hadoop、Hive、HBase、Pig、Spark、Oozie等一系列大数据技术的概念、原理、架构,以及企业应用方法进行了详细介绍,同时配有大量的案例。掌握了这些内容,就具备了大数据技术的基础;挖掘实战篇(第8章),主要是一个企业级大数据应用项目——电子商务智能推荐系统。通过分析应用背景、构建系统,使读者了解针对系统的每一层应用使用什么大数据技术来解决问题。涉及的流程有数据采集、数据预处理、模型构建等,在每一个流程中会进行大数据相关技术实践,运用实际数据来进
这是一本适合教学和零基础自学的Hadoop与大数据挖掘的教程,即便你接近没有Hadoop编程基础和大数据挖掘基础,根据本书中的理论知识和上机实践,也能迅速掌握如何使用Hadoop进行大数据挖掘。全书主要分为两篇:基础篇(1-7章),首先从宏观上介绍了大数据相关概念和技术,然后逐一对Hadoop、Hive、HBase、Pig、Spark、Oozie等一系列大数据技术的概念、原理、架构,以及企业应用方法进行了详细介绍,同时配有大量的案例。掌握了这些内容,就具备了大数据技术的基础;挖掘实战篇(第8章),主要是一个企业级大数据应用项目——电子商务智能推荐系统。通过分析应用背景、构建系统,使读者了解针对系统的每一层应用使用什么大数据技术来解决问题。涉及的流程有数据采集、数据预处理、模型构建等,在每一个流程中会进行大数据相关技术实践,运用实际数据来进
本书从HadoopMapReduce并行计算技术与系统的基本原理剖析着手,在系统介绍基本工作原理、编程模型、编程框架和接口的基础上,着重系统化地介绍MapReduce并行算法设计与编程技术,较为全面地介绍了基本MapReduce算法设计、不错MapReduce编程技术、以及一系列较为复杂的机器学习和数据挖掘并行化算法,并引入来自IntelHadoop系统产品的一系列增强功能以及深度技术剖析;很后,为了提高读者的算法设计与编程实战能力,本书较为详细地介绍了一系列综合性和实战性大数据处理和算法设计问题,这些问题来自课程同学参加的全国性大数据大赛中的获奖算法、课程中的很好课程设计、以及来自本团队的科研课题及业界实际的大数据应用实战案例。
本书首先介绍了误差理论和统计分布知识,从应用角度,强调了方案设计前试验指标、因素、水平的取值范围和确定方法,结合大量实例,详细介绍了各种试验设计方法及相应的数据分析处理方法:正交设计、均匀设计、回归设计、混料设计、稳健设计等,详细介绍了软件在试验设计与数据分析中的应用。
本书首先介绍了误差理论和统计分布知识,从应用角度,强调了方案设计前试验指标、因素、水平的取值范围和确定方法,结合大量实例,详细介绍了各种试验设计方法及相应的数据分析处理方法:正交设计、均匀设计、回归设计、混料设计、稳健设计等,详细介绍了软件在试验设计与数据分析中的应用。
本书首先介绍了误差理论和统计分布知识,从应用角度,强调了方案设计前试验指标、因素、水平的取值范围和确定方法,结合大量实例,详细介绍了各种试验设计方法及相应的数据分析处理方法:正交设计、均匀设计、回归设计、混料设计、稳健设计等,详细介绍了软件在试验设计与数据分析中的应用。
本书首先介绍了误差理论和统计分布知识,从应用角度,强调了方案设计前试验指标、因素、水平的取值范围和确定方法,结合大量实例,详细介绍了各种试验设计方法及相应的数据分析处理方法:正交设计、均匀设计、回归设计、混料设计、稳健设计等,详细介绍了软件在试验设计与数据分析中的应用。
本书首先介绍了误差理论和统计分布知识,从应用角度,强调了方案设计前试验指标、因素、水平的取值范围和确定方法,结合大量实例,详细介绍了各种试验设计方法及相应的数据分析处理方法:正交设计、均匀设计、回归设计、混料设计、稳健设计等,详细介绍了软件在试验设计与数据分析中的应用。
本书从HadoopMapReduce并行计算技术与系统的基本原理剖析着手,在系统介绍基本工作原理、编程模型、编程框架和接口的基础上,着重系统化地介绍MapReduce并行算法设计与编程技术,较为全面地介绍了基本MapReduce算法设计、不错MapReduce编程技术、以及一系列较为复杂的机器学习和数据挖掘并行化算法,并引入来自IntelHadoop系统产品的一系列增强功能以及深度技术剖析;很后,为了提高读者的算法设计与编程实战能力,本书较为详细地介绍了一系列综合性和实战性大数据处理和算法设计问题,这些问题来自课程同学参加的全国性大数据大赛中的获奖算法、课程中的很好课程设计、以及来自本团队的科研课题及业界实际的大数据应用实战案例。
本书是一本介绍数据分析相关算法的学习指南,主要包括数据分析及数据挖掘相关概念介绍、数据思维及各种数据分析算法的原理及实现方法。本书的每个数据分析算法都介绍了数学原理、Python代码实现以及实战案例,内容丰富、容易理解。本书共9章,第1章介绍了数据挖掘与数据分析、机器学习之间的关系;第2章介绍了数据分析人员应该具备的数据思维,包括数据思维认知、数据挖掘“定律”;第3~9章介绍了各种数据分析算法的原理、实现方法及实战案例,其中包括逻辑回归、决策树、朴素贝叶斯、聚类分析、关联规划、人工神经网络、集成学习。本书适合从事数据分析工作的读者自学,也可作为产品经理、运营人员、市场人员和对数据分析感兴趣的读者的参考用书。
本书从HadoopMapReduce并行计算技术与系统的基本原理剖析着手,在系统介绍基本工作原理、编程模型、编程框架和接口的基础上,着重系统化地介绍MapReduce并行算法设计与编程技术,较为全面地介绍了基本MapReduce算法设计、不错MapReduce编程技术、以及一系列较为复杂的机器学习和数据挖掘并行化算法,并引入来自IntelHadoop系统产品的一系列增强功能以及深度技术剖析;很后,为了提高读者的算法设计与编程实战能力,本书较为详细地介绍了一系列综合性和实战性大数据处理和算法设计问题,这些问题来自课程同学参加的全国性大数据大赛中的获奖算法、课程中的很好课程设计、以及来自本团队的科研课题及业界实际的大数据应用实战案例。
在数据为知名品牌的今天,对于一种已经成型的模型,“怎么用”通常不是问题,用个软件或者编几行程序就能得到结果了,问题一般都出在模型“什么时候用”和“用完了,然后呢”。《数据分析师养成宝典》就集中讨论后面两件事情。《数据分析师养成宝典》共27章,分为业务理解篇(靠前~4章)、指标设计篇(第5~7章)、数据建模篇(第8~16章)、价值展现篇(靠前7~19章)和实战进阶篇(第20~27章)。业务理解篇的目的是让读者建立正确的思维观,理解数据,熟悉业务;指标设计篇学习把数据转换为专家数据的一些技巧;数据建模篇以R语言为计算平台实施数据分析全过程;价值展现篇主要讨论如何撰写有价值的数据分析报告;实战进阶篇通过对8个经典案例的分析,使读者能够把学到的思维方法、实施工具应用到解决实际问题中,把数据变成价值。本书可供数据
本书是一本介绍数据分析相关算法的学习指南,主要包括数据分析及数据挖掘相关概念介绍、数据思维及各种数据分析算法的原理及实现方法。本书的每个数据分析算法都介绍了数学原理、Python代码实现以及实战案例,内容丰富、容易理解。本书共9章,第1章介绍了数据挖掘与数据分析、机器学习之间的关系;第2章介绍了数据分析人员应该具备的数据思维,包括数据思维认知、数据挖掘“定律”;第3~9章介绍了各种数据分析算法的原理、实现方法及实战案例,其中包括逻辑回归、决策树、朴素贝叶斯、聚类分析、关联规划、人工神经网络、集成学习。本书适合从事数据分析工作的读者自学,也可作为产品经理、运营人员、市场人员和对数据分析感兴趣的读者的参考用书。
在数据为知名品牌的今天,对于一种已经成型的模型,“怎么用”通常不是问题,用个软件或者编几行程序就能得到结果了,问题一般都出在模型“什么时候用”和“用完了,然后呢”。《数据分析师养成宝典》就集中讨论后面两件事情。《数据分析师养成宝典》共27章,分为业务理解篇(靠前~4章)、指标设计篇(第5~7章)、数据建模篇(第8~16章)、价值展现篇(靠前7~19章)和实战进阶篇(第20~27章)。业务理解篇的目的是让读者建立正确的思维观,理解数据,熟悉业务;指标设计篇学习把数据转换为专家数据的一些技巧;数据建模篇以R语言为计算平台实施数据分析全过程;价值展现篇主要讨论如何撰写有价值的数据分析报告;实战进阶篇通过对8个经典案例的分析,使读者能够把学到的思维方法、实施工具应用到解决实际问题中,把数据变成价值。本书可供数据
这是一本适合教学和零基础自学的Hadoop与大数据挖掘的教程,即便你接近没有Hadoop编程基础和大数据挖掘基础,根据本书中的理论知识和上机实践,也能迅速掌握如何使用Hadoop进行大数据挖掘。全书主要分为两篇:基础篇(1-7章),首先从宏观上介绍了大数据相关概念和技术,然后逐一对Hadoop、Hive、HBase、Pig、Spark、Oozie等一系列大数据技术的概念、原理、架构,以及企业应用方法进行了详细介绍,同时配有大量的案例。掌握了这些内容,就具备了大数据技术的基础;挖掘实战篇(第8章),主要是一个企业级大数据应用项目——电子商务智能推荐系统。通过分析应用背景、构建系统,使读者了解针对系统的每一层应用使用什么大数据技术来解决问题。涉及的流程有数据采集、数据预处理、模型构建等,在每一个流程中会进行大数据相关技术实践,运用实际数据来进
本书从大数据的前身——数据挖掘技术入手,首先介绍了数据挖掘技术及在大数据中常用的采集、存储和分析方法;然后以多语音识别和多语言识别为例,对大数据信息处理技术的关键应用给出了详细的说明;接着给出了大数据场景分析,详细介绍了基于场景分析的大数据信息处理应用,如MOOC大数据教学分析系统、社交网络大数据关系推荐系统、金融服务大数据风险预警系统等;随后介绍了互联网+大数据的应用,对电子商务、互联网金融、能源大数据等具有差异性的行业应用进行了简要介绍;很后对大数据的应用进行了展望。
本书从大数据的前身——数据挖掘技术入手,首先介绍了数据挖掘技术及在大数据中常用的采集、存储和分析方法;然后以多语音识别和多语言识别为例,对大数据信息处理技术的关键应用给出了详细的说明;接着给出了大数据场景分析,详细介绍了基于场景分析的大数据信息处理应用,如MOOC大数据教学分析系统、社交网络大数据关系推荐系统、金融服务大数据风险预警系统等;随后介绍了互联网+大数据的应用,对电子商务、互联网金融、能源大数据等具有差异性的行业应用进行了简要介绍;很后对大数据的应用进行了展望。
本书从大数据的前身——数据挖掘技术入手,首先介绍了数据挖掘技术及在大数据中常用的采集、存储和分析方法;然后以多语音识别和多语言识别为例,对大数据信息处理技术的关键应用给出了详细的说明;接着给出了大数据场景分析,详细介绍了基于场景分析的大数据信息处理应用,如MOOC大数据教学分析系统、社交网络大数据关系推荐系统、金融服务大数据风险预警系统等;随后介绍了互联网+大数据的应用,对电子商务、互联网金融、能源大数据等具有差异性的行业应用进行了简要介绍;很后对大数据的应用进行了展望。