本书以经济系统效率分析为研究背景,探讨如何进一步拓展和完善DEA理论、模型及其应用.其中,第1章主要介绍效率与生产力分析中的一些概念.第2章介绍一些基本DEA模型及广义DEA模型.第3章探讨广义DEA模型的有效性度量方法.第4章分析DEA效率悖论产生的原因,并给出克服“效率悖论”出现的修正DEA模型.第5章给出一种含有中性指标的DEA模型,并讨论其在经济结构调整中的应用.第6章给出测算时间序列决策单元效率的DEA模型.第7章提出一种评价多层次复杂系统的DEA模型.第8章给出一种基于决策单元合作与竞争博弈的DEA模型.第9章给出一种用于测算个体对群体效率贡献的DEA模型. 0章给出权重受限的超效率DEA模型及投影方法. 1章给出一种用于电影衍生品市场前景综合评价的DEA模型. 2章建立一种评价大型超市选址合理性的DEA模型. 3章和 4章分别对中国省级经济发展效率和高技术产业创
利用机器翻译技术实现不同语言之间的自由交流始终是 令人期待的计算机应用之一。本书全面回顾了近30年来机器翻译的技术发展历程,遵循机器翻译技术的发展脉络,对基于统计和基于端到端深度学习的机器翻译关键技术及原理进行了深入讲解,力求做到简洁明了、全面透彻、图文结合。此外,本书着重介绍了近年来机器翻译领域的科研热点及其结果,旨在帮助读者全面了解机器翻译的前沿研究进展和关键技术。本书可供计算机相关专业高年级本科生及研究生学习使用,也可作为自然语言处理,特别是机器翻译相关研究人员的案边手册。
在大数据时代,数据的获取、传输和存储融入了人类生产生活的方方面面,而大数据核心价值体现为人们对数据的分析、理解与应用。面对如此海量、高速和异构的数据,仅靠人类的认知和理解能力远不能满足价值发现的需要。同时,计算机总是针对 细粒度数据进行迭代优化的求解模式在特定场景下也不能满足数据分析的时限需求。粒计算作为一种模拟人类知识表示和问题求解的近似数据分析范式,其优点在于解决问题时能够选择合适粒度,达到求解精度和计算时效的**平衡。所以,粒计算通常能够以 高的效率获得“有效解”。本书以 树和云模型作为数据多粒度表示的基本方法,系统地展示了 树和云模型在大数据多粒度聚类、数据流即时聚类、半监督学习和时间序列预测等大数据分析场景中的理论研究成果及应用案例。
本书按照需求规划、需求实现、可视化的流程进行编排,通过项目开发的主要流程,介绍数据仓库的搭建过程。在整个数据仓库的搭建过程中,本书介绍了主要组件的安装部署、需求实现的具体思路,以及各种问题的解决方案等,并在其中穿插了许多与大数据和数据仓库相关的理论知识,包括数据仓库的概念、电商业务概述、数据仓库理论和数据仓库建模等。 本书共14章,其中, ~3章是项目的前期准备阶段,主要介绍了数据仓库的概念和搭建需求,并初步搭建了本数据仓库项目所需的基本环境;第4~7章是项目的核心部分,详细介绍了数据仓库的建模理论,并完成了数据从采集到分层搭建的全过程,是本书的重点部分;第8~14章是对数据治理各功能模块的实现,针对数据治理的不同功能需求分模块进行实现。 本书适合具有一定编程基础并对大数据感兴趣的读者阅
本书基于主题划分章节,每一章归纳总结了对应的常见问题和解决方法。本书第1章是R基础知识,包括包安装和数据加载;第2章是绘图概述,帮助读者快速绘制基本图形;第3章至第6章具体介绍绘制几种不同图形(如条形图、折线图和散点图等)的方法;第7章至 2章讨论如何修改图形的各个元素(如注解、坐标轴、标题、图例和配色等); 3章介绍其他难以清晰分门别类的图形; 4章介绍将R绘制的图形以不同的格式导出的方法; 5章讨论数据处理的相关问题。本书由浅入深,脉络分明,适合数据分析、数据处理和数据可视化的初学者;此外,本书对有一定数据分析、数据处理和数据可视化工作经验的读者,也是一本方便的速查手册。
本书基于卫星遥感、基础地理信息,以及新浪微博、腾讯定位和百度迁徙等多源地理大数据,采用大数据时序分析、自然语言处理、机器学习、GIS空间分析和时空统计分析等手段,开展青藏高原现代人类活动的时空模式及人类潮汐式旅游与商业活动对生态环境压力与影响的系统性研究。主要内容包括:青藏高原人群动态分布及节日响应、青藏高原人类活动的节律模式解析、青藏高原人群移动的时空模式挖掘、青藏高原空间语义认知与旅游活动分析、青藏高原数字足迹与生态环境应用和青藏高原典型区域生态环境质量的演化分析等。
本书针对科技服务对科技资源数据汇聚融合的需求,研究面向开放协同的科技大数据汇聚融合和演化分析技术,研究多源异构科技大数据资源体系建设与应用场景,设计科技大数据汇聚融合与演化分析系统架构,利用在线知识图谱建立多源异构、碎片化数据之间的语义关联和多粒度层次语义映射,完成科技大数据的实体识别和匹配,向各行业各领域用户提供面向开放协同的科技大数据检索服务。基于区块链技术实现科技大数据的可信数据确权与追踪保护,实现数据生命周期管理。