本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
技术是把双刃剑,当我们在积极拥抱新技术的同时,也不能忽视其所带来的风险,比如当今大数据时代个人隐私和安全问题。本书是两位作者结合各自出色的专业知识和丰富的从业经验为大众倾力奉献的一本大数据时代隐私问题的普及读物。书中展示了我们在家庭和工作中的日常活动是如何成为大数据收集的一部分的。同时,列举大量的大数据应用以及安全和隐私相关案例,包括企业如何利用大数据进行营销、执法机构如何利用大数据执法等,也包括不法分子如何利用非法或合法的手段获取数据,如何利用社交网络进行犯罪。针对上述问题,本书也列出了一些工具、技巧用来检查和防范,这在当前很有现实意义。
为顺应国内EPC 总承包工程推广的新形势, 提高企业风险管理水平, 普及工程保险知识, 特编写本书。 书中内容紧密结合国际先进工程保险理念, 对于在EPC 工程中涉及的工程险种、 安排、 采购、 合同后管理等问题均做了较为全面、 细致的分析。 同时, 列举了我国著名企业在海内外EPC 实践中实施保险策略的典型案例。本书可供从事EPC 项目或准备从事EPC 项目的公司领导、 项目经理、 风险管理人员、 监理、 咨询人员等作为岗位继续教育教材使用; 也可作为工程管理、 保险、 经贸专业在校研究生以及本科生的教学参考书或课外读物;也适合作为建设行业推行EPC 总承包模式进行系列培训的教材或参考用书。
在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!
本书基于作者近几年来的研究开发成果及应用实践,对物联网大数据技术体系进行了系统归纳,阐述了物联网环境下感知数据的特性、数据模型、事务模型以及调度处理方法等核心概念及关键技术,并对物联网大数据存储、管理、计算与分析的基本概念和关键技术进行了剖析。本书还介绍了自行研发的面向物联网的ChinDB实时感知数据库系统以及针对云计算环境下物联网大数据管理与应用的DeCloud云平台,介绍了它们在智能交通、智能电厂、教育、安全监控等多个行业的应用。书中所有实例,均来自作者所在团队的实际应用,大部分在物联网项目中得到了实践应用。本书对物联网应用的开发以及两化融合、工业4.0环境下的大数据处理分析具有重要参考价值。
本书以大数据为研究背景,系统分析了传统数据技术当前存在的问题以及面临的挑战,并对比了当前主流的面向大数据的数据库解决方案,在此基础上阐述了笔者的研究工作:基于MapReduce平台高处处理大数据的OLAP研究。书中反应了当前大规模数据仓库研究的热点和成果,值得大数据研究的人员参考和应用。
本书内容简介:数据挖掘和文本挖掘是当前信息技术中的一个重要研究领域;将遗传算法和社会演化算法应用于数据及文本挖掘方法研究,具有较大的理论意义和实用价值本书研究了基于遗传算法和社会演化算法的数据挖掘和文本挖掘方法,主要包括数据挖掘和文本挖掘中的属性约简问题、聚类问题,并将其应用于产品研发决策中所做主要工作包括:提出一种基于遗传算法和k-medoids算法的新的聚类方法;采用遗传算法和模式聚合进行文本特征降维;采用遗传算法和潜在语义索引进行文本特征降维;采用社会演化算法进行聚类;采用混沌社会演化算法进行聚类;采用改进的遗传算法和社会演化算法进行文本聚类研究;将文本挖掘应用到产品研发决策中,构建产品研发文本知识地图,以期提高产品研发的效率和质量。
本书是《实用数据结构基础(第四版)》(陈元春、王中华、张亮、王勇编著,中国铁道出版社出版) 的配套学习指导书。全书内容分为5部分:教学内容指导(包括对主教材第1~10章的知识点分析、典型 习题分析和各章习题解答);自主设计实验指导(对10个自主设计实验的设计思想、算法分析进行了详细 指导);模拟试卷;模拟试卷参考答案;数据结构课程设计报告样例。 本书对数据结构的概念和原理的阐述通俗易懂,例子翔实;习题难易适中,题型丰富;对数据结构 基本运算的分析注重实现的过程。本书以C/C++语言作为算法的描述语言,对于书中的实验和一些重要 的算法均给出了完整的C/C++语言源程序,并全部在Visual C++ 6.0环境下运行通过。 本书适合作为普通高等院校计算机类专业数据结构课程的教学辅导书,也可作为成
三位CouchDB的开发者向你展示了如何以独立应用框架的形式来使用这一面向文档的数据库,以及如何使用它来构建高容量、分布式的应用。CouchDB简洁的存储,处理,以及读取数据的模型,让它成为了构建处理海量松散结构数据的Web应用的理想选择。在这一点上它就超越了关系型数据库的各种限制,并且CouchDB提供了一个可靠的,易扩展的且响应快速的开源解决方案。CouchDB使用自包含的数据,它们拥有松散的或者特定的联系。这是一个适合于许多现实世界物品的模型,比如通讯录、发票和收据。但你会发现这个数据库能够轻松的处理任何形式的数据。通过本书,你将学会如何通过CouchDB的RESTfulWeb接口来使用它,此外你还会熟悉CouchDB的一些主要特性,比如简单的文档的CRUD(创建、读取、更新、删除);高级的MapReduce,部署优化等更多的内容。* 理解面向文档存储和
传统客户/服务器的分布式计算模式主要解决的是部门或企业内部的应用,关注的是局部应用,建立的应用系统多数是为完成某种需求而建立,因此是孤立封闭的。即使在同一个部门或者企业内部,应用系统相互之间也常常因为没有通信而导致信息无法共享,使得各个IT资源成为一个个信息孤岛。随着互联网软件技术及其应用的迅速发展,如何提供一个统一开放的交互环境,使得各个应用实体之间能够相互发现、了解各自所提供的服务,并将这些应用低代价、方便地连接在一起,实现开放式网络环境中的互联、互通、互操作的目标,是当前互联网环境下所面临的一个重要问题。 想要有效地整合现有的应用系统并实现信息共享,关键在于实现这些应用系统间的数据交换。数据交换是网络环境下分布式应用的共性、基础性和关键性的需求,它用于解决信息化过
《海量点云数据处理理论与技术》共分8章。第1章绪论,简要介绍海量点云处理技术的基础理论、方法以及主要内容。第2章介绍海量点云数据的预处理,包括点云数据的获取方案,点云的去噪、压缩、配准方法,以及点云空洞的插值方法。第3章介绍海量点云数据的重建方法,系统介绍常用的点云重建算法与特点,并详细介绍基于特征和基于切片的点云重建方法。第4章介绍点云数据及模型的质量评价,从理论和实际两方面对点云质量进行分析,总结点云配准过程中的误差传播模型,系统地归纳三维模型的质量评定方法。第5章介绍点云数据处理技术,详细介绍国内外常用的海量点云数据处理软件以及三维图像库。第6章介绍地面三维激光扫描仪在隧道监测领域的应用,系统介绍基于三维激光扫描技术的隧道点云数据获取、处理及变形分析方法。第7章介绍地面三维
随着网络的广泛应用,数据发布成为各领域发布数据、获取数据的一个重要手段。随着知识发现与机器学习在诸多领域的深度应用和广度拓展,隐私保护数据挖掘已经成为知识发现领域的一个核心问题,基于数据发布的隐私保护数据挖掘已经成为涉及到每个国家、每位公民的首要问题。刘英华编*的这本《基于数据发布的隐私保护模型研究》基于安全多方和加密技术,设计出了全新的完全同态加密算法,并在此基础上提出FHE-DK-MEANS模型和FHE-DBIRCH模型。
《大数据分析:点“数”成金》以大数据分析的商业及金融价值为主线,对大数据这一崭新领域进行了深入探索。《大数据分析:点“数”成金》以大数据技术的基本概念和演进历程开篇,随后详细介绍了不同类型的数据源及其对企业的重要意义、企业投资大数据技术的成功商业案例、有效利用数据集的技能,解析了打造大数据分析系统所需的存储、加工、软件平台及其他构成要素,海量数据的安全工具和技术,系统潜在风险及其规避方法,以及怎样对大数据进行分析并从中提取有价值的可用信息,并详实阐述了如何将大数据融入企业文化等问题。 《大数据分析:点“数”成金》不但向读者阐明了大数据分析的重要性,更淋漓尽致地展现了大数据分析的具体过程,从而帮助企业提升智能化水平、解决实际问题、提升利润空间、提高生产率并发现更多的商业
本书从高维数据的特性出发,指出了高维数据给数据挖掘带来的影响以及高维数据挖掘的研究方向。对高维数据挖掘中的相似性搜索、高维数据聚类、高维数据异常检测、高维数据频繁模式发现及电子商务中的协同过滤技术进行了研究,提出了相关的解决方案和相应算法。 本书适用于从事数据挖掘和商业智能研究的高校教师、研究生、科研院所的科研人员以及从事商业智能项目开发的工程技术人员。
本书是面对当前科学可视化、信息可视化、可视分析研究和应用的新形势,专门为计算机、数据处理、视觉设计、统计、数学、航空航天、建筑、遥感影像等专业本科生开设数据可视化课程而编写的一本教材。全书划分为三篇:基础篇、数据篇和应用篇。其中,基础篇从人、数据、可视化流程等三个层面阐述数据可视化的基础理论和概念;数据篇则针对实际应用中遇到的不同类型的数据,包括时空数据、地理信息数据、高维非空间数据、层次和网络数据介绍相应的可视化方法;应用篇着重介绍可视化综合应用及实用系统。为了便于学习,每章后都附有习题和参考文献。 本书的特点是内容完整,叙述简明,重点突出;以数据类型为导向,以行业应用为目标。作者专门收集和整理了相关的课程教案、典型数据、精彩案例、可视化作品、课程附属视频和动画材
本书系统详细地阐述了数据挖掘产生的背景、技术、多种相关方法及具体应用,主要内容包括数据挖掘概述,数据采集、集成与预处理技术,多维数据分析与组织,预测模型研究与应用,关联规则模型及应用,聚类分析方法与应用,粗糙集方法与应用,遗传算法与应用,基于模糊理论的模型与应用,灰色系统理论与方法,基于数据挖掘的知识推理。 本书可作为管理科学与工程、信息科学与技术、应用数学等相关专业高年级本科生和研究生的数据仓库、数据挖掘及知识管理等相关课程的教材或参考资料,同时本书有助于相关的专业研究人员提升数据挖掘的枝巧和开拓新的研究方向。
由宋媚所*的《大数据征信背景下的信息质量度量与提升研究》主要关注大数据背景下的信息质量度量方法,并有针对性地提出了信息质量管理提升策略。《大数据征信背景下的信息质量度量与提升研究》具体包括:大数据征信背景下的信息质量评价与管控;征信信息质量度量模型的构建;征信信息质量度量模型应用;征信系统的信息质量管理与价值提升策略分析。
本书根据*高等学校计算机基础教学指导委员会编制的《普通高等学校计算机基础教学基本要求》,为满足高等教育对数据库技术和程序设计方面的基本要求进行编写。本书共11章,包括数据库基础知识、Access 20*数据库、表的创建与使用、查询设计、结构化查询语言SQL、窗体设计、报表设计、宏、VBA与模块、数据库管理、数据库安全等。书中有丰富的案例和大量的练习题,还提供课后习题参考答案。本书内容叙述清楚、示例丰富、图文并茂、步骤清晰、易懂易学,适合广大应用型本科和高职高专院校教学使用,以及有一定计算机基础的爱好者自学使用,也可作为全国计算机等级考试参考书。
金融管理研究的一个显著特点是数据分析量大、不确定性因素多,面对当今时代的海量金融数据,基于传统统计技术建立的模型假设条件多,实际应用难以奏效。数据挖掘是20世纪90年代中期兴起的新技术,是发现数据中有用模式的过程,其目的在于使用所发现的模式帮助解释当前的行为或预测未来的结果,以人们容易理解的形式提供有用的决策信息。 本书对一些相对较成熟的挖掘技术的讨论,阐述其用途、解决思路、需注意的主要问题、步骤,以金融领域的具体案例介绍模型与方法的应用。全书包括金融数据预处理、分类技术、预测、聚类技术、神经网络与支持向量机、异常数据挖掘,并且介绍了这些领域的一些*方法。 本书可作为信息管理与金融类专业本科生和研究生的教材,也可供从事数据挖掘技术与应用研究的科研人员、金融市场数据分析人员,以及