本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
为顺应国内EPC 总承包工程推广的新形势, 提高企业风险管理水平, 普及工程保险知识, 特编写本书。 书中内容紧密结合国际先进工程保险理念, 对于在EPC 工程中涉及的工程险种、 安排、 采购、 合同后管理等问题均做了较为全面、 细致的分析。 同时, 列举了我国著名企业在海内外EPC 实践中实施保险策略的典型案例。本书可供从事EPC 项目或准备从事EPC 项目的公司领导、 项目经理、 风险管理人员、 监理、 咨询人员等作为岗位继续教育教材使用; 也可作为工程管理、 保险、 经贸专业在校研究生以及本科生的教学参考书或课外读物;也适合作为建设行业推行EPC 总承包模式进行系列培训的教材或参考用书。
在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!
本书以大数据为研究背景,系统分析了传统数据技术当前存在的问题以及面临的挑战,并对比了当前主流的面向大数据的数据库解决方案,在此基础上阐述了笔者的研究工作:基于MapReduce平台高处处理大数据的OLAP研究。书中反应了当前大规模数据仓库研究的热点和成果,值得大数据研究的人员参考和应用。
本书基于作者近几年来的研究开发成果及应用实践,对物联网大数据技术体系进行了系统归纳,阐述了物联网环境下感知数据的特性、数据模型、事务模型以及调度处理方法等核心概念及关键技术,并对物联网大数据存储、管理、计算与分析的基本概念和关键技术进行了剖析。本书还介绍了自行研发的面向物联网的ChinDB实时感知数据库系统以及针对云计算环境下物联网大数据管理与应用的DeCloud云平台,介绍了它们在智能交通、智能电厂、教育、安全监控等多个行业的应用。书中所有实例,均来自作者所在团队的实际应用,大部分在物联网项目中得到了实践应用。本书对物联网应用的开发以及两化融合、工业4.0环境下的大数据处理分析具有重要参考价值。
本书是与张宏军教授等编著的《作战仿真数据工程》教材配套的实验指导书。本书根据《作战仿真数据工程》教材的组织特点编排了实验内容。紧密配合理论教学.合理安排数据工程的实验教学,使学生能够在有限的实验课时中,加深对所学知识的理解与掌握,熟练使用常用的数据工程相关处理软件,培养和提高学生的实际操作水平。 本书涵盖了作战仿真数据规划、数据建模、数据集成、元数据集拟制、数据分析与数据挖掘、数据可视化、数据管理等方面的实验项目,实验内容饱满、步骤详细,有助于提高学生的实验效果。 本书可作为相关专业研究生和高年级本科生的实验教材,也可作为工程技术人员的参考书。
本书从理论知识入手,结合数据仓库的概念帮助读者更好地理解Hive,在掌握Hive相关理论知识的基础上,逐步深入地学习Hive。 工欲善其事,必先利其器 ,首先从创建虚拟机并安装Linux操作系统开始逐步完成Hive的部署,然后在部署完成的Hive环境基础上,学习Hive数据定义语言、Hive数据操作语言和Hive数据查询语言的相关操作,在学习了上述三种语言之后,接下来深入学习Hive的其他功能,包括Hive内置函数、Hive自定义函数、Hive的新特性事务以及Hive的相关优化,从而帮助读者掌握Hive的强大功能和特性。后,本书通过一个综合项目 教育大数据分析平台,使读者对Hive数据仓库在实际应用中涉及的相关知识内容具有更深入的理解,在此项目中不仅会涉及使用Hive实现数据仓库分层、数据转换和数据分析的相关操作,而且还涉及使用Sqoop将数据仓库中的数据进行导出和导入,以
李於洪主编的《数据仓库与数据挖掘导论》为数据仓库与数据挖掘的基础教程,是作者多年来从事数据仓库与数据挖掘课程教学经验的梳理和总结。为了增强内容的直观性和可理解度,全书以大量图、表、实例融入其中。全书共分为四篇14章。篇为导引,共分2章:用实例和实例分析引导学生理解数据仓库与数据挖掘的概念内涵及其产生背景。第二篇为数据仓库,共分5章:详细介绍了数据仓库的体系结构及其组成部分的功能;从商业需求的角度介绍了数据仓库维度建模方法和联机分析处理操作;介绍了元数据在数据仓库建设中的重要性、分类方法与作用。第三篇为数据挖掘,共分4章:通过浅显易懂的语言及实例,深入浅出地介绍了关联分析方法、神经网络算法、决策树算法和聚类分析方法。第四篇为实验与工具,共分3章:提供了数据仓库实验、神经网络建模实
朱小栋、徐欣编著的《数据挖掘原理与商务应用(普通高等院校电子商务十二五规划重点教材)》的内容涵盖如何利用相关软件产品实现数据挖掘的经典算法和技术,还涵盖数据挖掘技术在商务领域中的应用。本书既适合计算机应用技术专业,也适合经管类信息管理与电子商务专业的学生学习。书中既注重从计算机应用角度来讲解数据挖掘,又注重数据挖掘与商务智能、管理科学、决策支持系统的结合。
本书主要包括三部分内容,即误差和数据处理基础、试验设计方法与应用和计算机数据处理软件简介。从误差理论入手,分别介绍测量值与误差、偶然误差的分布、误差传递等误差理论中的内容,介绍统计检验、方差分析、回归分析和聚类分析等数据处理方法与应用,介绍提高分析化学准确度的方法及质量控制方法,介绍正交试验设计、多因素序贯试验设计、*化区组和拉丁方设计、析因设计、响应面设计方法与应用,后一章以较大篇幅对现时流行的大型统计软件之一SPSS(Statistical Product and Service Solutions)进行简要介绍,书末附有习题及常用的统计数表。 本书着重介绍基本概念和基本理论,并在此基础上结合专业特点,介绍了各种统计方法在化学化工、医药、环境检测、矿物加工等多方面的应用,本书把误差与数据处理、质量控制和实验设计作为重点。
基于知识的聚类展示的是如何设计一个导航平台,以使信息探寻者能理解和较好的应用种类繁多的数据集。比模糊聚类走得更远,作者展示了基于知识的聚类这一有前景的新范例是如何揭示更有意义的数据结构,并使社会更好地处理日益增长的数据和信息流。通过这《基于知识的聚类—从数据到信息粒》,读着能理解基于知识聚类的基础和与其相关联的算法,学会将他们自己的知识应用到系统建模和设计中去。 《基于知识的聚类—从数据到信息粒》首先对模糊聚类和粒计算这一领域进行介绍和讨论。然后,作者深入研究了基于逻辑的神经元和神经网络。《基于知识的聚类—从数据到信息粒》的核心部分包括9章,在其中呈现和分析了众多不同的基于知识的聚类的方法。《基于知识的聚类—从数据到信息粒》的第三部分致力于模型的研究,首先讨论超盒结构,然
本书根据高等院校培养综合型交叉学科本科人才的发展目标编写,介绍空间数据分析的原理与方法。全书共分17章,主要内容包括绪论、空间数据的性质、空间数据的完备化、空间数据的标准化、探索性空间数据分析、空间点模式分析、地统计数据插值、格数据统计、格数据回归分析、空间回归分析、面状数据空间模式分析、空间连续数据分析方法、非参数统计、空间抽样方法、空间度量算法、空间分析算法和空间统计分析算法。 本书可作为地理信息系统、计算机科学与技术、遥感科学与技术、测绘工程、地理科学等相关专业学生的教科书,同时也适合于从事空间数据分析、地理信息系统应用的人员参考。
全书共分为六章:*章为绪论,介绍了大数据时代隐私内涵的构成要素以及发展变迁历史,并从技术层面、社会层面、个人层面列举了大数据环境下隐私安全的表现形式,总结了当前个人隐私被侵害的类型以及呈现的特征;第二章为隐私泄露风险评估与度量方法,针对常用的隐私保护方法,详细介绍了当前隐私量化模型与度量标准的相关研究,并分析了主流的隐私度量方法的性能优劣以及评价指标;第三章为位置服务中隐私保护技术,并介绍了P2P结构与独立架构两种模式下位置隐私保护技术方案。第四章为深度学习训练数据集隐私保护技术,提出了两种差分?
这本《数据挖掘--方法与应用》主要根据作者徐华近几年在清华大学面向研究生和本科生开设的“ 数据挖掘:方法与应用”课程的教学实践与积累,参考近几年国外著名大学相关课程的教学体系,系统地介绍数据挖掘的基本概念和基本原理方法;结合一些典型的应用实例展示用数据挖掘的思维方法求解问题的一般性模式与思路。 本书可作为有一定数据结构、数据库和程序设计基础的研究生或本科生开展数据挖掘知识学习和研究的入门性教材与参考读物。
本书以精练的语言介绍HBase的基础知识,让初学者能够快速上手使用HBase,对HBase的核心思想(如数据读取、数据备份等)和HBase架构(如LSM树、WAL)有深入的分析,让有经验的HBase开发人员也能够循序渐进地深入理解HBase源码,以便更好地去调试和解决线上遇到的各种问题。本书更加专注HBase在线实时系统的调优,让HBase集群响应延迟更低,能够更好地为在线实时系统服务。本书结合企业的“用户行为分析系统”,让读者能够快速上手的同时,也不乏企业HBase实际应用场景,理论不脱离实际,真正做到从入门到精通。 本书适合有一定Java基础的程序员作为HBase入门教程,HBase运维人员可以将本书作为参考手册来部署和监控HBase,正在将HBase应用到在线生成环境中的软件开发人员也可以参考本书来调优HBase在线集群性能。
本书系统讲解数据库的基本概念,数据库设计的基本方法和数据库应用开发的基本技术,并介绍了数据库技术新进展。本书强调理论与实践,技术与应用的结合。内容系统全面,深入浅出。 本书可作为高等学校计算机基础教学课程中数据库系统的教材,也可以供数据库应用部门,从事计算机应用系统设计和开发部门的工程技术人员参考。
本书的知识架构是在培训了多届学员的基础上总结整理得来的,已经经过了实践的考验,证实了其科学性;本书当中的案例都为企业实际开发的案例,通过学习这些大量的实际案例,帮助学生在进入企业后可以很快融入大数据工作岗位。本书包括大数据概论、初识Hadoop、认识HDFS、HDFS的运行机制、访问HDFS、Hadoop I/O 详解、认识MapReduce编程模型、MapReduce应用编程开发、MapReduce的工作机制与YARN平台、MapReduce高级开发、MapReduce实例共11章内容。本书既可作为高等院校学习大数据技术的教材,亦可作为广大大数据技术学习者的入门用书。
进入大数据时代,让数据开口说话将成为司空见惯的事情,本书将从大数据时代的前因后果讲起,全面分析大数据时代的特征、企业实践的案例、大数据的发展方向、未来的机遇和挑战等内容,展现一个客观立体、自由开放的大数据时代。
由宋媚所*的《大数据征信背景下的信息质量度量与提升研究》主要关注大数据背景下的信息质量度量方法,并有针对性地提出了信息质量管理提升策略。《大数据征信背景下的信息质量度量与提升研究》具体包括:大数据征信背景下的信息质量评价与管控;征信信息质量度量模型的构建;征信信息质量度量模型应用;征信系统的信息质量管理与价值提升策略分析。
王海晏、魏贤智所*的《激光数据链路》介绍将 激光数据链路应用到战斗机协同空战中的各种问题, 内容主要涉及构建机载激光数据链路及其相关问题的 解决办法,同时对激光数据链路在协同攻击中的应用 进行了理论研究和描述。 本书主要内容包括机载激光数据链路系统及使用 的技术、自用空间数据传输的坐标解算、激光链路建 立的关键技术、利用机载红外搜索跟踪系统及激光数 据链路被动定位、基于激光数据链路的协同静默攻击 等。这些问题的研究和讨论将丰富空战平台之间的信 息传输方式,增强协同空战信息共享能力。 本书可以作为相关专业高年级学生、研究生的补 充阅读材料,也可作为工程技术人员的参考资料。
《数据挖掘技术》是基于数据挖掘经典算法及数据挖掘领域*研究技术进行数据分析的教材。全书内容包括数据挖掘概述、分类算法、聚类算法、关联规则算法及相应典型算法的算法描述及分析等。对当前数据挖掘的新技术——流数据挖掘技术、高维聚类算法、分布式数据挖掘、物联网数据挖掘进行了详细的介绍。该部分在讲述基本概念及典型算法的基础上配有新研究的算法模型及分析,并有实验数据分析及结果显示。后对其他数据挖掘新技术,包括业务活动监控挖掘技术、云计算平台架构和数据挖掘方法及思维流程数据挖掘技术进行了描述。 本书可以作为高等院校信息管理、数理统计等专业有关数据挖掘教学的本科生或者研究生的专业课教材,也可以作为各类相关培训班的教材,还可以作为从事数据分析、智能产品软件开发人员的参考书及数据挖掘爱好
本书覆盖了数据仓储构建的所有主要领域,包括数据仓储的定义和环境;数据仓储的4个类型、对数据仓储的5类共15个要求;2个方法论的总结及3个构建方法。本书给出了一个高性能的参照系统结构。基于此参照系统结构,本书系统地讨论了大量设计议题、并包括21个设计建议、8个实践建议、7个设计原则、27个通用算法和技术、12个元数据驱动的通用操作符、7个工作过程、4个范式基础及范式原则。