本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!
本书是《实用数据结构基础(第四版)》(陈元春、王中华、张亮、王勇编著,中国铁道出版社出版) 的配套学习指导书。全书内容分为5部分:教学内容指导(包括对主教材第1~10章的知识点分析、典型 习题分析和各章习题解答);自主设计实验指导(对10个自主设计实验的设计思想、算法分析进行了详细 指导);模拟试卷;模拟试卷参考答案;数据结构课程设计报告样例。 本书对数据结构的概念和原理的阐述通俗易懂,例子翔实;习题难易适中,题型丰富;对数据结构 基本运算的分析注重实现的过程。本书以C/C++语言作为算法的描述语言,对于书中的实验和一些重要 的算法均给出了完整的C/C++语言源程序,并全部在Visual C++ 6.0环境下运行通过。 本书适合作为普通高等院校计算机类专业数据结构课程的教学辅导书,也可作为成
全书共分为六章:*章为绪论,介绍了大数据时代隐私内涵的构成要素以及发展变迁历史,并从技术层面、社会层面、个人层面列举了大数据环境下隐私安全的表现形式,总结了当前个人隐私被侵害的类型以及呈现的特征;第二章为隐私泄露风险评估与度量方法,针对常用的隐私保护方法,详细介绍了当前隐私量化模型与度量标准的相关研究,并分析了主流的隐私度量方法的性能优劣以及评价指标;第三章为位置服务中隐私保护技术,并介绍了P2P结构与独立架构两种模式下位置隐私保护技术方案。第四章为深度学习训练数据集隐私保护技术,提出了两种差分?
本书侧重于信息管理中信息组织与处理的技术,全面而系统地介绍了数据仓库与数据挖掘的基本概念、基本方法和基本技术,以及数据仓库与数据挖掘的应用领域与*进展。全书共分10章,包括概论,数据仓库的技术与开发,数据仓库的管理,联机分析处理,SQLServer数据仓库的应用与开发,数据挖掘与知识发现,统计类数据挖掘技术,知识类数据挖掘技术,21世纪的数据挖掘技术,数据仓库与数据挖掘的综合应用等内容。为了便于学习,每一章都有提要和小结,并配有一定数量的习题,以帮助读者对基本内容的理解和掌握。本书深入浅出,阐述清晰、理论与实际并重,可作为高等院校信息管理与信息系统等专业本科生、研究生的教材。
科技的进步,特别是信息产业的发展,把整个社会带入一个崭新的信息时代。随着计算机应用的普及和数据库技术的不断发展,数据仓库与数据挖掘技术的应用领域越来越广泛。 《数据仓库与数据挖掘》第1章介绍数据仓库、数据挖掘的一般知识和应用领域。第2~8章介绍数据仓库和数据挖掘的理论和技术,其中第2、3章侧重数据仓库,重点阐述了数据仓库的架构、olap等内容,第4~8章侧重数据挖掘,重点阐述了关联规则、粗糙集、决策树、聚类分析和兴趣度量等内容。第9章给出了数据仓库与数据挖掘方面的应用案例。 《数据仓库与数据挖掘》是为软件工程硕士量身定做的教材,也可作为计算机专业、信息类专业、管理类专业相关课程的教材和教学参考书。
本书在介绍了数据挖掘原理的基础上,从实用的角度出发,详细地介绍了数据挖掘的经典算法。本书是国内本对数据挖掘技术基础算法进行详细描述的实用性教材。 第1章从不同的角度对数据挖掘进行了介绍,第2章介绍了数据仓库技术的概念并给出了数据立方体的理论基础。第3章讲述了数据挖掘的数据预处理所涉及到的概念及算法。第4章-第8章详细介绍了数据挖掘的经典领域的算法,其中第6章简单介绍了数据可视化的内容。第9章介绍了开放的数据挖掘平台。 本书的使用对象是在校高年级的本科生、研究生及各个领域的高级软件开发人员。
金融管理研究的一个显著特点是数据分析量大、不确定性因素多,面对当今时代的海量金融数据,基于传统统计技术建立的模型假设条件多,实际应用难以奏效。数据挖掘是20世纪90年代中期兴起的新技术,是发现数据中有用模式的过程,其目的在于使用所发现的模式帮助解释当前的行为或预测未来的结果,以人们容易理解的形式提供有用的决策信息。 本书对一些相对较成熟的挖掘技术的讨论,阐述其用途、解决思路、需注意的主要问题、步骤,以金融领域的具体案例介绍模型与方法的应用。全书包括金融数据预处理、分类技术、预测、聚类技术、神经网络与支持向量机、异常数据挖掘,并且介绍了这些领域的一些*方法。 本书可作为信息管理与金融类专业本科生和研究生的教材,也可供从事数据挖掘技术与应用研究的科研人员、金融市场数据分析人员,以及
本书按照处理数据的逻辑顺序和习惯,从数据的整理开始入手。从数据的抽样开始,介绍了传统统计的抽样理论,并进一步探讨大数据样本的代表性问题。并且通过具体案例向读者介绍整个数据探索性分析的主要步骤。然后是数据的展示技术,也就是常说的数据可视化,从数据的类型以及展示的内容不同,分别介绍了单变量和多变量数据的多种图示方法,数据的分布形态、高维数据、空间数据的展示,并且介绍了统计制图的一些基本原则和图形美化的操作。 本书主要面向的应用统计专业硕士、有统计学本科基础的各专业硕士研究生,我们也希望对这方面感兴趣的统计专业高年级的本科生以及其他各个领域的有数据分析需求的学生和从业人员可以阅读参考。
大数据分布式计算课程是大数据方向应用统计专业硕士学生的专业必修课,通过本课程的学习使学生能够掌握目前大数据挖掘领域常用的并行计算方法,加深学生对统计并行计算的理解,培养学生使用在现代并行架构下利用统计方法深入挖掘大数据中的数据结构并能解决一些实际问题的能力。
本书对面向应用的数据挖掘方法进行了清晰的阐述,包括经典的多元统计方法、贝叶斯多元统计方法、基于机器学习的数据挖掘方法和基于计算的数据挖掘方法等。介绍了数据挖掘领域中许多*的研究成果,如关联规则、序列规则、图示马尔可夫模型、基于存储的推理、信用风险和Web挖掘等。并详细介绍了选自实际工业项目的6个应用实例,强调了数据挖掘方法的实用性。 本书主要面向计算机科学、信息管理、应用统计学和经济学等专业的高年级本科生和研究生。对实际从事海量数据分析和处理的技术人员也有很好的指导作用和参考价值。
本书系统地介绍了如何设计高效、高性能的数据库。首先详细阐明了关系设计的原理,清晰地介绍了维度数据库建模——从实用的角度来设计当今日益重要的分析型应用。接着分别阐明了传统数据库和用于数据仓库的维度数据库的分析和设计,指出了如何避免常见的结构隐患。本书广泛吸取了数据库设计方面的专家意见,可用性极强。本书适合软件开发人员、数据库设计人员参考。也可作为高等院校师生的参考书。
李於洪主编的《数据仓库与数据挖掘导论》为数据仓库与数据挖掘的基础教程,是作者多年来从事数据仓库与数据挖掘课程教学经验的梳理和总结。为了增强内容的直观性和可理解度,全书以大量图、表、实例融入其中。全书共分为四篇14章。篇为导引,共分2章:用实例和实例分析引导学生理解数据仓库与数据挖掘的概念内涵及其产生背景。第二篇为数据仓库,共分5章:详细介绍了数据仓库的体系结构及其组成部分的功能;从商业需求的角度介绍了数据仓库维度建模方法和联机分析处理操作;介绍了元数据在数据仓库建设中的重要性、分类方法与作用。第三篇为数据挖掘,共分4章:通过浅显易懂的语言及实例,深入浅出地介绍了关联分析方法、神经网络算法、决策树算法和聚类分析方法。第四篇为实验与工具,共分3章:提供了数据仓库实验、神经网络建模实
本书以国际数据挖掘标准流程(GRISP-DM)为依据,以企业管理面临的现实问题为应用案例,由浅入深介绍数据挖掘方法及其解决问题过程的数据理解、数据处理、数据分析、数学建模、模型结果评估等内容,并引人应用广泛的数据挖掘Clementine软件辅助问题案例的解决,使读者不仅可以集中地学习数据挖据的主要理论方法,而且可以了解基于数据挖掘的数学建模过程,可以学习应用软件辅助解决问题的操作方法。 本书把理论、案例、建模、软件辅助结合一体统一叙述,简述理论,突出应用,详细分析,展示过程,既考虑高校学生的学习需要,分本科生与研究生学习层次,又考虑企业管理者的应用与实践需要。 本书可作为数据挖掘理论与技术的教学、实践、应用和提高的教科书或参考书。适合高等学校本科高年级学生、研究生以及学习数据挖掘、数学模型课程的
《先进制造理论研究与工程技术系列:误差理论与数据处理》系统地介绍测量误差的基本理论与测量数据处理的基本方法,包括测量误差的基本概念、特征规律性、表述方法及传递计算,一般测量问题中的数据处理方法,不确定度的估计与合成,小二乘法和回归分析。 《误差理论与数据处理》为高等工科院校机械、材料、精密仪器等专业本科生教材,也可供相关专业工程技术人员参考。
《MySQL是怎样使用的:快速入门MySQL》采用通俗易懂的表达方式,对如何使用MySQL进行了详细的介绍。 《MySQL是怎样使用的:快速入门MySQL》完全从零基础用户的角度出发,依照用户认知习惯,从MySQL的安装开始,介绍了MySQL的服务器程序和客户端程序的使用、MySQL的数据类型、数据库和表的基本操作、列的属性、MySQL中的表达式和函数、简单和复杂的增删改查语句等入门知识,还介绍了视图、存储程序、备份与恢复、用户与权限管理等高级概念以及使用Java语言连接MySQL服务器等知识。 《MySQL是怎样使用的:快速入门MySQL》较好地契合了MySQL初学人员的学习曲线,内容深入浅出,通俗易懂,可帮助初学人员迅速入门MySQL。
可拓数据挖掘以可拓集为集合论基础,结合可拓方法与现有数据挖掘方法去挖掘数据库或数据仓库中基于可拓变换的知识,为经济、金融、管理、营销、策划、医学、设计等领域的决策和技术创新提供依据。本书是本可拓数据挖掘的专著,提出了研究这一领域的理论基础、方法体系和应用范围,并给出简单、浅显的实用案例。本书理论与应用相结合,分析透彻。为方便不同知识背景和不同层次读者的学习,书中配备了通俗易懂的案例。 本书适合高等院校师生、工程技术人员和管理决策人员阅读,特别适合作为高等院校相关专业本科、硕士、博士生的选修课教材。
为数据挖掘入门级教材,共分8章,主要内容分为三个专题:技术、数据和评估。技术专题包括决策树技术、K-means算法、关联分析技术、神经网络技术、回归分析技术、贝叶斯分析、凝聚聚类、概念分层聚类、混合模型聚类技术的EM算法、时间序列分析和基于Web的数据挖掘等常用的机器学习方法和统计技术。数据专题包括数据库中的知识发现处理模型和数据仓库及OLAP技术。评估专题包括利用检验集分类正确率和混淆矩阵,并结合检验集置信区间评估有指导学习模型,使用无指导聚类技术评估有指导模型,利用Lift和假设检验比较两个有指导学习模型,使用MS Excel 2010和经典的假设检验模型评估属性,使用簇质量度量方法和有指导学习技术评估无指导聚类模型。本书秉承教材风格,强调广度讲解。注重成熟模型和开源工具的使用,以提高学习者的应用能力为目标;
本书以“十五”国家863项目“面向网络海量空间信息的大型GIS”和“基于大型GIS地质调查空间数据(库)管理系统”、“十五”国家科技攻关计划项目“城市数字化系统集成关键技术研究”、中地公司*产品MapGIS K9等研究成果为核心,详细阐述了数据中心集成开发平台的体系架构和组成、数据仓库系统、功能仓库系统、搭建和运行平台、标准和规范、应用系统的搭建和部署及应用系统搭建实例等内容。
《海量点云数据处理理论与技术》共分8章。第1章绪论,简要介绍海量点云处理技术的基础理论、方法以及主要内容。第2章介绍海量点云数据的预处理,包括点云数据的获取方案,点云的去噪、压缩、配准方法,以及点云空洞的插值方法。第3章介绍海量点云数据的重建方法,系统介绍常用的点云重建算法与特点,并详细介绍基于特征和基于切片的点云重建方法。第4章介绍点云数据及模型的质量评价,从理论和实际两方面对点云质量进行分析,总结点云配准过程中的误差传播模型,系统地归纳三维模型的质量评定方法。第5章介绍点云数据处理技术,详细介绍国内外常用的海量点云数据处理软件以及三维图像库。第6章介绍地面三维激光扫描仪在隧道监测领域的应用,系统介绍基于三维激光扫描技术的隧道点云数据获取、处理及变形分析方法。第7章介绍地面三维
本书是*精品课程“数据备份与恢复”的配套教材,以数据恢复工程师的岗位需求为依托,以实际工作任务为导向,从硬盘结构与文件系统,数据备份,windows操作系统备份与恢复,windows文档修复,硬盘数据软件恢复,数据库备份与恢复,硬盘故障修复,u盘数据恢复,磁盘阵列数据修复等方面深入浅出地介绍了数据备份与恢复的基本知识和操作技能,着重强调数据恢复的技能训练。 本书既可作为高职高专院校数据备份与恢复课程的教材,也可作为广大数据恢复爱好者和计算机管理员、系统安全人员的参考技术资料。
《数据结构算法与应用》系统地介绍了各种类型的数据结构、数据结构在计算机存储器中的表示以及相关的C语言描述算法。另外,对各类数据结构在实际中的应用做了较深入的介绍,包含示例分析及典型算法的C语言源程序。本书后对算法设计的基础知识进行了讨论,拓展了知识面。每章后附有习题,便于读者进一步理解和巩固所学的知识。 本书可作为大专院校计算机专业或相关专业的教材,也可供从事计算机软件开发的工程技术人员参考。