本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
本书以关系数据库为重点,系统、完整地讲述了当前数据库技术的基本原理和应用实践。取材上力图反映当前数据库技术的发展水平和发展趋势。 本书共分8章。第1章绪论,概述了数据管理的进展、数据模型、数据库管理系统和数据库工程的基本概念。第2至4章讲解了关系数据库的数据模型、数据语言和数据理论,其中对关系数据库的标准语言SQL进行了深入介绍。第5章详细讨论了数据库的安全性、完整性、并发控制和恢复等数据库保护技术,并以一个关系数据库产品为例,说明数据库保护技术在实际产品中是如何实现的。第6章讲述了设计数据库应用系统的方法。重点放在设计关系数据库应用系统上。第7章介绍关系数据库产品的发展过程和5个关系数据库产品实例。第8章数据库技术的新进展介绍了数据库技术的发展过程和新一代数据库系统,包括分布式数据库、并
本书是以高等院校培养应用型人才的发展目标而编写的,介绍了数据库系统原理与应用以及数据库系统开发技术。全书共分为十章,主要内容包括:数据库系统概述、关系数据库系统理论基础、SQL Server 2000的使用,数据库安全及维护、数据库系统设计、数据库访问技术介绍、使用S#和ADO.NET操作数据库、使用C#开发Windows数据库应用程序、基于C#和ASP.NET的Web数据库应用程序、数据库新技术概述。本书在讲述理论的同时与SQL Server2000有机结合,使理论与实践同步,同时介绍了使用C#和ASP.NET开发数据库应用程序的技术。 本书内容丰富、结构合理、实用性强、理论叙述严谨、庆用能力培养目标明确。读者学完本门课程后,能够具备数据库应用系统的独立开发能力。书中的开发实例均是作者的实际研发项目,具有较高的参考价值和实用价值。 本书可作为各大学、专科院校
随着网络的广泛应用,数据发布成为各领域发布数据、获取数据的一个重要手段。随着知识发现与机器学习在诸多领域的深度应用和广度拓展,隐私保护数据挖掘已经成为知识发现领域的一个核心问题,基于数据发布的隐私保护数据挖掘已经成为涉及到每个国家、每位公民的首要问题。刘英华编*的这本《基于数据发布的隐私保护模型研究》基于安全多方和加密技术,设计出了全新的完全同态加密算法,并在此基础上提出FHE-DK-MEANS模型和FHE-DBIRCH模型。
《MySQL是怎样使用的:快速入门MySQL》采用通俗易懂的表达方式,对如何使用MySQL进行了详细的介绍。 《MySQL是怎样使用的:快速入门MySQL》完全从零基础用户的角度出发,依照用户认知习惯,从MySQL的安装开始,介绍了MySQL的服务器程序和客户端程序的使用、MySQL的数据类型、数据库和表的基本操作、列的属性、MySQL中的表达式和函数、简单和复杂的增删改查语句等入门知识,还介绍了视图、存储程序、备份与恢复、用户与权限管理等高级概念以及使用Java语言连接MySQL服务器等知识。 《MySQL是怎样使用的:快速入门MySQL》较好地契合了MySQL初学人员的学习曲线,内容深入浅出,通俗易懂,可帮助初学人员迅速入门MySQL。
本书共12章,以信息的采集 、传输和处理为主线,主要包括计算机数据采集与 分析技术概述、数据采集信号分析基础、传感器技术、模/数转换器、数/模 转换器、数据采集系统常用电路、数据采集系统抗干扰技术、总线接口技术 、输入/输出接口技术、数据分析与处理、使用LabVIEW进行数据采集与分析 等内容。同时,《数据采集与分析技术(第二版)》在后以数字式血压仪为 例详细介绍了数据采集设备的软、硬件开发。《数据采集与分析技术(第二 版)》的例子均来源于工程实践, 简明实用,为读者提高动手实践能力提供 了良好的范例。 《数据采集与分析技术(第二版)》主要面向从事计算机数据采集与分析 的工程人员和希望学习相关技术的大专院校学生。
从数据中心机房监控系统的自定制技术、监控系统可信方法等方面,综述国内外研究进展,确定研究内容。第1章,主要讲述智能绿色数据中心机房监控系统的内涵;第2章,主要讲述基于大批量定制的绿色数据中心机房的自定制机理与方法;第3章,主要讲述绿色数据中心机房的用户身份认证、完整性等可信方法;第4章,给出了绿色数据中心机房智能监控技术应用,研制绿色智能机房监控系统,在该绿色智能机房监控系统架构上实施用户自定制技术、可信增强技术模块功能,并测试各项技术及整个系统的应用效果。 本书是作者长期从事数据中心机房监控系统,特别是数据中心机房监控系统自定制、可信性研究工作的方法和应用成果的总结,本书所研究技术应用到实际数据中心机房运行,这些实践工作对本书的形成具有十分重要的意义。
本书是面对当前科学可视化、信息可视化、可视分析研究和应用的新形势,专门为计算机、数据处理、视觉设计、统计、数学、航空航天、建筑、遥感影像等专业本科生开设数据可视化课程而编写的一本教材。全书划分为三篇:基础篇、数据篇和应用篇。其中,基础篇从人、数据、可视化流程等三个层面阐述数据可视化的基础理论和概念;数据篇则针对实际应用中遇到的不同类型的数据,包括时空数据、地理信息数据、高维非空间数据、层次和网络数据介绍相应的可视化方法;应用篇着重介绍可视化综合应用及实用系统。为了便于学习,每章后都附有习题和参考文献。 本书的特点是内容完整,叙述简明,重点突出;以数据类型为导向,以行业应用为目标。作者专门收集和整理了相关的课程教案、典型数据、精彩案例、可视化作品、课程附属视频和动画材
本书系统讲解数据库的基本概念,数据库设计的基本方法和数据库应用开发的基本技术,并介绍了数据库技术新进展。本书强调理论与实践,技术与应用的结合。内容系统全面,深入浅出。 本书可作为高等学校计算机基础教学课程中数据库系统的教材,也可以供数据库应用部门,从事计算机应用系统设计和开发部门的工程技术人员参考。
本书主要包括三部分内容,即误差和数据处理基础、试验设计方法与应用和计算机数据处理软件简介。从误差理论入手,分别介绍测量值与误差、偶然误差的分布、误差传递等误差理论中的内容,介绍统计检验、方差分析、回归分析和聚类分析等数据处理方法与应用,介绍提高分析化学准确度的方法及质量控制方法,介绍正交试验设计、多因素序贯试验设计、*化区组和拉丁方设计、析因设计、响应面设计方法与应用,后一章以较大篇幅对现时流行的大型统计软件之一SPSS(Statistical Product and Service Solutions)进行简要介绍,书末附有习题及常用的统计数表。 本书着重介绍基本概念和基本理论,并在此基础上结合专业特点,介绍了各种统计方法在化学化工、医药、环境检测、矿物加工等多方面的应用,本书把误差与数据处理、质量控制和实验设计作为重点。
本书着力于介绍数据挖掘基础知识、基本原理、常用算法,主要内容包括数据挖掘概述、数据的描述与可视化、数据的采集和预处理、数据的归约、关联规则挖掘、分类与预测、 非线性预测模型、聚类分析、深度学习简介、使用 Weka 进行数据挖掘。本书通俗易懂,注重基础知识、基本原理和基本方法,注重启发和引申,以培养学生独立思考和独立发现的能力。本书适合作为数据科学与大数据、信息管理、统计等专业的本科层次基础课教材,也可作为相关专业研究生层次的参考用书。
本书采用图解形式对“大数据”这一概念进行了全新解读,将大数据从一个IT术语变成了人人能读懂的大众词汇。本书从大数据的“前世今生”讲起,通过列举各行各业应用大数据的案例,全面解读了大数据和个人的关系、如何利用大数据创业、大数据中隐藏了多少价值、大数据给我们带来了哪些冲击和变革、如何利用大数据进行精准营销等读者十分关心的热点问题。本书图文并茂,读者利用零散时间,就能迅速了解大数据知识。 本书适合企业管理者、创业者、投资者、高校相关专业师生等想运用大数据改变未来生活的人士阅读。
全书共分为六章:*章为绪论,介绍了大数据时代隐私内涵的构成要素以及发展变迁历史,并从技术层面、社会层面、个人层面列举了大数据环境下隐私安全的表现形式,总结了当前个人隐私被侵害的类型以及呈现的特征;第二章为隐私泄露风险评估与度量方法,针对常用的隐私保护方法,详细介绍了当前隐私量化模型与度量标准的相关研究,并分析了主流的隐私度量方法的性能优劣以及评价指标;第三章为位置服务中隐私保护技术,并介绍了P2P结构与独立架构两种模式下位置隐私保护技术方案。第四章为深度学习训练数据集隐私保护技术,提出了两种差分?
本书是中国人民大学出版社出版的教材《统计数据分析基础教程(第二版)——基于SPSS 20和Excel 2010的调查数据分析》的配套辅导书。 由于本次修订对教材内容进行了更加适当的筛选,同时对例题和上机实验题进行了大幅更新,于是本同步配套辅导书也做了相应的修订。 本书以习题和上机实验指导的方式给出了教材中“思考题与上机实验题”的解答,以便帮助读者消化教材内容。本书包含10章的上机实验指导共32个。包括:*抽样、调查问卷制作、问卷数据的录入与清理、单选题的一维频率分析、两个单选题的交叉表分析、多选题的一维频率分析和交叉表分析、描述统计分析、假设检验、单因素方差分析、线性相关分 析与线性回归分析等。 本书可作为各级各类高等院校本科生统计数据分析的入门书,也可以作为MBA学生、研究生以及从事统计数据分析工作的人士
基于知识的聚类展示的是如何设计一个导航平台,以使信息探寻者能理解和较好的应用种类繁多的数据集。比模糊聚类走得更远,作者展示了基于知识的聚类这一有前景的新范例是如何揭示更有意义的数据结构,并使社会更好地处理日益增长的数据和信息流。通过这《基于知识的聚类—从数据到信息粒》,读着能理解基于知识聚类的基础和与其相关联的算法,学会将他们自己的知识应用到系统建模和设计中去。 《基于知识的聚类—从数据到信息粒》首先对模糊聚类和粒计算这一领域进行介绍和讨论。然后,作者深入研究了基于逻辑的神经元和神经网络。《基于知识的聚类—从数据到信息粒》的核心部分包括9章,在其中呈现和分析了众多不同的基于知识的聚类的方法。《基于知识的聚类—从数据到信息粒》的第三部分致力于模型的研究,首先讨论超盒结构,然
李於洪主编的《数据仓库与数据挖掘导论》为数据仓库与数据挖掘的基础教程,是作者多年来从事数据仓库与数据挖掘课程教学经验的梳理和总结。为了增强内容的直观性和可理解度,全书以大量图、表、实例融入其中。全书共分为四篇14章。篇为导引,共分2章:用实例和实例分析引导学生理解数据仓库与数据挖掘的概念内涵及其产生背景。第二篇为数据仓库,共分5章:详细介绍了数据仓库的体系结构及其组成部分的功能;从商业需求的角度介绍了数据仓库维度建模方法和联机分析处理操作;介绍了元数据在数据仓库建设中的重要性、分类方法与作用。第三篇为数据挖掘,共分4章:通过浅显易懂的语言及实例,深入浅出地介绍了关联分析方法、神经网络算法、决策树算法和聚类分析方法。第四篇为实验与工具,共分3章:提供了数据仓库实验、神经网络建模实
数据仓库与数据挖掘是决策支持的两项重要技术,它们共同的特点是都需要利用大量的数据资源,并从数据资源中提取信息和知识。由于数据资源丰富,因此数据仓库与数据挖掘的决策支持效果显著。 本书系统介绍数据仓库原理,联机分析处理,数据仓库设计与开发,数据仓库的决策支持,数据挖掘原理,基于信息论的决策树方法,基于集合论的粗糙集方法、k—均值聚类、关联规则挖掘,仿生物技术的神经网络,遗传算法,公式发现,知识挖掘,文本挖掘与web挖掘。 本书从数据仓库的兴起来说明决策支持的特点,从数据挖掘的理论基础来说明数据挖掘的方法,并通过实例来详细讲解。希望读者在学习之后,亲自在计算机上去实践,这样才能更有效地掌握数据挖掘的方法。
MongoDB是一种面向文档的分布式数据库,可扩展,表结构自由,并且支持丰富的查询语句和数据类型。时至今日,MongoDB以其灵活的数据存储方式逐渐成为IT行业非常流行的一种非关系型数据库(NoSql)。 本书从学习与实践者的视角出发,本着通俗精简、注重实践、突出精髓的原则,精准剖析了MongoDB的诸多概念和要点。全书共分4个部分,分别从基础知识、深入理解MongoDB、监控与管理MongoDB和应用实践几个维度详细地介绍了MongoDB的特点及应用实例。 本书适合有海量数据存储需求的人员、数据库管理开发人员、数据挖掘与分析人员以及各类基于数据库的应用开发人员。读者将从书中获得诸多实用的知识和开发技巧。
《数据挖掘技术》是基于数据挖掘经典算法及数据挖掘领域*研究技术进行数据分析的教材。全书内容包括数据挖掘概述、分类算法、聚类算法、关联规则算法及相应典型算法的算法描述及分析等。对当前数据挖掘的新技术——流数据挖掘技术、高维聚类算法、分布式数据挖掘、物联网数据挖掘进行了详细的介绍。该部分在讲述基本概念及典型算法的基础上配有新研究的算法模型及分析,并有实验数据分析及结果显示。后对其他数据挖掘新技术,包括业务活动监控挖掘技术、云计算平台架构和数据挖掘方法及思维流程数据挖掘技术进行了描述。 本书可以作为高等院校信息管理、数理统计等专业有关数据挖掘教学的本科生或者研究生的专业课教材,也可以作为各类相关培训班的教材,还可以作为从事数据分析、智能产品软件开发人员的参考书及数据挖掘爱好
本书主要介绍客户关系管理(CRM)环境中使用的数据仓库的设计和构建。书中介绍了数据仓库的概念,探讨了数据仓库的体系结构、逻辑模型、物理实现、工程管理等内容。并且描述了建造数据仓库的一些工具产品,介绍了购买这些工具时需要注意的问题。另外,书中还对数据仓库的时间性问题提出了独到的见解,给出了可行的方案。? 本书适合于希望学习数据仓库原理的人员以及数据仓库建造的顾问人员使用。
《先进制造理论研究与工程技术系列:误差理论与数据处理》系统地介绍测量误差的基本理论与测量数据处理的基本方法,包括测量误差的基本概念、特征规律性、表述方法及传递计算,一般测量问题中的数据处理方法,不确定度的估计与合成,小二乘法和回归分析。 《误差理论与数据处理》为高等工科院校机械、材料、精密仪器等专业本科生教材,也可供相关专业工程技术人员参考。
本书采用了众多流行的数据挖掘算法,如利用K-means算法进行信息聚类和网页自动抽取,利用贝叶斯分类器实现信息过滤与分类,将知识组织与网站优化有机地结合起来,使得主题、目录组织的思想融合贯通在智能网站设计当中。全书共分6章,主要介绍了网络日志的数据来源、类型及其预处理技术;用户信息行为,包括网络用户行为的构成因素、分类,信息行为模型;用户行为数据的提取和分析,用户个性化知识服务需求的影响因素;网站优化算法的设计;智能技术在网站开发中的应用;机器学习的实现原理与训练模型,利用贝叶斯分类算法对垃圾信息进行自动过滤。后,还对网站导航优化效果进行了调试与展示,并给出了实现的核心代码。 本书涉及数据挖掘、计算机编程、知识组织等多门学科的知识,理论性强。全书内容深入浅出,既有较深的理论分析,