本书主要包括三部分内容,即误差和数据处理基础、试验设计方法与应用和计算机数据处理软件简介。从误差理论入手,分别介绍测量值与误差、偶然误差的分布、误差传递等误差理论中的内容,介绍统计检验、方差分析、回归分析和聚类分析等数据处理方法与应用,介绍提高分析化学准确度的方法及质量控制方法,介绍正交试验设计、多因素序贯试验设计、*化区组和拉丁方设计、析因设计、响应面设计方法与应用,后一章以较大篇幅对现时流行的大型统计软件之一SPSS(Statistical Product and Service Solutions)进行简要介绍,书末附有习题及常用的统计数表。 本书着重介绍基本概念和基本理论,并在此基础上结合专业特点,介绍了各种统计方法在化学化工、医药、环境检测、矿物加工等多方面的应用,本书把误差与数据处理、质量控制和实验设计作为重点。
本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
与十年前相比,数据挖掘作为数据分析与决策支持的重要技术,已在各行各业得到了更为广泛的应用。随着网络和]T技术的不断发展,数据挖掘应用必将更加深入和普及。作者根据,自己十多年教授“数据挖掘”课程的经验积累,编写了这本教材。 本书全面系统地介绍了数据挖掘的主要方法,并配有许多应用案例,使得读者能够更加容易地理解这些数据挖掘方法。同时本书每章后还配有许多思考题,使得这本书更适合作为“数据挖掘”课程的教材。 本书的主要内容包括数据挖掘概述、数据仓库与在线分析、分类挖掘、关联挖掘、聚类挖掘、异类挖掘、数据流挖掘、文本挖掘以及数据挖掘应用与数据挖掘云等。 本书适合作为高等院校高年级本科生、研究生相关课程的教材或参考书。对从事数据挖掘应用的技术人员以及希望了解数据挖掘方法与应用的广大
本教程中预备知识,介绍项目中实验环境、程序组织方式和管理方法,讲解程序及算法的效率估算方法和分析技巧,描述一般测试技术和调试方法,以及测试数据与测试用例的设计安排技巧;基础实验,首先安排重要的验证性实验,然后设计基于基本数据结构的简单应用实验;综合实验(即课程设计),介绍在一个项目中选择和使用多种基本数据结构的依据和方法,讲解如何有效地将它们融合在一起解决实际的复杂应用问题。 本教程在内容选取及编排顺序上,与严蔚敏老师编著的《数据结构(C 语言版)》(978-7-302-14751-0,清华大学出版社出版)保持一致,可作为高等院校计算机及相关专业数据结构课程的实验教材。
本书是国内部关于医学数据挖掘的教材。包括基础篇、核心篇和应用篇三个部分。基础篇介绍数据挖掘的基本概念和理论,核心篇介绍数据挖掘的主要算法和工具,应用篇则分别介绍数据挖掘在医学临床、分子生物学、预防医学、医院管理、文本和web挖掘中的具体应用。 本书首先强调数据挖掘的基本概念和基本方法,重点介绍该领域的基本概念、基本过程和方法;各种算法以介绍其适用条件和原理为主,尽量少涉及具体算法的数学公式。其次,本书以应用为主,介绍数据挖掘方法在医学研究和服务中的应用实例,为学生今后进一步从事这一方面的深入研究提供基础。后,本书在内容组织上力求全面系统,突出重点。由浅入深、突出交叉学科的特色的同时,注重所介绍知识的层次,适合不同水平读者的学习需要。
张霞的这本《粒度计算在数据挖掘中的应用研究》对模糊粒度计算在文本软聚类中的应用进行了深入研究,提出了一种基于模糊粒度计算的聚类方法,并且利用该聚类方法对K-means算法进行了优化。基于模糊粒度计算的聚类是通过归一化的距离函数将聚类问题映射到距离空间,调节粒度产生对文本集合D的动态聚类划分。 动态聚类既可以作为一个单独的聚类结果,也可以作为其他算法的一个预处理步骤。K-means算法是一种经典的聚类算法,速度快、消耗资源小,但是算法对初始聚类中心点敏感,容易陷入局部小值。《粒度计算在数据挖掘中的应用研究》将基于模糊粒度计算的聚类方法作为K-means算法的预处理步骤,实验结果证明,这种预处理有效地消除了K-means算法的初始值敏感问题,优化了K-means算法。
数据仓库与数据挖掘是与计算机、信息类等相关专业的核心课程。张兴会等编著的《数据仓库与数据挖掘工程实例》采用提出问题、分析问题、解决问题的思路,通过工程实例介绍了SQL Server 2005和 Weka软件的使用方法以及联机分析处理技术、关联规则方法、决策树方法、贝叶斯方法、人工神经网络方法、聚类分析方法、线性回归方法等数据仓库与数据挖掘技术。 本书结构严谨,条理清晰,语言浅显易懂,循序渐进地表达了知识内容;坚持理论与实际相结合,知识理论与具体实现方法相结合,使技术实现具体化、生动化、可操作化;工程实例的实现过程建立在 SQLServer2005和Weka软件的基础上,以帮助读者在学习后达到学以致用的效果。本书可以和《数据仓库与数据挖掘技术》教材配合使用,旨在帮助读者在学习数据仓库与数据挖掘理论知识的基础上,通过学习工
粗糙集理论是一种不确定性数据分析工具,近年来在特征选择、分类学习和规则提取等应用方面取得了巨大成功,并逐渐成为信息科学为活跃的研究领域之一。本书系统地论述了基于粗糙集的属性约简理论和方法,信息系统之间的信息通讯以及关于粗糙群的一些本质问题。主要内容有:基于覆盖粗糙集的属性约简模型建立及约简结构性质分析,基于广义粗糙集的属性约简模型建立及约简结构性质分析,基于广义粗糙集的信息系统之间等价属性约简理论与方法,基于模糊粗糙集的信息系统之间等价属性约简理论与方法,粗糙群的理论研究,以及这些理论在数据挖掘中的应用。 本书可以作为理工科大学计算机、应用数学、自动控制、信息科学以及管理工程等专业的高年级本科生、研究生以及博士生的教材,同时对有关领域的研究人员和工程技术人员也有重要的参考
数据挖掘将数据转化为知识,是数据管理、信息处理领域研究、开发和应用的活跃的分支之一。本书全面地论述了数据挖掘领域的基本概念、基本原理和基本方法,内容包括数据挖掘领域的经典理论和前沿发展。全书共分14章,并含有1个附录。全面系统地介绍了数据挖掘的概念和过程、数据预处理技术;深入地叙述了各种数据挖掘技术,包括关联规则、决策树、聚类、基于样例的学习、贝叶斯学习、粗糙集、神经网络、遗传算法、统计分析;并讨论了数据挖掘的典型应用,如分类、文本和Web挖掘,以及数据挖掘的应用和发展趋势;并在第14章中给出了一个具体的商业智能解决方案实例。 通过本书的学习,读者可以对数据挖掘的整体结构、概念、原理、技术和发展有深入的了解和认识。 本书既可以作为相关专业的高年级本科生和研究生教材,也可作为数据挖掘领
本书为普通高等教育“十一五”规划教材,是电力企业信息化系列教材之一。 本书全面深入介绍了数据仓库、联机分析处理(OLAP)和数据挖掘的基本概念、工具及实际应用。全书分成三篇,数据仓库与数据挖掘原理篇的主要内容包括数据仓库的基本概念和结构、创建过程、联机分析处理、数据挖掘的基本概念和方法等;数据仓库与数据挖掘工具篇介绍几个现在市场上主流的数据仓库和数据挖掘工具,包括ETL工具Data Stage、商务智能工具 Congos和数据挖掘工具SAS;数据仓库与数据挖掘应用篇以某电力公司为例介绍一个数据仓库应用系统的建设过程,包括系统需求分析、系统架构设计、数据模型设计、数据库规划、ETL开发等。 本书可作为计算机、信息管理与信息系统等相关专业的学生学习数据仓库、OLAP及数据挖掘技术的实用教程,也可供从事数据仓库、数据挖
商务智能与数据挖掘是高等院校电子商务、信息管理等专业的课程,是近年来企业信息化的热点内容。本书共分9章,包括商务智能概论、商务智能中的核心技术、商务智能与知识管理、商务智能的应用、数据挖掘基础、数据挖掘的目的任务、数据挖掘的技术方法、Web挖掘技术、数据挖掘在电子商务中的应用等内容;汇集了统计学、机器学习、数据库、人工智能等内容,具有多学科交叉、技术与管理融合等特点。本书在借鉴和吸收国内外同类著作的基础上,强调了理论与实践的结合;在归纳和总结商务智能的*理论研究成果及行业*发展动态的基础上,编写了相应的案例,以期反映国内外的商务智能实践经验,将*的国际商务智能的相关内容和关键技术介绍给读者。 本书内容全面,案例新颖,每章附有教学目标与要求、习题,使得读者能把握各章要点并且及时巩固所
《数据仓库与数据挖掘技术》主要介绍数据仓库和数据挖掘技术的基本概念、相关技术和应用案例及方法。全书共分为9章,主要内容包括:数据仓库与数据挖掘的概念和体系结构、数据仓库开发模型、etl技术、olap技术、商务智能系统、数据预处理技术、数据挖掘技术、数据仓库开发实例、报表设计等内容。本书各章节的案例均使用microsoftsql server2005进行操作实践讲解。通过对具体实例的学习和实践,使读者掌握数据仓库和数据挖掘中必要的知识点,达到学以致用的目的。 《数据仓库与数据挖掘技术》适合作为高等院校本科学生的教材,也可供企业信息化管理人员、技术人员以及软件开发人员阅读参考。
大数据为何如此聪明?它是否会chao越人类理性的控制?本书选取人机关系这一切入点作为分析视角,综合以往哲学界做出的相关论述,阐释了新的概念与理论体系下大数据如何在人机交互中构建和涌现智能。 本书以大数据时代作为总的分析背景,进行了 人机关系的内涵分析 人机关系与心物关系问题的关联 大数据的构建与其意向性的负载 大数据的可建构性研究 人机关系视域下的大数据的伦理问题 等方面的论述,在跟随时代热点的同时也对 心物关系 和 他心知 等经典的哲学问题做出了视角较为新颖的回应。本书知识性、系统性较强,可作为科技哲学领域研究的专家学者进一步从事人工智能哲学和技术哲学等领域研究的参考用书。
李琳琳主编的《数据链技术及应用(高等学校十二五规划教材)》是一本全面介绍数据链系统概念、原理、组成、功能、集成及作战应用的教科书。全书共分7章,围绕数据链系统这一核心概念,主要介绍了数据链系统的基本概念、组成及工作原理,详细阐述了数据链系统的信息传输、信息安全、网络管理以及数据链与平台的集成,*后介绍了数据链在作战中的应用。 本书可作为军队院校通信工程和指挥信息系统工程等相关专业的本科生教材,也可作为地方高等院校国防生相关专业教材和各类军队干部培训(轮训)教材,还可以作为国防科技人员和军事爱好者的参考资料。
这本《数据挖掘--方法与应用》主要根据作者徐华近几年在清华大学面向研究生和本科生开设的“ 数据挖掘:方法与应用”课程的教学实践与积累,参考近几年国外著名大学相关课程的教学体系,系统地介绍数据挖掘的基本概念和基本原理方法;结合一些典型的应用实例展示用数据挖掘的思维方法求解问题的一般性模式与思路。 本书可作为有一定数据结构、数据库和程序设计基础的研究生或本科生开展数据挖掘知识学习和研究的入门性教材与参考读物。
本书是《实用数据结构基础(第四版)》(陈元春、王中华、张亮、王勇编著,中国铁道出版社出版) 的配套学习指导书。全书内容分为5部分:教学内容指导(包括对主教材第1~10章的知识点分析、典型 习题分析和各章习题解答);自主设计实验指导(对10个自主设计实验的设计思想、算法分析进行了详细 指导);模拟试卷;模拟试卷参考答案;数据结构课程设计报告样例。 本书对数据结构的概念和原理的阐述通俗易懂,例子翔实;习题难易适中,题型丰富;对数据结构 基本运算的分析注重实现的过程。本书以C/C++语言作为算法的描述语言,对于书中的实验和一些重要 的算法均给出了完整的C/C++语言源程序,并全部在Visual C++ 6.0环境下运行通过。 本书适合作为普通高等院校计算机类专业数据结构课程的教学辅导书,也可作为成
李於洪主编的《数据仓库与数据挖掘导论》为数据仓库与数据挖掘的基础教程,是作者多年来从事数据仓库与数据挖掘课程教学经验的梳理和总结。为了增强内容的直观性和可理解度,全书以大量图、表、实例融入其中。全书共分为四篇14章。篇为导引,共分2章:用实例和实例分析引导学生理解数据仓库与数据挖掘的概念内涵及其产生背景。第二篇为数据仓库,共分5章:详细介绍了数据仓库的体系结构及其组成部分的功能;从商业需求的角度介绍了数据仓库维度建模方法和联机分析处理操作;介绍了元数据在数据仓库建设中的重要性、分类方法与作用。第三篇为数据挖掘,共分4章:通过浅显易懂的语言及实例,深入浅出地介绍了关联分析方法、神经网络算法、决策树算法和聚类分析方法。第四篇为实验与工具,共分3章:提供了数据仓库实验、神经网络建模实
本书是一本Oracle数据库管理的入门教材,适合于初中级的读者,是作者二十多年IT工作和教学实践的总结与升华。 本着“把Oracle数据从高雅的象牙塔中带出来,使它的贵族身份贫民化,为普通人提供一套能买得起,而且容易读懂的Oracle数据库实用教材”的写作理念,本书使用生动而简单的生活例子来解释复杂的计算机和数据库概念,避免用计算机的例子来解释计算机和数据库的概念。本书是自封闭的,除了的SQL知识之外,读者可以在没有任何计算机专业知识的情况下从头开始阅读此书,而且也不需要其他的参考书。为了消除读者对IT教材常有的畏惧感,书中使用的语言轻松而幽默。 本书是一本Oracle数据库管理的实用教材。虽然它覆盖了OCP(Oracle认证专家)或OCA考试的几乎全部的内容,但重点放在实际工作能力的训练。因此本书中的每章附有大量的例题,而且
本书对数据挖掘的基本算法进行了系统介绍,每种算法不仅介绍了算法的基本原理,而且配有大量例题以及源代码,并对源代码进行了分析,这种理论和实践相结合的方式有助于读者较好地理解和掌握抽象的数据挖掘算法。全书共分11章,内容同时涵盖了数据预处理、关联规则挖掘算法、分类算法和聚类算法,具体章节包括绪论、数据预处理、关联规则挖掘、决策树分类算法、贝叶斯分类算法、人工神经网络算法、支持向量机、K means聚类算法、K 中心点聚类算法、神经网络聚类算法以及数据挖掘的发展等内容。本书可作为高等院校数据挖掘课程的教材,也可以作为从事数据挖掘工作以及其他相关工程技术工作人员的参考书。
本书是中国人民大学出版社出版的教材《统计数据分析基础教程(第二版)——基于SPSS 20和Excel 2010的调查数据分析》的配套辅导书。 由于本次修订对教材内容进行了更加适当的筛选,同时对例题和上机实验题进行了大幅更新,于是本同步配套辅导书也做了相应的修订。 本书以习题和上机实验指导的方式给出了教材中“思考题与上机实验题”的解答,以便帮助读者消化教材内容。本书包含10章的上机实验指导共32个。包括:*抽样、调查问卷制作、问卷数据的录入与清理、单选题的一维频率分析、两个单选题的交叉表分析、多选题的一维频率分析和交叉表分析、描述统计分析、假设检验、单因素方差分析、线性相关分 析与线性回归分析等。 本书可作为各级各类高等院校本科生统计数据分析的入门书,也可以作为MBA学生、研究生以及从事统计数据分析工作的人士