本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
本书是《实用数据结构基础(第四版)》(陈元春、王中华、张亮、王勇编著,中国铁道出版社出版) 的配套学习指导书。全书内容分为5部分:教学内容指导(包括对主教材第1~10章的知识点分析、典型 习题分析和各章习题解答);自主设计实验指导(对10个自主设计实验的设计思想、算法分析进行了详细 指导);模拟试卷;模拟试卷参考答案;数据结构课程设计报告样例。 本书对数据结构的概念和原理的阐述通俗易懂,例子翔实;习题难易适中,题型丰富;对数据结构 基本运算的分析注重实现的过程。本书以C/C++语言作为算法的描述语言,对于书中的实验和一些重要 的算法均给出了完整的C/C++语言源程序,并全部在Visual C++ 6.0环境下运行通过。 本书适合作为普通高等院校计算机类专业数据结构课程的教学辅导书,也可作为成
本书共分10章。第1章介绍了数据挖掘方法的历史,另外讨论了统计学习的一般模型。第2、3、4章介绍了三种数据挖掘模型:人工神经网络、支持向量机和隐马尔可夫模型。第5章介绍了一种新型支持向量诱导回归模型,第6章介绍了一种基于快速训练算法的HMM/SVM混合系统,第7章介绍了分解向前算法及PCA/ICA降维SVM模型,第8章介绍了不对称支持向量机改进算法,第9章介绍了一种基于隐马尔可夫模型的多重序列分析方法,第10章介绍了一类基于SVM/RBF的气象模型预测系统。
《MySQL是怎样使用的:快速入门MySQL》采用通俗易懂的表达方式,对如何使用MySQL进行了详细的介绍。 《MySQL是怎样使用的:快速入门MySQL》完全从零基础用户的角度出发,依照用户认知习惯,从MySQL的安装开始,介绍了MySQL的服务器程序和客户端程序的使用、MySQL的数据类型、数据库和表的基本操作、列的属性、MySQL中的表达式和函数、简单和复杂的增删改查语句等入门知识,还介绍了视图、存储程序、备份与恢复、用户与权限管理等高级概念以及使用Java语言连接MySQL服务器等知识。 《MySQL是怎样使用的:快速入门MySQL》较好地契合了MySQL初学人员的学习曲线,内容深入浅出,通俗易懂,可帮助初学人员迅速入门MySQL。
本书主要介绍数据仓库和数据挖掘技术的基本原理和应用方法,全书共分为12章,主要内容包括数据仓库的概念和体系结构、数据仓库的数据存储和处理、数据仓库系统的设计与开发、关联规则、数据分类、数据聚类、贝叶斯网络、粗糙集、神经网络、遗传算法、统计分析、文本和Web挖掘。 本书既重视理论知识的讲解,又强调应用技能的培养。每章首先介绍算法的主要思想和理论基础,之后利用算法去解决实例中给出的任务,而且对于数据仓库的组建方法和多数章节中的数据挖掘算法,本书都使用Microsoft SQL Server 2005进行了操作实现。本书通过对具体实例的学习和实践,使读者掌握数据仓库和数据挖掘中必要的知识点,达到学以致用的目的。 本书每章均配有习题,习题形式为选择题、简答题和操作题,可以帮助读者进一步巩固和掌握所学知识。此外,本书提供多媒
本书是中国人民大学出版社出版的教材《统计数据分析基础教程(第二版)——基于SPSS 20和Excel 2010的调查数据分析》的配套辅导书。 由于本次修订对教材内容进行了更加适当的筛选,同时对例题和上机实验题进行了大幅更新,于是本同步配套辅导书也做了相应的修订。 本书以习题和上机实验指导的方式给出了教材中“思考题与上机实验题”的解答,以便帮助读者消化教材内容。本书包含10章的上机实验指导共32个。包括:*抽样、调查问卷制作、问卷数据的录入与清理、单选题的一维频率分析、两个单选题的交叉表分析、多选题的一维频率分析和交叉表分析、描述统计分析、假设检验、单因素方差分析、线性相关分 析与线性回归分析等。 本书可作为各级各类高等院校本科生统计数据分析的入门书,也可以作为MBA学生、研究生以及从事统计数据分析工作的人士
本书是面对当前科学可视化、信息可视化、可视分析研究和应用的新形势,专门为计算机、数据处理、视觉设计、统计、数学、航空航天、建筑、遥感影像等专业本科生开设数据可视化课程而编写的一本教材。全书划分为三篇:基础篇、数据篇和应用篇。其中,基础篇从人、数据、可视化流程等三个层面阐述数据可视化的基础理论和概念;数据篇则针对实际应用中遇到的不同类型的数据,包括时空数据、地理信息数据、高维非空间数据、层次和网络数据介绍相应的可视化方法;应用篇着重介绍可视化综合应用及实用系统。为了便于学习,每章后都附有习题和参考文献。 本书的特点是内容完整,叙述简明,重点突出;以数据类型为导向,以行业应用为目标。作者专门收集和整理了相关的课程教案、典型数据、精彩案例、可视化作品、课程附属视频和动画材
李於洪主编的《数据仓库与数据挖掘导论》为数据仓库与数据挖掘的基础教程,是作者多年来从事数据仓库与数据挖掘课程教学经验的梳理和总结。为了增强内容的直观性和可理解度,全书以大量图、表、实例融入其中。全书共分为四篇14章。篇为导引,共分2章:用实例和实例分析引导学生理解数据仓库与数据挖掘的概念内涵及其产生背景。第二篇为数据仓库,共分5章:详细介绍了数据仓库的体系结构及其组成部分的功能;从商业需求的角度介绍了数据仓库维度建模方法和联机分析处理操作;介绍了元数据在数据仓库建设中的重要性、分类方法与作用。第三篇为数据挖掘,共分4章:通过浅显易懂的语言及实例,深入浅出地介绍了关联分析方法、神经网络算法、决策树算法和聚类分析方法。第四篇为实验与工具,共分3章:提供了数据仓库实验、神经网络建模实
科技的进步,特别是信息产业的发展,把整个社会带入一个崭新的信息时代。随着计算机应用的普及和数据库技术的不断发展,数据仓库与数据挖掘技术的应用领域越来越广泛。 《数据仓库与数据挖掘》第1章介绍数据仓库、数据挖掘的一般知识和应用领域。第2~8章介绍数据仓库和数据挖掘的理论和技术,其中第2、3章侧重数据仓库,重点阐述了数据仓库的架构、olap等内容,第4~8章侧重数据挖掘,重点阐述了关联规则、粗糙集、决策树、聚类分析和兴趣度量等内容。第9章给出了数据仓库与数据挖掘方面的应用案例。 《数据仓库与数据挖掘》是为软件工程硕士量身定做的教材,也可作为计算机专业、信息类专业、管理类专业相关课程的教材和教学参考书。
本书全面、系统地介绍了数据仓库的原理、开发和应用技术。主要内容包含数据仓库、联机分析处理和数据挖掘的基本概念、体系结构、开发模型、项目规划、创建过程和应用管理,涵盖了数据仓库的完整生命周期。本书力求从务实的角度出发,揭开笼罩在数据仓库、联机分析处理和数据挖掘上面的神秘面纱,使读者能对数据仓库、联机分析处理和数据挖掘有一个正确认识,以推动数据仓库在我国的健康发展。 本书为授课教师免费提供电子教案,此教案用PowerPoint制作,可以任意修改。需要者可以从中国水利水电出版社网站www.waterpub.com.cn下载,也可与北京万水电子信息有限公司联系,联系电话:(010)82564395。
本书系统地介绍了决策分析的相关理论与方法,并对决策支持系统及其实现技术进行了描述。主要内容包括: 决策支持系统的概念、结构、分析、设计、开发及实现等相关知识: 各种决策类型的理论与方法,如*型决策、模糊型决策、多目标决策与多属性决策、群体决策、智能决策等。 本书内容充实,重点突出,特色鲜明,适合作为高等学校管理类相关专业本科及研究生教材,同时也可供企业领导以及广大对决策科学感兴趣的读者阅读。
大数据时代的到来,使我们的生活在政治、经济、社会、文化各个领域都产生了很大改变。 数据科学 一词应运而生。如何更好地对海量数据进行分析、得出结论并做出智能决策是统计工作者面临的机遇与挑战。 本书介绍数据挖掘与统计机器学习领域常用的模型和算法,包括基础的线性回归和线性分类方法,以及模型选择和模型评价的概念和方法,进而介绍非线性的回归和分类方法(包括决策树与组合方法、支持向量机、神经网络以及在此基础上发展的深度学习方法)。后介绍无监督的学习中的聚类方法和业界广泛使用的推荐系统方法。除了方法的理论讲解之外,我们给出了每种方法的R语言实现,以及应用Python语言实现深度学习和支持向量机两种方法。本书的一个亮点是后一章给出的两个大数据案例,数据量均在10G左右。我们同时给出了单机版(Python、数据库、R
全书共分为六章:*章为绪论,介绍了大数据时代隐私内涵的构成要素以及发展变迁历史,并从技术层面、社会层面、个人层面列举了大数据环境下隐私安全的表现形式,总结了当前个人隐私被侵害的类型以及呈现的特征;第二章为隐私泄露风险评估与度量方法,针对常用的隐私保护方法,详细介绍了当前隐私量化模型与度量标准的相关研究,并分析了主流的隐私度量方法的性能优劣以及评价指标;第三章为位置服务中隐私保护技术,并介绍了P2P结构与独立架构两种模式下位置隐私保护技术方案。第四章为深度学习训练数据集隐私保护技术,提出了两种差分?
本书对数据挖掘的基本算法进行了系统介绍,每种算法不仅介绍了算法的基本原理,而且配有大量例题以及源代码,并对源代码进行了分析,这种理论和实践相结合的方式有助于读者较好地理解和掌握抽象的数据挖掘算法。全书共分11章,内容同时涵盖了数据预处理、关联规则挖掘算法、分类算法和聚类算法,具体章节包括绪论、数据预处理、关联规则挖掘、决策树分类算法、贝叶斯分类算法、人工神经网络算法、支持向量机、K means聚类算法、K 中心点聚类算法、神经网络聚类算法以及数据挖掘的发展等内容。本书可作为高等院校数据挖掘课程的教材,也可以作为从事数据挖掘工作以及其他相关工程技术工作人员的参考书。
数据仓库及联机分析处理是数据库技术发展和应用的一个新阶段,本书全面、详细地介绍了构建数据仓库以及进行多维数据分析的技术,并力求把数据仓库理论以及在该理论领域的相关应用尽可能完美地融合起来,其内容涵盖数据仓库的构建理论、构建示例、前端多维数据的展示及分析技术、对数据仓库及多维数据集的管理和维护等技术。本书以目前流行的Microsoft SQl Server 2000数据库管理系统作为实践平台,以便于读者实践。本书语言通俗易懂,实例丰富。 本书非常适合作为计算机、商科及相关专业本科学生学习数据仓库及多维数据分析技术的教材,同时也适合作为研究生数据仓库等课程的教材。
本书为普通高等教育“十一五”规划教材,是电力企业信息化系列教材之一。 本书全面深入介绍了数据仓库、联机分析处理(OLAP)和数据挖掘的基本概念、工具及实际应用。全书分成三篇,数据仓库与数据挖掘原理篇的主要内容包括数据仓库的基本概念和结构、创建过程、联机分析处理、数据挖掘的基本概念和方法等;数据仓库与数据挖掘工具篇介绍几个现在市场上主流的数据仓库和数据挖掘工具,包括ETL工具Data Stage、商务智能工具 Congos和数据挖掘工具SAS;数据仓库与数据挖掘应用篇以某电力公司为例介绍一个数据仓库应用系统的建设过程,包括系统需求分析、系统架构设计、数据模型设计、数据库规划、ETL开发等。 本书可作为计算机、信息管理与信息系统等相关专业的学生学习数据仓库、OLAP及数据挖掘技术的实用教程,也可供从事数据仓库、数据挖
本书是一本Oracle数据库管理的入门教材,适合于初中级的读者,是作者二十多年IT工作和教学实践的总结与升华。 本着“把Oracle数据从高雅的象牙塔中带出来,使它的贵族身份贫民化,为普通人提供一套能买得起,而且容易读懂的Oracle数据库实用教材”的写作理念,本书使用生动而简单的生活例子来解释复杂的计算机和数据库概念,避免用计算机的例子来解释计算机和数据库的概念。本书是自封闭的,除了的SQL知识之外,读者可以在没有任何计算机专业知识的情况下从头开始阅读此书,而且也不需要其他的参考书。为了消除读者对IT教材常有的畏惧感,书中使用的语言轻松而幽默。 本书是一本Oracle数据库管理的实用教材。虽然它覆盖了OCP(Oracle认证专家)或OCA考试的几乎全部的内容,但重点放在实际工作能力的训练。因此本书中的每章附有大量的例题,而且
《数据挖掘原理、算法及应用》以各类数据挖掘算法为核心,以智能数据分析技术的发展为主线,结合作者自身的研究和应用经验,阐述数据挖掘研究领域的主要理论和典型算法。全书共分8章:第1章为绪论;第2-5章分别介绍数据挖掘的主要技术、各类典型算法及其编程实现,包括数据预处理技术,关联规则挖掘技术、分类技术,聚类技术等几大类技术和其中包含的典型算法;第6-8章分别简要介绍一些数据挖掘的应用专题,包括时间序列数据挖掘、Weh挖掘、空间数据挖掘等。
本书是以高等院校培养应用型人才的发展目标而编写的,介绍了数据库系统原理与应用以及数据库系统开发技术。全书共分为十章,主要内容包括:数据库系统概述、关系数据库系统理论基础、SQL Server 2000的使用,数据库安全及维护、数据库系统设计、数据库访问技术介绍、使用S#和ADO.NET操作数据库、使用C#开发Windows数据库应用程序、基于C#和ASP.NET的Web数据库应用程序、数据库新技术概述。本书在讲述理论的同时与SQL Server2000有机结合,使理论与实践同步,同时介绍了使用C#和ASP.NET开发数据库应用程序的技术。 本书内容丰富、结构合理、实用性强、理论叙述严谨、庆用能力培养目标明确。读者学完本门课程后,能够具备数据库应用系统的独立开发能力。书中的开发实例均是作者的实际研发项目,具有较高的参考价值和实用价值。 本书可作为各大学、专科院校
本书是一部关于现代数据库系统的基本原理与技术的教科书,本书突出了数据库和新技术的应用及教学的需要。在编写注重原理与技能的并重,传统与内容先进性实用内容并重以及课堂教学与实验并重,学生学后能掌握数据库的基本原理,熟练掌握一个数据库产品的操作并学会开发、设计与管理数据库的能力。 本书由16章构成,内容包括基本原理、基本操作、数据库设计及应用等,突出Web数据库交换等内容。本书各章均配有丰富的习题以及复习提纲,同时本书还附有实习指南供数据实验课之用。 本书结构清晰,概念准确,文字叙述简洁明了,既便于教师课堂讲授,又便于自学者阅读。 本书可作为普通高校计算机应用类及相关专业的本科“数据库课程”教材和教学参考书,同时也可作为数据库用开发人员的参考书。
你是否有过这样的经历:在项目的后一刻突然被要求在图中修改或添加某个数据点?这时为了完成项目,你将不得不冒着降低准确性的风险,然而,在Tableau中不会发生这种情况。Tableau是一个革命性的工具包,利用它可以简单、高效地创建高质量的数据可视化图形。本书通过大量的具体案例,详细讲解了如何利用Tableau软件进行数据可视化分析,包括基本使用方法、具体操作步骤、实现原理及一些实用技巧等,为快速掌握Tableau软件提供了翔实指导。 本书共9章,第1章讲解如何连接不同数据源,包括文本、Excel、Access数据库文件及服务器上的数据;第2~5章循序渐进讲解各种图形的创建方法,包括单变量图、双变量图、多变量图和地图;第7~8章详细讲解了如何自定义图中各个元素以及如何将做好的可视化图形打包分享;第6章和第9章主要介绍Tableau的高级功能,包括自