本书分为部分,分别为大数据基础理论分析、基于海量语意规则的大数据流处理技术及大数据应用。 部分介绍大数据领域的主要基础理论,包括大数据基本概念、可编程数据中心、云文件系统、云数据库系统、大数据并行编程与分析模型、大数据智能计算算法、基于大数据的数据仓库技术、大数据安全与隐私保护,以及基于大数据的语意软件工程方法等。 第二部分介绍基于海量语意规则的大数据流处理技术,包括基于规则的大数据流处理介绍、语意规则描述模型、海量语意规则网及优化、海量语意规则处理算法及海量语意规则并行处理等。 第三部分主要介绍大数据的一些典型应用,包括:文化大数据、医疗健康大数据、互联网金融大数据、教育大数据、电子商务大数据、互联网大数据、能源大数据、交通大数据、宏观经济大数据、进出口食品安全监管大数据、基
本书是《实用数据结构基础(第四版)》(陈元春、王中华、张亮、王勇编著,中国铁道出版社出版) 的配套学习指导书。全书内容分为5部分:教学内容指导(包括对主教材第1~10章的知识点分析、典型 习题分析和各章习题解答);自主设计实验指导(对10个自主设计实验的设计思想、算法分析进行了详细 指导);模拟试卷;模拟试卷参考答案;数据结构课程设计报告样例。 本书对数据结构的概念和原理的阐述通俗易懂,例子翔实;习题难易适中,题型丰富;对数据结构 基本运算的分析注重实现的过程。本书以C/C++语言作为算法的描述语言,对于书中的实验和一些重要 的算法均给出了完整的C/C++语言源程序,并全部在Visual C++ 6.0环境下运行通过。 本书适合作为普通高等院校计算机类专业数据结构课程的教学辅导书,也可作为成
本书根据高等院校培养综合型交叉学科本科人才的发展目标编写,介绍空间数据分析的原理与方法。全书共分17章,主要内容包括绪论、空间数据的性质、空间数据的完备化、空间数据的标准化、探索性空间数据分析、空间点模式分析、地统计数据插值、格数据统计、格数据回归分析、空间回归分析、面状数据空间模式分析、空间连续数据分析方法、非参数统计、空间抽样方法、空间度量算法、空间分析算法和空间统计分析算法。 本书可作为地理信息系统、计算机科学与技术、遥感科学与技术、测绘工程、地理科学等相关专业学生的教科书,同时也适合于从事空间数据分析、地理信息系统应用的人员参考。
本书以大数据为研究背景,系统分析了传统数据技术当前存在的问题以及面临的挑战,并对比了当前主流的面向大数据的数据库解决方案,在此基础上阐述了笔者的研究工作:基于MapReduce平台高处处理大数据的OLAP研究。书中反应了当前大规模数据仓库研究的热点和成果,值得大数据研究的人员参考和应用。
科技的进步,特别是信息产业的发展,把整个社会带入一个崭新的信息时代。随着计算机应用的普及和数据库技术的不断发展,数据仓库与数据挖掘技术的应用领域越来越广泛。 《数据仓库与数据挖掘》第1章介绍数据仓库、数据挖掘的一般知识和应用领域。第2~8章介绍数据仓库和数据挖掘的理论和技术,其中第2、3章侧重数据仓库,重点阐述了数据仓库的架构、olap等内容,第4~8章侧重数据挖掘,重点阐述了关联规则、粗糙集、决策树、聚类分析和兴趣度量等内容。第9章给出了数据仓库与数据挖掘方面的应用案例。 《数据仓库与数据挖掘》是为软件工程硕士量身定做的教材,也可作为计算机专业、信息类专业、管理类专业相关课程的教材和教学参考书。
本书详细阐述了数据仓库与数据挖掘的基本原理,系统而全面地介绍了数据仓库与数据挖掘的概念、作用、算法和应用举例,并且给出了信息分析所涉及到的若干问题及框架。本书介绍了*的信息分析技术研究成果,如小波分析、Rough分析、蚁群分析、分形技术、Agent、数据挖掘的进化算法、聚类分析、非结构数据的挖掘、离群数据挖掘,但并未详细描述,而将介绍重点放在其应用上,起到抛砖引玉的作用。 本书既可以作为信息管理与信息系统、计算机应用、经济管理等专业的高年级本科生和研究生的教材,又可以作为有关在经济管理领域中应用信息分析技术提高决策人员的参考。
本书以面向应用、面向实战为指导思想,紧扣企业技术人才培养的特点,在知识点讲解和实验中避免复杂的理论,使读者能快速上手体验、验证大数据处理的魅力,以激发读者的学习兴趣。 本书覆盖了大数据生命周期中的主要技术要点,全书共8章,第1章介绍大数据的产生和特点及思维的变革,第2章了解大数据生态系统,第3~7章按照大数据的生命周期,分别讨论大数据采集与预处理、大数据管理、大数据分析、大数据可视化、大数据应用的基本原理和方法,第8章讨论大数据安全面临的挑战。 本书可作为本科、高职院校大数据技术或数据科学课程的参考书或教材,也可供数据科学相关技术人员阅读。
本书针对计算机、信息管理和其他相关专业学生的发展需求,系统、全面地介绍了大数据技术与应用的基本知识和技能,详细介绍了大数据基础、大数据的行业应用、大数据的基础设施、大数据技术基础、Hadoop分布式架构、大数据管理、大数据分析、人工智能与机器学习、数据科学与数据科学家、开放数据的时代,以及大数据发展与展望等内容,具有较强的系统性、可读性和实用性。本书是为高等院校 大数据 相关课程全新设计编写、具有丰富实践特色的主教材,也可供有一定实践经验的软件开发人员和管理人员参考,或作为继续教育的教材。 本书配套授课电子课件,需要的教师可登录www.cmpedu.com免费注册、审核通过后下载,或联系编辑索取(微信:15910938545,QQ:2850823885,email:2308140194@qq.com,电话:010-88379739)另外,为方便任课教师进行交流,提供本科计算机
本教程中预备知识,介绍项目中实验环境、程序组织方式和管理方法,讲解程序及算法的效率估算方法和分析技巧,描述一般测试技术和调试方法,以及测试数据与测试用例的设计安排技巧;基础实验,首先安排重要的验证性实验,然后设计基于基本数据结构的简单应用实验;综合实验(即课程设计),介绍在一个项目中选择和使用多种基本数据结构的依据和方法,讲解如何有效地将它们融合在一起解决实际的复杂应用问题。 本教程在内容选取及编排顺序上,与严蔚敏老师编著的《数据结构(C 语言版)》(978-7-302-14751-0,清华大学出版社出版)保持一致,可作为高等院校计算机及相关专业数据结构课程的实验教材。
本书在介绍大数据发展背景、特点及主要技术层面的基础上,对大数据的数据采集、数据存储、常见计算模式和典型系统工具进行了分析介绍。本书同时对各种典型系统工具进行了讲解,包括大数据查询分析计算及典型工具(HBase、Hive)、批处理计算及典型工具(MapReduce、Spark)、流式计算及典型工具(Storm、Apex、Flink)、事件流及典型工具(Druid)等。本书提供了大量的实例和源代码供读者参考,指导读者快速、无障碍地了解和掌握常见大数据分析工具的使用。本书适合作为计算机及相关专业的教学用书,也可以作为大数据初学者的自学教材和参考手册。
《数据仓库与数据挖掘技术》主要介绍数据仓库和数据挖掘技术的基本概念、相关技术和应用案例及方法。全书共分为9章,主要内容包括:数据仓库与数据挖掘的概念和体系结构、数据仓库开发模型、etl技术、olap技术、商务智能系统、数据预处理技术、数据挖掘技术、数据仓库开发实例、报表设计等内容。本书各章节的案例均使用microsoftsql server2005进行操作实践讲解。通过对具体实例的学习和实践,使读者掌握数据仓库和数据挖掘中必要的知识点,达到学以致用的目的。 《数据仓库与数据挖掘技术》适合作为高等院校本科学生的教材,也可供企业信息化管理人员、技术人员以及软件开发人员阅读参考。
本书按照简明、易读、突出实用的原则编写,书中所选案例均来自企业PDM项目实际,并在Siemens PLM Software Teamcenter 10平台上加以实现,同时由编者反复论证,全书图文并茂,并配以详尽准确的讲解步骤,使读者能够快速理解并掌握本书案例中所阐述的PDM实施方法和技巧。另外,本书每章都附有相应的练习题,供读者进行练习。读者通过学习本书,可以由浅入深、循序渐进地理解PDM的基本知识和原理,掌握企业PDM实施技能,逐步具有借助PDM平台提高企业研发核心能力,提升产品质量的工程素养。
本书以SQL Server分析服务为环境介绍数据仓库和数据挖掘应用技术,包括数据仓库和数据挖掘概述、OLAP和多维数据模型、数据仓库设计和SQL Server数据仓库开发实例、关联分析算法、决策树分类算法、贝叶斯分类算法、神经网络算法、回归分析算法、时间序列分析和聚类算法。本书内容翔实,循序渐进地介绍各个知识点,并提供全面而丰富的教学资源,可作为各类高等院校计算机及相关专业 数据仓库和数据挖掘应用技术 和 SQL Server高级应用 课程的教学用书,也适合计算机应用人员和计算机爱好者参考。
本书全面深入地介绍了数据仓库、联机分析处理和数据挖掘的基本概念、基本方法和应用技术。全书分成三篇:数据仓库与OLAP篇的主要内容包括:数据仓库的基本概念、体系结构、模型设计、开发方法、ETL、元数据和数据集市,OLAP的基本概念、基本操作、数据模型和OLAP的实现及准则;数据挖掘与空间数据挖掘篇的主要内容包括关联分析方法、聚类分析技术、分类与预测方法、异常检测算法以及空间数据挖掘技术等;工具与实例篇介绍了数据挖掘工具及可视化、Cognos公司的BI主要产品和企业数据仓库系统构建。 本书可作为高等院校计算机软件与应用、信息科学等专业的学生学习数据仓库、OLAP及数据挖掘技术的实用教程或参考书,也可供从事数据仓库、数据挖掘研究、设计、开发等工作的科研、工程人员参考。
随着信息技术特别是网络技术的飞速发展,人们收集、存贮、传输数据的能力不断提高。数据出现了爆炸性增长,与此形成鲜明对比的是:对决策有价值的知识却非常匮乏。知识发现与数据挖掘技术正是在这一背景下诞生的一门新学科。数据挖掘要在实际应用中发挥作用,高性能挖掘算法和数据挖掘软件平台是重要的技术基础。本书以数据挖掘基本问题、频繁模式与关联规则挖掘为切入点,研究高时间效率、高空间可伸缩性的挖掘算法和分布,异质、海量数据的协同挖掘软件模型,并探讨了数据挖掘过程中的隐私保护问题。 本书首先发现了基于树表示形式的虚拟投影方法,用于按深度优先挖掘密集型数据集;提出了稀疏型数据集表示形式及非过滤投影方法;进_步提出了基于伺机投影的思想,设计并实现了基于伺机投影的全新算法OpportuneProject,对比实验表明,该
商业智能是将企事业单位积累的数据转化为知识,帮助企事业单位做出科学决策的工具。蔡颖、鲍立威编著的《商业智能原理与应用》以“商业智能”应用为主线,全面系统地介绍了商业智能的基本概念、方法和技术,克服了以“数据挖掘” 技术为丰线的局限性,并以MS SQLServer作为数据仓库管理平台,以SQL Server Business Intelligence DeveloprnentVisualStudio作为商业智能开发平台,进行了丰富的案例演示。《商业智能原理与应用》可作为高等院校高年级本科生教材,也可作为MBA教材以及盯相关专业人员、市场营销人员、管理决策支持等实际经济管理领域实务工作者的参考用书。
本书是中国人民大学出版社出版的教材《统计数据分析基础教程(第二版)——基于SPSS 20和Excel 2010的调查数据分析》的配套辅导书。 由于本次修订对教材内容进行了更加适当的筛选,同时对例题和上机实验题进行了大幅更新,于是本同步配套辅导书也做了相应的修订。 本书以习题和上机实验指导的方式给出了教材中“思考题与上机实验题”的解答,以便帮助读者消化教材内容。本书包含10章的上机实验指导共32个。包括:*抽样、调查问卷制作、问卷数据的录入与清理、单选题的一维频率分析、两个单选题的交叉表分析、多选题的一维频率分析和交叉表分析、描述统计分析、假设检验、单因素方差分析、线性相关分 析与线性回归分析等。 本书可作为各级各类高等院校本科生统计数据分析的入门书,也可以作为MBA学生、研究生以及从事统计数据分析工作的人士
本书着力于介绍数据挖掘基础知识、基本原理、常用算法,主要内容包括数据挖掘概述、数据的描述与可视化、数据的采集和预处理、数据的归约、关联规则挖掘、分类与预测、 非线性预测模型、聚类分析、深度学习简介、使用 Weka 进行数据挖掘。本书通俗易懂,注重基础知识、基本原理和基本方法,注重启发和引申,以培养学生独立思考和独立发现的能力。本书适合作为数据科学与大数据、信息管理、统计等专业的本科层次基础课教材,也可作为相关专业研究生层次的参考用书。
为数据挖掘入门级教材,共分8章,主要内容分为三个专题:技术、数据和评估。技术专题包括决策树技术、K-means算法、关联分析技术、神经网络技术、回归分析技术、贝叶斯分析、凝聚聚类、概念分层聚类、混合模型聚类技术的EM算法、时间序列分析和基于Web的数据挖掘等常用的机器学习方法和统计技术。数据专题包括数据库中的知识发现处理模型和数据仓库及OLAP技术。评估专题包括利用检验集分类正确率和混淆矩阵,并结合检验集置信区间评估有指导学习模型,使用无指导聚类技术评估有指导模型,利用Lift和假设检验比较两个有指导学习模型,使用MS Excel 2010和经典的假设检验模型评估属性,使用簇质量度量方法和有指导学习技术评估无指导聚类模型。本书秉承教材风格,强调广度讲解。注重成熟模型和开源工具的使用,以提高学习者的应用能力为目标;