本书内容简介:数据挖掘和文本挖掘是当前信息技术中的一个重要研究领域;将遗传算法和社会演化算法应用于数据及文本挖掘方法研究,具有较大的理论意义和实用价值本书研究了基于遗传算法和社会演化算法的数据挖掘和文本挖掘方法,主要包括数据挖掘和文本挖掘中的属性约简问题、聚类问题,并将其应用于产品研发决策中所做主要工作包括:提出一种基于遗传算法和k-medoids算法的新的聚类方法;采用遗传算法和模式聚合进行文本特征降维;采用遗传算法和潜在语义索引进行文本特征降维;采用社会演化算法进行聚类;采用混沌社会演化算法进行聚类;采用改进的遗传算法和社会演化算法进行文本聚类研究;将文本挖掘应用到产品研发决策中,构建产品研发文本知识地图,以期提高产品研发的效率和质量。
进入大数据时代,让数据开口说话将成为司空见惯的事情,本书将从大数据时代的前因后果讲起,全面分析大数据时代的特征、企业实践的案例、大数据的发展方向、未来的机遇和挑战等内容,展现一个客观立体、自由开放的大数据时代。
本书以大数据为研究背景,系统分析了传统数据技术当前存在的问题以及面临的挑战,并对比了当前主流的面向大数据的数据库解决方案,在此基础上阐述了笔者的研究工作:基于MapReduce平台高处处理大数据的OLAP研究。书中反应了当前大规模数据仓库研究的热点和成果,值得大数据研究的人员参考和应用。
笔者认为数据挖掘的出现,正是统计学适应这一变化的新的发展方向,数据挖掘并不是为了替代传统的统计分析技术,而是统计分析方法的延伸和扩展。本书从统计学视角研究数据挖掘,以期从统计学角度对数据挖掘理论的研究有所突破和创新,同时对统计学理论在数据挖掘方向的发展做出探索。
随着信息技术特别是网络技术的飞速发展,人们收集、存贮、传输数据的能力不断提高。数据出现了爆炸性增长,与此形成鲜明对比的是:对决策有价值的知识却非常匮乏。知识发现与数据挖掘技术正是在这一背景下诞生的一门新学科。数据挖掘要在实际应用中发挥作用,高性能挖掘算法和数据挖掘软件平台是重要的技术基础。本书以数据挖掘基本问题、频繁模式与关联规则挖掘为切入点,研究高时间效率、高空间可伸缩性的挖掘算法和分布,异质、海量数据的协同挖掘软件模型,并探讨了数据挖掘过程中的隐私保护问题。 本书首先发现了基于树表示形式的虚拟投影方法,用于按深度优先挖掘密集型数据集;提出了稀疏型数据集表示形式及非过滤投影方法;进_步提出了基于伺机投影的思想,设计并实现了基于伺机投影的全新算法OpportuneProject,对比实验表明,该
随着网络与计算机的发展,可利用的数据量日益增大,数据的形式更多样化,这对数据挖掘算法的研究和数据挖掘与领域知识、技术的融合都提出了新的挑战。李英杰编写的《数据挖掘算法及在视频分析中的应用》在分析数据挖掘相关概念和相关技术研究现状基础上,阐述了围绕数据挖掘中的分类、特异数据挖掘、关联规则等任务中经典算法的改进研究。 继而阐述了数据挖掘算法在计算机视觉领域应用的研究工作。每部分研究工作均详细描写了背景、问题、研究思路、实验结果、结论与总结等。各部分工作相关,又独成体系,可读性好。 《数据挖掘算法及在视频分析中的应用》可作为高等学校数据分析类课程的补充资料,也可供相关方向的研究生及专业科技工作者参考。
王海晏、魏贤智所*的《激光数据链路》介绍将 激光数据链路应用到战斗机协同空战中的各种问题, 内容主要涉及构建机载激光数据链路及其相关问题的 解决办法,同时对激光数据链路在协同攻击中的应用 进行了理论研究和描述。 本书主要内容包括机载激光数据链路系统及使用 的技术、自用空间数据传输的坐标解算、激光链路建 立的关键技术、利用机载红外搜索跟踪系统及激光数 据链路被动定位、基于激光数据链路的协同静默攻击 等。这些问题的研究和讨论将丰富空战平台之间的信 息传输方式,增强协同空战信息共享能力。 本书可以作为相关专业高年级学生、研究生的补 充阅读材料,也可作为工程技术人员的参考资料。
商业智能利用已有的数据资源进行各种有效的业务决策。因此该领域不仅是数据管理、信息处理活跃的研究领域之一,而且在各行各业中得到了广泛的应用。本书共分12章,全面介绍了商业智能系统的设计、部署、数据处理及系统管理等相关知识,包括数据仓库的架构和模型设计、数据仓库的构建、数据仓库项目的开发和实施、数据仓库的应用、在线分析技术、数据挖掘技术、智能挖掘器、知识管理、数据仓库的运行和管理,以及OLAP服务器的运行和管理等技术内容。此外,本书对商业智能系统所涉及的主流产品技术进行了深入浅出的介绍。通过本书的学习,读者可对商业智能的整体结构、技术和产品等有深入的了解和认识。
本书主要介绍如何应用SAS软件系统进行数据分析。全书内容分为两部分,部分介绍SAS系统的一些基本操作、数据库管理、统计报表输出、绘制各种统计图形和简单编程。第二部分结合具体数据实例,介绍数据分析中常用的几种统计分析方法:回归分析、主成分分析、因子分析、典型相关分析、判别分析、聚类分析和时间序列分析。? 本书主要是面向电子商务专业的本科生,也可作为MBA、研究生的教材,同时也可作为经济类各专业学生学习数据处理课程的参考书。
数据采集和存储技术的进步导致了数据规模的日益增加,数据是一种宝贵的信息资源,但这种资源同矿藏一样,只有通过管理、分析、挖掘、提炼等操作,才能使潜在的资源变成可用的财富。 本书系统地介绍了数据挖掘技术的产生、发展、应用及相关原理和算法,其主要内容包括:数据挖掘基本知识、数据挖掘处理流程、数据仓库和联机分析处理、关联规则发现方法、序列模式挖掘方法、决策树分类方法、贝叶斯分类法、各种聚类方法、Web挖掘以及分类方法在医学图像中的应用。本书包含了作者多年来在数据挖掘中的研究成果。 本书可作为计算机专业、自动化专业、生物医学专业等高年级本科生与研究生课程的教材,也可作为需要了解数据挖掘有关方法与技术的研究、设计和开发人员的参考书。
本书是数据库的实验教材,从测试DBMS边界的角度出发,通过案例现象引导读者主动思考现象的成因,对SQL的基本知识,数据库系统的完整性控制、安全性控制、并发控制、数据备份与恢复、性能检测、索引进行实验内容组织。每个实验还有习题及其参考答案。 通过本书附录可了解数据库的逻辑结构,搭建实验环境,并将数据库结构和数据直接导入到计算机中,相关数据和资料可在清华大学出版社网站下载。
本书系统地介绍了各种常用的数据结构,内容丰富,概念讲解清楚,叙述严谨流畅,逻辑性强。书中配有大量图表、丰富的例题和习题,对给出的每一种算法,均先描述了它的基本思路和要点,使得算法清晰易读,便于学生理解和掌握。本书有配套出版的《数据结构上机实验与习题解析》,既便于教学,又便于自学。 本书共分9章,主要包括绪论、线性表、栈和队列、串、多维数组和广义表、树和二叉树、图、查找、排序等内容。 本书可作为本科和高职高专院校计算机类专业或信息类专业的教材,也可供广大从事计算机工程与应用的科技工作者参考。
本书是作者积多年讲授“数据结构”课程及指导学生实验的教学经验编写而成的,与清华大学出版社出版的《数据结构(C++版)》教材相配套,主要内容由3个模块组成:个模块是本章导学,包括知识结构图、学习要点、本章重点、本章难点、重点整理和重点难点释疑6个子模块;第二个模块是习题解析,包括课后习题讲解和学习自测两个子模块;第三个模块是实验指导,包括验证实验、设计实验和综合实验3个子模块。后在附录中给出了实验报告和课程设计报告的一般格式。 本书可以配合《数据结构(C++版)》教材使用,起到衔接课堂教学和指导实验教学的作用,可作为高等院校本专科学生学习“数据结构”课程的参考教材,也可作为研究生入学考试的辅导教材,对于从事计算机软件开发和应用的工程技术人员也具有一定的参考价值。
本书从高维数据的特性出发,指出了高维数据给数据挖掘带来的影响以及高维数据挖掘的研究方向。对高维数据挖掘中的相似性搜索、高维数据聚类、高维数据异常检测、高维数据频繁模式发现及电子商务中的协同过滤技术进行了研究,提出了相关的解决方案和相应算法。 本书适用于从事数据挖掘和商业智能研究的高校教师、研究生、科研院所的科研人员以及从事商业智能项目开发的工程技术人员。
本书不仅系统介绍各种传统的数据结构以及搜索和内、外排序算法,还引入了一些新数据结构,如伸展树和跳表。本书在重视理论的同时,强调应用性和实践性,对上机实习赋予足够重视。每章包括程序设计题,并将实习指导和实习题作为专门的章节编写。 全书条理清晰,内容详实。书中算法都有完整的C++程序。程序结构清晰,构思精巧。所有程序都已在VC++环境下编译通过并能正确运行。本书深入浅出,配有大量的实例和图示,并有丰富的习题和实习题,适于自学。 本书可作为电气信息类、电子信息科学类以及计算机、管理信息系统、电子商务,教育技术等其他相关专业学生数据结构课程的教材,并可供其他计算机应用工程技术人员参考。
这本《数据挖掘--方法与应用》主要根据作者徐华近几年在清华大学面向研究生和本科生开设的“ 数据挖掘:方法与应用”课程的教学实践与积累,参考近几年国外著名大学相关课程的教学体系,系统地介绍数据挖掘的基本概念和基本原理方法;结合一些典型的应用实例展示用数据挖掘的思维方法求解问题的一般性模式与思路。 本书可作为有一定数据结构、数据库和程序设计基础的研究生或本科生开展数据挖掘知识学习和研究的入门性教材与参考读物。
数据结构是计算机及相关专业的核心课程,是计算机程序设计的基础,是程序员和许多高校研究生入学考试的必考科目。 本书共分10章,第1章是数据结构的概述;后9章分别介绍了线性表、栈、队列、串、数组、广义表、树、二叉树、图、查找、内部排序、外部排序、动态存储管理和文件等基本类型的数据结构。本书中的算法都已通过调试,不用修改就能运行。 本书可作为计算机和相关专业的教材,也可作为自学者或各种计算机培训班的教材。
本书由数据库设计原理和应用两部分组成。原理部分简明扼要地介绍了关系数据库设计实用的基本理论,包括数据模型、关系和关系设计完整性,并结合实例描述分析、设计数据库的过程;应用部分通过 PowerBuilder 数据库开发工具详细描述数据库系统的开发过程,具体介绍PowerBuilder 10.0开发环境的组成、Power Script语言、事件,对窗口、数据窗口、菜单等PowerBuilder对象的设计方法是结合“餐饮管理系统”进行说明的,在习题中留有一定的功能扩展空间。每章均附有习题,便于读者练习。 本书可作为高等专科学校、高等职业学校、中等职业学校、成人高校及本科院校举办的二级职业技术学院和民办高校的教材,也可供各类从事数据库系统开发的人员参考。
数据挖掘将数据转化为知识,是数据管理、信息处理领域研究、开发和应用的活跃的分支之一。本书全面地论述了数据挖掘领域的基本概念、基本原理和基本方法,内容包括数据挖掘领域的经典理论和前沿发展。全书共分14章,并含有1个附录。全面系统地介绍了数据挖掘的概念和过程、数据预处理技术;深入地叙述了各种数据挖掘技术,包括关联规则、决策树、聚类、基于样例的学习、贝叶斯学习、粗糙集、神经网络、遗传算法、统计分析;并讨论了数据挖掘的典型应用,如分类、文本和Web挖掘,以及数据挖掘的应用和发展趋势;并在第14章中给出了一个具体的商业智能解决方案实例。 通过本书的学习,读者可以对数据挖掘的整体结构、概念、原理、技术和发展有深入的了解和认识。 本书既可以作为相关专业的高年级本科生和研究生教材,也可作为数据挖掘领
本书是与《数据结构(C语言版)》(赵坚、姜梅主编)一书相配套的辅助教材。全书分为三大部分:部分是学习指导与实训,首先给出主教材中每一章的学习指南与内容提要,然后设置了若干综合实验,通过和章的实验体现实训特色,培养学生解决实际问题的能力;第二部分是主教材中习题的参考解答;第三部分设置了4套模拟试题及其参考解答,目的是检验和巩固所学的理论知识。 本书既可与《数据结构(C语言版)》一书配套使用,也可作为C语言描述的实训教材单独使用,还可供计算机自学人员学习参考。
数据仓库与数据挖掘是与计算机、信息类等相关专业的核心课程。张兴会等编著的《数据仓库与数据挖掘工程实例》采用提出问题、分析问题、解决问题的思路,通过工程实例介绍了SQL Server 2005和 Weka软件的使用方法以及联机分析处理技术、关联规则方法、决策树方法、贝叶斯方法、人工神经网络方法、聚类分析方法、线性回归方法等数据仓库与数据挖掘技术。 本书结构严谨,条理清晰,语言浅显易懂,循序渐进地表达了知识内容;坚持理论与实际相结合,知识理论与具体实现方法相结合,使技术实现具体化、生动化、可操作化;工程实例的实现过程建立在 SQLServer2005和Weka软件的基础上,以帮助读者在学习后达到学以致用的效果。本书可以和《数据仓库与数据挖掘技术》教材配合使用,旨在帮助读者在学习数据仓库与数据挖掘理论知识的基础上,通过学习工