面对“人们被数据淹没,却饥渴于知识”的挑战,数据挖掘和知识发现技术应运而生,并得以蓬勃发展。数据挖掘涉及到人工智能、模式识别、机器学习、统计学等领域,因此,我们把体现当代科学技术发展特征的多学科间的知识交叉及成果反映到教材中来,同时本书从智能信息处理及数据挖掘两大主题出发,着重于介绍将智能信息处理中的技术如何应用于数据挖掘领域,如智能搜索、分类、聚类和智能决策等。本书在介绍智能信息处理理论、方法、技术的基础上,全面系统地介绍了数据挖掘的概念、相关技术的原理及应用。全书共分9章。章主要从整体上介绍数据挖掘和知识发现的基本概念、研究现状及发展方向;第二章介绍了数据挖掘的理论基础;第三章详细论述了用于数据挖掘的计算智能方法的理论基础;第四章论述了神经网络和进化计算的分类方法;第五章
当代商业和科学领域大量激增的数据量要求我们采用更加复杂和精细的工具来进行数据分析、处理和挖掘。尽管近年来数据挖掘技术取得的长足进展使得我们广泛收集数据越来越容易,但技术的发展依然难以匹配爆炸性的数据增长以及随之而来的大量数据处理需求,因此我们比以往更加迫切地需要新技术和自动化工具来帮助我们将这些数据转换为有用的信息和知识。本书前版曾被KDnuggets的读者评选为欢迎的数据挖掘专著,是一本可读性的。它从数据库角度全面系统地介绍数据挖掘的概念、方法和技术以及技术研究进展,并重点关注近年来该领域重要和的课题数据仓库和数据立方体技术,流数据挖掘,社会化网络挖掘,空间、多媒体和其他复杂数据挖掘。每章都针对关键专题有单独的指导,提供算法,并对怎样将技术运用到实际工作中给出了经过实践检验的实用型规
本书以国际数据挖掘标准流程(GRISP-DM)为依据,以企业管理面临的现实问题为应用案例,由浅入深介绍数据挖掘方法及其解决问题过程的数据理解、数据处理、数据分析、数学建模、模型结果评估等内容,并引人应用广泛的数据挖掘Clementine软件辅助问题案例的解决,使读者不仅可以集中地学习数据挖据的主要理论方法,而且可以了解基于数据挖掘的数学建模过程,可以学习应用软件辅助解决问题的操作方法。本书把理论、案例、建模、软件辅助结合一体统一叙述,简述理论,突出应用,详细分析,展示过程,既考虑高校学生的学习需要,分本科生与研究生学习层次,又考虑企业管理者的应用与实践需要。本书可作为数据挖掘理论与技术的教学、实践、应用和提高的教科书或参考书。适合高等学校本科高年级学生、研究生以及学习数据挖掘、数学模型课程的学生使
大数据分布式计算课程是大数据方向应用统计专业硕士学生的专业必修课,通过本课程的学习使学生能够掌握目前大数据挖掘领域常用的并行计算方法,加深学生对统计并行计算的理解,培养学生使用在现代并行架构下利用统计方法深入挖掘大数据中的数据结构并能解决一些实际问题的能力。
本书通过详细的示例、样本数据集、代码和图形教程,说明了如何:1为每个问题使用合适类型的图2快速、高效且正确地收集、清洗和组织数据3为高可读性设置可视化格式,而不损失性4掌握允许更深入地探索和解释数据的工具5使用少量轻量级编程创建自定义可视化6选择有效的图分析技术来从数据中提取出最多信息7使用高级的可视化技术,包括动态图、大数据工具和查询。
本书详细介绍数据库的分析、设计、实现方法和过程。本书不仅涵盖普通数据库书籍中所没有讲到的数据库分析、设计和执行过程,还通过贯穿全书的实例描述数据库的创建、监控和调整的全过程。主要内容包括数据库的相关知识,数据库分析和设计技术、逻辑数据库设计方法学、物理数据库设计方法学等内容。另外,本书还增加了SQL和QBE、数据库管理和安全性以及数据库的现状和趋势等内容,使内容更为全面。本书既适合作为高等院校数据库课程的教材,也适合相关技术人员作为数据库分析、设计和开发的参考。