本书系统讲授数据挖掘的原理、主要方法及其Python实现,共分三部分:第一部分包含第1~2章,介绍数据挖掘的基本概念、流程和数据预处理;第二部分包含第3~11章,介绍经典的分类算法(包括朴素贝叶斯分类器、决策树、k-近邻、支持向量机等)、经典的聚类分析、关联分析、人工神经网络和Web挖掘等方法;第三部包含第12~14章,共有3个综合案例,包括泰坦尼克号生存数据分析、心脏病预测分析和旅游评论倾向性分析。
本书的主要内容包括网络数据的定义及相关指标、大规模网络中的链路预测、网络聚类分析、网络数据中的空间自回归模型、大规模网络数据中的模型估计方法、网络数据中的空间自回归模型的拓展及应用、网络中的空间自回归模型的其他研究方向等。本书关注大规模网络数据分析中的模型方法。除模型方法本身的理论拓展之外,在估计方法等方面会涉及大规模数据中的快速计算方法。由于网络分析本身的范围非常广泛,故本书涉及的内容仅局限于作者及团队研究工作中使用到的一部分。在本书的后,为了启发读者思路,对于部分已有网络研究进行了梳理。
本书是《实用数据结构基础(第四版)》(陈元春、王中华、张亮、王勇编著,中国铁道出版社出版) 的配套学习指导书。全书内容分为5部分:教学内容指导(包括对主教材第1~10章的知识点分析、典型 习题分析和各章习题解答);自主设计实验指导(对10个自主设计实验的设计思想、算法分析进行了详细 指导);模拟试卷;模拟试卷参考答案;数据结构课程设计报告样例。 本书对数据结构的概念和原理的阐述通俗易懂,例子翔实;习题难易适中,题型丰富;对数据结构 基本运算的分析注重实现的过程。本书以C/C++语言作为算法的描述语言,对于书中的实验和一些重要 的算法均给出了完整的C/C++语言源程序,并全部在Visual C++ 6.0环境下运行通过。 本书适合作为普通高等院校计算机类专业数据结构课程的教学辅导书,也可作为成
本书紧扣“大数据”这一时代主题,着眼于侦查领域大数据运用在法律研究方面的空白,构建起包括思维、模式、方法等全方位的大数据侦查体系,同时对大数据侦查可能产生的法律问题进行探讨,为侦查实务中大数据的运用提供方法、法律理论及程序上的指导。
本书是根据全国高等教育自学考试指导委员会制定的《数据库及其应用自学考试大纲》,为参加高等教育自学考试的考生编写的教材。深入浅出地阐述数据库系统的基本概念、基本理论和操作技术。本书共有8章,第一~三章阐述数据库的基本概念、基本理论和基本方法,包括数据库系统概论、关系模型、数据库设计;第四、五章以MySQL为实验平台,介绍SQL和数据库编程技术;第六~八章介绍数据库管理技术,包括事务与事务处理、备份与恢复、安全性管理。 本书的目的是使考生掌握数据库系统的基本概念、基本理论和基本操作技术,为今后从事数据库管理和数据库应用系统的开发工作奠定理论基础与掌握实际操作的技能。本书适合作为高等教育自学考试的教材,也可以作为高等学校计算机、信息等专业本科、专科学生的教科书。
《数据仓库与数据挖掘技术》主要介绍数据仓库和数据挖掘技术的基本概念、相关技术和应用案例及方法。全书共分为9章,主要内容包括:数据仓库与数据挖掘的概念和体系结构、数据仓库开发模型、etl技术、olap技术、商务智能系统、数据预处理技术、数据挖掘技术、数据仓库开发实例、报表设计等内容。本书各章节的案例均使用microsoftsql server2005进行操作实践讲解。通过对具体实例的学习和实践,使读者掌握数据仓库和数据挖掘中必要的知识点,达到学以致用的目的。 《数据仓库与数据挖掘技术》适合作为高等院校本科学生的教材,也可供企业信息化管理人员、技术人员以及软件开发人员阅读参考。
本书是从大数据和云计算相结合的视角,系统地介绍大数据云架构技术与实践的专业图书,全书分为五篇19章,分别介绍大数据云计算的概论、关键技术、体系架构、云架构实践与编程和安全。本书层次清晰,结构合理,主要内容包括大数据云计算关系、大数据应用价值、分布式计算、NoSQL数据库、机器学习、虚拟化、Docker容器、Web 2.0、绿色数据中心、基础设计即服务(IaaS)、平台即服务(PaaS)、软件即服务(SaaS)、容器即服务(CaaS)、大数据云架构搭建、Spark大数据编程、大数据和云计算面临的安全威胁、保障大数据安全、应用大数据保障安全等。本书可作为高年级本科生和研究生教材,也可作为广大科学技术人员和计算机爱好者的参考书。
掌握数据可视化技术是未来工作和学习的能力,是展示理念和成果的重要手段。阅读并完成本书的实践,你将快速地学会数据获取、清洗、分析、可视化及发布的完整流程。本书以丰富的实践案例解析数据可视化的制作理念和具体方法,紧密围绕当前数据可视化领域的实际需求,全面介绍数据可视化的概念和技巧。本书包含基础知识、数据获取、数据清洗、数据分析、可视化基础和原则、数据可视化工具和可视化作品发布等内容,基于具体案例多角度启发和引导读者的创新思维,增强读者对抽象数据的把握及综合可视化能力的提升。本书内容通俗易懂,简明实用,配套的教学辅助资料可免费下载。本书适合零编程基础的数据可视化从业者和高校师生阅读,有一定工作经验的数据可视化工程师也可以从本书中学到大量实用的技能。
本书以数据挖掘为应用载体,按应用频率的高低,系统地介绍分治算法、贪心算法、搜索算法和动态规划算法。同时,介绍算法分析所用的渐近符号及常用的分析方法,包括递归分析方法、非递归分析方法。本书的特点是结合作者及其团队研究的数据挖掘问题,注重介绍算法的基本思想及算法应用的启发性。
程朝斌、张水波编著的《MySQL数据库管理与开发实践教程》讲述MySQL数据库的开发技术。全书共分为16章,内容包括MySQL发展历史,与其他数据库的区别,MySQL常用的一些工具,MySQL文件结构、系统架构、存储引擎、数据类型,数据库和表的创建、管理和删除,数据完整性约束,包括主键约束、外键约束、非空约束、默认值约束、 约束和自增约束等,数据的单表查询和多表查询,视图和索引,变量、常量、运算符和表达式、运算符的优先级、流程控制语句、自定义函数,系统函数,存储过程和触发器,事务管理,性能优化,日志文件管理、权限管理以及数据的备份和还原。 一章通过一个综合案例实现网上购物系统的数据库。 本书可作为在校大学生学习使用MySQL的教学资料,也可以作为非计算机专业学生学习MySQL的参考书。
本书针对计算机、信息管理和其他相关专业学生的发展需求,系统、全面地介绍了大数据技术与应用的基本知识和技能,详细介绍了大数据基础、大数据的行业应用、大数据的基础设施、大数据技术基础、Hadoop分布式架构、大数据管理、大数据分析、人工智能与机器学习、数据科学与数据科学家、开放数据的时代,以及大数据发展与展望等内容,具有较强的系统性、可读性和实用性。本书是为高等院校 大数据 相关课程全新设计编写、具有丰富实践特色的主教材,也可供有一定实践经验的软件开发人员和管理人员参考,或作为继续教育的教材。 本书配套授课电子课件,需要的教师可登录www.cmpedu.com免费注册、审核通过后下载,或联系编辑索取(微信:15910938545,QQ:2850823885,email:2308140194@qq.com,电话:010-88379739)另外,为方便任课教师进行交流,提供本科计算机
在大数据时代下,互联网平台产生的大规模海量搜索数据的价值不断得到学术界和工业界的重视。针对目前互联网海量搜索数据在预测和预警研究方面的不足,本书提出了一个基于互联网海量搜索数据的预测及预警分析框架,以互联网海量搜索数据为基础,通过网络文本挖掘、特征选择等方法确定关键词,将计量经济模型、人工智能模型等综合集成起来,提出了关键模型、方法和技术,并将所提出的分析框架成功地应用于国际原油价格和旅游行业的预测及预警研究中,且验证了研究框架的有效性。
当下,由于强大的数据挖掘软件平台很容易获得,草率地使用数据挖掘方法和技术将导致挖掘的结果混淆难解。这种失误往往源自盲目使用“黑盒子”方法进行数据挖掘,而好的避免途径就是使用“自盒子”方法,理解隐藏在软件背后的算法和统计模型结构。 本书分为7章,第l章是对降维方法的介绍,这是数据挖掘技术的一个先决条件;第2章至第6章为经典的数据挖掘算法和技术,包括一元回归模型、多元回归模型、逻辑回归模型、贝叶斯网络分析以及遗传算法,通过实际案例引导读者由已预处理的数据使用不同的挖掘技术从而得出所需结论;第7章为基于数据挖掘过程模型上的多个案例研究,通过多个领域的案例来阐述算法和技术是如何被运用的。 本书可作为数据挖掘课程教学用书,适用于高年级本科生和研究生的教学,也可供科研人员参考使用。
社交网络融合为社会计算等各项研究提供更充分的用户行为数据和更完整的网络结构,从而更有利于人们通过社交网络认识和理解人类社会,具有重要的理论价值和实践意义。社交网络中的关联用户挖掘旨在通过挖掘不同社交网络中属于同一自然人的不同账号,从而实现社交网络的深度融合。因此,关联用户挖掘是大型社交网络融合的基础问题,近年来已引起人们的广泛关注。考虑真实世界的朋友圈极具个性化,即现实中没有两个人具有完全一致的朋友圈,同时,相同的用户在不同的社交网络中往往具有部分相同的好友关系。本书基于社交网络的好友关系,充分利用好友关系的唯一性、稳定性和一致性,探索关联用户挖掘的方法。
本书以数据为研究对象,论述了从数据起源到数据未来的全过程,通过对数据的研究,揭示了物质、数据与信息之间的深刻关系,构建了一门独立的数据科学体系。本书对数据与数据科学的基本原理与规律、数据的基本定律与基础问题、数据与数据科学的基本方法等做了全面、细致的探索,提出了物质定义数据、数据定义信息等重要观点。
当前,全国首批已有38所高校开设“大数据”本科专业,预计在未来5年中开设“大数据”专业的本科和高职高专院校数量将超过500所,社会对大数据人才需求将达到100万人/年。案例教学是大数据人才培养的重要内容。 《大数据案例精析》以分析大数据在各个行业领域中的典型应用为主线,选取 有代表性的近30个案例进行重点分析,行业包括政府大数据、金融大数据、医疗大数据、交通大数据、教育大数据、旅游大数据、通信大数据、电商大数据、工业大数据以及物流大数据等,每个行业平均选取3个案例进行分析,形成相对统一的案例分析体系,同时还提供相应的教学课件配套资源。
商业智能是将企事业单位积累的数据转化为知识,帮助企事业单位做出科学决策的工具。蔡颖、鲍立威编著的《商业智能原理与应用》以“商业智能”应用为主线,全面系统地介绍了商业智能的基本概念、方法和技术,克服了以“数据挖掘” 技术为丰线的局限性,并以MS SQLServer作为数据仓库管理平台,以SQL Server Business Intelligence DeveloprnentVisualStudio作为商业智能开发平台,进行了丰富的案例演示。《商业智能原理与应用》可作为高等院校高年级本科生教材,也可作为MBA教材以及盯相关专业人员、市场营销人员、管理决策支持等实际经济管理领域实务工作者的参考用书。
本书是中国人民大学出版社出版的教材《统计数据分析基础教程(第二版)——基于SPSS 20和Excel 2010的调查数据分析》的配套辅导书。 由于本次修订对教材内容进行了更加适当的筛选,同时对例题和上机实验题进行了大幅更新,于是本同步配套辅导书也做了相应的修订。 本书以习题和上机实验指导的方式给出了教材中“思考题与上机实验题”的解答,以便帮助读者消化教材内容。本书包含10章的上机实验指导共32个。包括:*抽样、调查问卷制作、问卷数据的录入与清理、单选题的一维频率分析、两个单选题的交叉表分析、多选题的一维频率分析和交叉表分析、描述统计分析、假设检验、单因素方差分析、线性相关分 析与线性回归分析等。 本书可作为各级各类高等院校本科生统计数据分析的入门书,也可以作为MBA学生、研究生以及从事统计数据分析工作的人士
随着数据集规模和复杂度的持续上升,分析员必须利用更高级的软件工具来执行间接的、自动的智能化数据分析。《数据挖掘:概念、模型、方法和算法(第2版)》介绍了通过分析高维数据空间中的海量原始数据来提取用于决策的新信息的尖端技术和方法。 本书开篇阐述数据挖掘原理,此后在示例的引导下详细讲解起源于统计学、机器学习、神经网络、模糊逻辑和演化计算等学科的具有代表性的、*前沿的挖掘方法和算法。本书还着重描述如何恰当地选择方法和数据分析软件并合理地调整参数。每章末尾附有复习题。 本书主要用作计算机科学、计算机工程和计算机信息系统专业的研究生数据挖掘教材,高年级本科生或具备同等教育背景的读者也完全可以理解本书的所有主题。本书特色◆ 介绍支持向量机(SVM)和Kohonen映射◆ 讲解DBSCAN、BIRCH和分布式DBSCAN聚类算法
本书以实际数据的分析处理为例,介绍相应统计方法的运用,以及在EViews10.0中的实现。本书涉及处理以时间序列为主的多种类型的数据,包括描述统计、回归分析、传统时间序列等基本的数据分析以及建立条件异方差、向量自回归(包括非结构化和结构化模型)、向量误差修正模型、Panel Data模型、状态空间模型、混频数据模型等复杂的计量经济模型.本书为运用各种统计方法和经济计量方法处理数据的读者,提供了一个简便易学、易操作的工具。读者可以省去许多时间,很快就能够学习掌握该软件的运用。
《数据挖掘技术及其应用(精)》(作者杨杰、姚莉秀)系统地讲述了数据挖掘的基本概念和基本原理,并列举了在相应领域具有参考价值的算法及其改进和应用,是作者多年来从事教学和科研实践的成果。全书共9章,主要内容有:数据挖掘的基本概念和原理,数据预处理,各种分类、聚类和关联规则提取算法,以及在生物信息学、材料学中的实际应用案例。 《数据挖掘技术及其应用(精)》可用作计算机专业本科高年级学生或研究生的教材或参考书,也可供从事计算机信息处理、数据挖掘、工业优化等有关方面工作的科技人员参考。
科技的进步,特别是信息产业的发展,把整个社会带入一个崭新的信息时代。随着计算机应用的普及和数据库技术的不断发展,数据仓库与数据挖掘技术的应用领域越来越广泛。 《数据仓库与数据挖掘》第1章介绍数据仓库、数据挖掘的一般知识和应用领域。第2~8章介绍数据仓库和数据挖掘的理论和技术,其中第2、3章侧重数据仓库,重点阐述了数据仓库的架构、olap等内容,第4~8章侧重数据挖掘,重点阐述了关联规则、粗糙集、决策树、聚类分析和兴趣度量等内容。第9章给出了数据仓库与数据挖掘方面的应用案例。 《数据仓库与数据挖掘》是为软件工程硕士量身定做的教材,也可作为计算机专业、信息类专业、管理类专业相关课程的教材和教学参考书。
朱小栋、徐欣编著的《数据挖掘原理与商务应用(普通高等院校电子商务十二五规划重点教材)》的内容涵盖如何利用相关软件产品实现数据挖掘的经典算法和技术,还涵盖数据挖掘技术在商务领域中的应用。本书既适合计算机应用技术专业,也适合经管类信息管理与电子商务专业的学生学习。书中既注重从计算机应用角度来讲解数据挖掘,又注重数据挖掘与商务智能、管理科学、决策支持系统的结合。