本书系统地介绍过程挖掘的原理、方法、技术及其在教育领域的应用,重点介绍基于Petri net 的形式化挖掘技术和基于语义的挖掘技术,并举一个完整的挖掘大学校园学生行为特征的 案例。本书既有完整的理论框架又有专门的教育领域实践应用,可供计算机、大数据、人工智 能等相关专业领域的学生和研究人员参考。
本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
技术是把双刃剑,当我们在积极拥抱新技术的同时,也不能忽视其所带来的风险,比如当今大数据时代个人隐私和安全问题。本书是两位作者结合各自出色的专业知识和丰富的从业经验为大众倾力奉献的一本大数据时代隐私问题的普及读物。书中展示了我们在家庭和工作中的日常活动是如何成为大数据收集的一部分的。同时,列举大量的大数据应用以及安全和隐私相关案例,包括企业如何利用大数据进行营销、执法机构如何利用大数据执法等,也包括不法分子如何利用非法或合法的手段获取数据,如何利用社交网络进行犯罪。针对上述问题,本书也列出了一些工具、技巧用来检查和防范,这在当前很有现实意义。
本书以大数据为研究背景,系统分析了传统数据技术当前存在的问题以及面临的挑战,并对比了当前主流的面向大数据的数据库解决方案,在此基础上阐述了笔者的研究工作:基于MapReduce平台高处处理大数据的OLAP研究。书中反应了当前大规模数据仓库研究的热点和成果,值得大数据研究的人员参考和应用。
本书基于作者近几年来的研究开发成果及应用实践,对物联网大数据技术体系进行了系统归纳,阐述了物联网环境下感知数据的特性、数据模型、事务模型以及调度处理方法等核心概念及关键技术,并对物联网大数据存储、管理、计算与分析的基本概念和关键技术进行了剖析。本书还介绍了自行研发的面向物联网的ChinDB实时感知数据库系统以及针对云计算环境下物联网大数据管理与应用的DeCloud云平台,介绍了它们在智能交通、智能电厂、教育、安全监控等多个行业的应用。书中所有实例,均来自作者所在团队的实际应用,大部分在物联网项目中得到了实践应用。本书对物联网应用的开发以及两化融合、工业4.0环境下的大数据处理分析具有重要参考价值。
本书内容简介:数据挖掘和文本挖掘是当前信息技术中的一个重要研究领域;将遗传算法和社会演化算法应用于数据及文本挖掘方法研究,具有较大的理论意义和实用价值本书研究了基于遗传算法和社会演化算法的数据挖掘和文本挖掘方法,主要包括数据挖掘和文本挖掘中的属性约简问题、聚类问题,并将其应用于产品研发决策中所做主要工作包括:提出一种基于遗传算法和k-medoids算法的新的聚类方法;采用遗传算法和模式聚合进行文本特征降维;采用遗传算法和潜在语义索引进行文本特征降维;采用社会演化算法进行聚类;采用混沌社会演化算法进行聚类;采用改进的遗传算法和社会演化算法进行文本聚类研究;将文本挖掘应用到产品研发决策中,构建产品研发文本知识地图,以期提高产品研发的效率和质量。
本书详细介绍数据库的分析、设计、实现方法和过程。本书不仅涵盖普通数据库书籍中所没有讲到的数据库分析、设计和执行过程,还通过贯穿全书的实例描述数据库的创建、监控和调整的全过程。主要内容包括数据库的相关知识,数据库分析和设计技术、逻辑数据库设计方法学、物理数据库设计方法学等内容。另外,本书还增加了SQL和QBE、数据库管理和安全性以及数据库的现状和趋势等内容,使内容更为全面。本书既适合作为高等院校数据库课程的教材,也适合相关技术人员作为数据库分析、设计和开发的参考。
本书较为全面地介绍了在AWS云平台上进行数据分析和可视化开发的知识和技能。全书包含6个项目,分别介绍了搭建AWS数据分析开发环境、在数据分析中使用AmazoS3存储桶、使用Flask框架设计网站并进行数据分析、在Notebook中进行数据分析及可视化、Web应用程序的数据可视化和航空数据分析及可视化。每个项目之后还提供了课后练习,帮助读者巩固所学的内容。 本书可以作为高职高专软件技术相关专业和非计算机专业云计算开发课程的,也可以作为计算机软件、硬件培训班,还可供数据分析开发人员、数据可视化开发人员和广大计算机爱好者阅读参考。
该书基于通用的Excel、SPSS工具,加上必知必会的数据分析概念,以图文并茂、理论与实操相结合的方式,按照CDA人才培养考核要求进行编写。全书分为6章,分别为数据分析概述、数据收集与导入、数据的清洗与预处理、数据可视化呈现、基础数据分析、综合分析。本书适合数据分析零基础群体读者阅读,也可供大学生、初入数据分析职场人员、参与CDA考试的人员学习使用。
本书以云计算为基石,从概念、研究、应用角度出发,系统地介绍了数据爆炸时代下的大数据。首先介绍了云计算及大数据的基础知识,让读者对云计算及大数据有概要认识;然后根据需要介绍了Hadoop软件下的MapReduce、HDFS及HBase这几个组件;接着全面、系统地介绍了云时代下的大数据,主要包括大数据的链接、聚类、项集、系统、相似项挖掘及数据量化等内容,让读者挖掘云时代大数据体系下的效益、价值及研究方向。
为了适应数据库技术的发展需要,满足广大读者和教师的建议和需求,本书是在《数据库原理及开发应用》的基础上修订而成,本版深入浅出地讲解了数据库原理及其应用。相对版,本版对原书各章节增加了大量的例题,本版更系统全面、例题更丰富、实用性更强、注重培养学生的应用技能和能力,既能更方便教师的讲授,又便于学生掌握和理解数据库知识。 《数据库原理及开发应用(第二版)》的主要内容为数据库概述、数据模型、关系数据库的基本理论、transact?sql语言、结构化查询语言sql、存储过程和触发器、关系模式的规范化设计、数据库设计、数据库的安全与保护、数据库应用系统设计实例、web数据库应用系统、数据库技术新进展。 《数据库原理及开发应用(第二版)》注重教材内容循序渐进、由浅入深、理论与实践相结合,书中有大量的图形
《大数据分析:点“数”成金》以大数据分析的商业及金融价值为主线,对大数据这一崭新领域进行了深入探索。《大数据分析:点“数”成金》以大数据技术的基本概念和演进历程开篇,随后详细介绍了不同类型的数据源及其对企业的重要意义、企业投资大数据技术的成功商业案例、有效利用数据集的技能,解析了打造大数据分析系统所需的存储、加工、软件平台及其他构成要素,海量数据的安全工具和技术,系统潜在风险及其规避方法,以及怎样对大数据进行分析并从中提取有价值的可用信息,并详实阐述了如何将大数据融入企业文化等问题。 《大数据分析:点“数”成金》不但向读者阐明了大数据分析的重要性,更淋漓尽致地展现了大数据分析的具体过程,从而帮助企业提升智能化水平、解决实际问题、提升利润空间、提高生产率并发现更多的商业机会
SQL Server 2008是微软的SQL Server数据库中的版本,在该版本的数据库产品中融入了更多商业智能的内容。本书中也使用了一篇专门讲解了与商业智能有关的一些内容。 本书总分为5篇,共21章。篇主要讲解数据库的基础,包括数据库的概念及安装。第二篇讲解数据库管理的常用知识,包括数据库的管理、表的管理、确保数据的完整性及用户权限的设置等内容。第三篇主要讲解SQL的编程,包括T-SQL语言、存储过程及触发器。第四篇讲解与商业智能有关的内容,包括集成服务、报表服务和分析服务。最后一篇是综合案例篇,分别使用.NET和Java语言实现了与SQL Server 2008的连接,并完成了图书管理系统和在线订餐系统。
该书基于通用的Excel、 SPSS工具, 加上必知必会的数据分析概念, 以图文并茂、 理论与实操相结合的方式, 按照CDA人才培养考核要求进行编写。全书分为6章, 分别为数据分析概述、 数据收集与导入、 数据的清洗与预处理、 数据可视化呈现、 基础数据分析、 综合分析。本书适合数据分析零基础群体读者阅读, 也可供大学生、 初入数据分析职场人员、 参与CDA考试的人员学习使用。
本书以国际数据挖掘标准流程(GRISP-DM)为依据,以企业管理面临的现实问题为应用案例,由浅入深介绍数据挖掘方法及其解决问题过程的数据理解、数据处理、数据分析、数学建模、模型结果评估等内容,并引人应用广泛的数据挖掘Clementine软件辅助问题案例的解决,使读者不仅可以集中地学习数据挖据的主要理论方法,而且可以了解基于数据挖掘的数学建模过程,可以学习应用软件辅助解决问题的操作方法。本书把理论、案例、建模、软件辅助结合一体统一叙述,简述理论,突出应用,详细分析,展示过程,既考虑高校学生的学习需要,分本科生与研究生学习层次,又考虑企业管理者的应用与实践需要。本书可作为数据挖掘理论与技术的教学、实践、应用和提高的教科书或参考书。适合高等学校本科高年级学生、研究生以及学习数据挖掘、数学模型课程的学生使
本书介绍了大数据可视化的基础,大数据可视化的实现方法,并对Python数据可视化作了详细的描述。 特色: 1.结构体例:使用案例教学为主,每一章有案例的导入及完整的分析,理论与实践相结合。 2.写作特点:本书逻辑清楚,语言平易近人。 3.加入了z新的Python库实现大数据可视化,具有开拓性与创新性。 4.教师有丰富的上课经验和教改课题的经验,教学案例丰富。 5.本书配有大量重难点视频,以帮助学生课后自习。
你是否有过这样的经历:在项目的最后一刻突然被要求在图中修改或添加某个数据点?这时为了完成项目,你将不得不冒着降低准确性的风险,然而,在Tableau中不会发生这种情况。Tableau是一个革命性的工具包,利用它可以简单、高效地创建高质量的数据可视化图形。本书通过大量的具体案例,详细讲解了如何利用Tableau软件进行数据可视化分析,包括基本使用方法、具体操作步骤、实现原理及一些实用技巧等,为快速掌握Tableau软件提供了翔实指导。 本书共9章,章讲解如何连接不同数据源,包括文本、Excel、Access数据库文件及服务器上的数据;第2~5章循序渐进讲解各种图形的创建方法,包括单变量图、双变量图、多变量图和地图;第7~8章详细讲解了如何自定义图中各个元素以及如何将做好的可视化图形打包分享;第6章和第9章主要介绍Tableau的高级功能,包括自定义
《IBM SPSS Modeler数据与挖掘实战》一书书主要包括两部分内容:在数据挖掘部分,重点介绍了各种数据挖掘方法的基本原理及应用,包括回归分析、时间序列分析、因子分析、决策树分析、判别分析、聚类分析、人工神经网络、贝叶斯网络以及社交网络分析等;在文本挖掘部分,重点介绍了文本挖掘的节点,以及具体的实现过程。每一章都详细介绍了数据和文本挖掘的基本原理和分析过程,同时在实例中也介绍了SPSS Modeler中大部分节点的使用方法及应用步骤。 本书提供了15个来自行业应用中的案例,旨在通过系统的工作案例使读者能够掌握应用技巧的同时,卓有成效地提升解决实际问题的能力。 本书对于高校理工学科、经济金融学科及数量分析方面的学生,以及数据挖掘和分析方面的研究人员和从业人员等,具有很强的可读性、可操作性与可使用性,尤其适合商业
系统阐述空间数据库基本概念、原理、方法及技术的新发展,重点介绍空间现象抽象表达、空间数据模型、空间数据组织与管理、空间数据索引技术、空间数据查询与访问、时态空间数据库、空间数据元数据与空间数据共享、空间数据库设计、空间数据库新技术等内容。空间数据库是近年来热点研究领域,是一门前沿交叉学科。《空间数据库》内容全面、条理清晰、叙述严谨、实例丰富、针对性强,可作为地理信息系统、遥感、软件工程、测绘工程、通信工程等专业本科生和研究生教材,也可供地质矿产、地理信息、测绘遥感、城市规划、国土管理、环境科学及相关专业研究和开发人员参考和使用。