本书系统地介绍过程挖掘的原理、方法、技术及其在教育领域的应用,重点介绍基于Petri net 的形式化挖掘技术和基于语义的挖掘技术,并举一个完整的挖掘大学校园学生行为特征的 案例。本书既有完整的理论框架又有专门的教育领域实践应用,可供计算机、大数据、人工智 能等相关专业领域的学生和研究人员参考。
本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
技术是把双刃剑,当我们在积极拥抱新技术的同时,也不能忽视其所带来的风险,比如当今大数据时代个人隐私和安全问题。本书是两位作者结合各自出色的专业知识和丰富的从业经验为大众倾力奉献的一本大数据时代隐私问题的普及读物。书中展示了我们在家庭和工作中的日常活动是如何成为大数据收集的一部分的。同时,列举大量的大数据应用以及安全和隐私相关案例,包括企业如何利用大数据进行营销、执法机构如何利用大数据执法等,也包括不法分子如何利用非法或合法的手段获取数据,如何利用社交网络进行犯罪。针对上述问题,本书也列出了一些工具、技巧用来检查和防范,这在当前很有现实意义。
本书以大数据为研究背景,系统分析了传统数据技术当前存在的问题以及面临的挑战,并对比了当前主流的面向大数据的数据库解决方案,在此基础上阐述了笔者的研究工作:基于MapReduce平台高处处理大数据的OLAP研究。书中反应了当前大规模数据仓库研究的热点和成果,值得大数据研究的人员参考和应用。
本书基于作者近几年来的研究开发成果及应用实践,对物联网大数据技术体系进行了系统归纳,阐述了物联网环境下感知数据的特性、数据模型、事务模型以及调度处理方法等核心概念及关键技术,并对物联网大数据存储、管理、计算与分析的基本概念和关键技术进行了剖析。本书还介绍了自行研发的面向物联网的ChinDB实时感知数据库系统以及针对云计算环境下物联网大数据管理与应用的DeCloud云平台,介绍了它们在智能交通、智能电厂、教育、安全监控等多个行业的应用。书中所有实例,均来自作者所在团队的实际应用,大部分在物联网项目中得到了实践应用。本书对物联网应用的开发以及两化融合、工业4.0环境下的大数据处理分析具有重要参考价值。
本书内容简介:数据挖掘和文本挖掘是当前信息技术中的一个重要研究领域;将遗传算法和社会演化算法应用于数据及文本挖掘方法研究,具有较大的理论意义和实用价值本书研究了基于遗传算法和社会演化算法的数据挖掘和文本挖掘方法,主要包括数据挖掘和文本挖掘中的属性约简问题、聚类问题,并将其应用于产品研发决策中所做主要工作包括:提出一种基于遗传算法和k-medoids算法的新的聚类方法;采用遗传算法和模式聚合进行文本特征降维;采用遗传算法和潜在语义索引进行文本特征降维;采用社会演化算法进行聚类;采用混沌社会演化算法进行聚类;采用改进的遗传算法和社会演化算法进行文本聚类研究;将文本挖掘应用到产品研发决策中,构建产品研发文本知识地图,以期提高产品研发的效率和质量。
本书详细介绍数据库的分析、设计、实现方法和过程。本书不仅涵盖普通数据库书籍中所没有讲到的数据库分析、设计和执行过程,还通过贯穿全书的实例描述数据库的创建、监控和调整的全过程。主要内容包括数据库的相关知识,数据库分析和设计技术、逻辑数据库设计方法学、物理数据库设计方法学等内容。另外,本书还增加了SQL和QBE、数据库管理和安全性以及数据库的现状和趋势等内容,使内容更为全面。本书既适合作为高等院校数据库课程的教材,也适合相关技术人员作为数据库分析、设计和开发的参考。
本书较为全面地介绍了在AWS云平台上进行数据分析和可视化开发的知识和技能。全书包含6个项目,分别介绍了搭建AWS数据分析开发环境、在数据分析中使用AmazoS3存储桶、使用Flask框架设计网站并进行数据分析、在Notebook中进行数据分析及可视化、Web应用程序的数据可视化和航空数据分析及可视化。每个项目之后还提供了课后练习,帮助读者巩固所学的内容。 本书可以作为高职高专软件技术相关专业和非计算机专业云计算开发课程的,也可以作为计算机软件、硬件培训班,还可供数据分析开发人员、数据可视化开发人员和广大计算机爱好者阅读参考。
该书基于通用的Excel、SPSS工具,加上必知必会的数据分析概念,以图文并茂、理论与实操相结合的方式,按照CDA人才培养考核要求进行编写。全书分为6章,分别为数据分析概述、数据收集与导入、数据的清洗与预处理、数据可视化呈现、基础数据分析、综合分析。本书适合数据分析零基础群体读者阅读,也可供大学生、初入数据分析职场人员、参与CDA考试的人员学习使用。
本书以云计算为基石,从概念、研究、应用角度出发,系统地介绍了数据爆炸时代下的大数据。首先介绍了云计算及大数据的基础知识,让读者对云计算及大数据有概要认识;然后根据需要介绍了Hadoop软件下的MapReduce、HDFS及HBase这几个组件;接着全面、系统地介绍了云时代下的大数据,主要包括大数据的链接、聚类、项集、系统、相似项挖掘及数据量化等内容,让读者挖掘云时代大数据体系下的效益、价值及研究方向。
《大数据分析:点“数”成金》以大数据分析的商业及金融价值为主线,对大数据这一崭新领域进行了深入探索。《大数据分析:点“数”成金》以大数据技术的基本概念和演进历程开篇,随后详细介绍了不同类型的数据源及其对企业的重要意义、企业投资大数据技术的成功商业案例、有效利用数据集的技能,解析了打造大数据分析系统所需的存储、加工、软件平台及其他构成要素,海量数据的安全工具和技术,系统潜在风险及其规避方法,以及怎样对大数据进行分析并从中提取有价值的可用信息,并详实阐述了如何将大数据融入企业文化等问题。 《大数据分析:点“数”成金》不但向读者阐明了大数据分析的重要性,更淋漓尽致地展现了大数据分析的具体过程,从而帮助企业提升智能化水平、解决实际问题、提升利润空间、提高生产率并发现更多的商业机会
为了适应数据库技术的发展需要,满足广大读者和教师的建议和需求,本书是在《数据库原理及开发应用》的基础上修订而成,本版深入浅出地讲解了数据库原理及其应用。相对版,本版对原书各章节增加了大量的例题,本版更系统全面、例题更丰富、实用性更强、注重培养学生的应用技能和能力,既能更方便教师的讲授,又便于学生掌握和理解数据库知识。 《数据库原理及开发应用(第二版)》的主要内容为数据库概述、数据模型、关系数据库的基本理论、transact?sql语言、结构化查询语言sql、存储过程和触发器、关系模式的规范化设计、数据库设计、数据库的安全与保护、数据库应用系统设计实例、web数据库应用系统、数据库技术新进展。 《数据库原理及开发应用(第二版)》注重教材内容循序渐进、由浅入深、理论与实践相结合,书中有大量的图形
SQL Server 2008是微软的SQL Server数据库中的版本,在该版本的数据库产品中融入了更多商业智能的内容。本书中也使用了一篇专门讲解了与商业智能有关的一些内容。 本书总分为5篇,共21章。篇主要讲解数据库的基础,包括数据库的概念及安装。第二篇讲解数据库管理的常用知识,包括数据库的管理、表的管理、确保数据的完整性及用户权限的设置等内容。第三篇主要讲解SQL的编程,包括T-SQL语言、存储过程及触发器。第四篇讲解与商业智能有关的内容,包括集成服务、报表服务和分析服务。最后一篇是综合案例篇,分别使用.NET和Java语言实现了与SQL Server 2008的连接,并完成了图书管理系统和在线订餐系统。