本书系统地介绍过程挖掘的原理、方法、技术及其在教育领域的应用,重点介绍基于Petri net 的形式化挖掘技术和基于语义的挖掘技术,并举一个完整的挖掘大学校园学生行为特征的 案例。本书既有完整的理论框架又有专门的教育领域实践应用,可供计算机、大数据、人工智 能等相关专业领域的学生和研究人员参考。
本书是一部异构制造大数据智能融合技术的学术专著。本书以制造业大数据为背景,围绕旋转设备的运行状态展开,系统介绍了在多源异构制造大数据的基础上利用多源数据融合的方法实现旋转设备的运行状态监测和智能诊断。 本书的最大亮点和特色是遵循理论性与实践性相结合、先进性与实用性相结合、专业性与通用性相结合的原则。 本书适合以下读者: 对人工智能、机器学习、数据融合感兴趣的读者;希望用计算机的算法解决机械相关领域问题的研究者、工程设计人员和应用人员。本书可以作为计算机专业和机械专业的本科毕业设计和研究生学术论文的参考资料,尤其是可供研究多源数据融合和机械设备故障诊断方向的学生、研究人员参考;还可以作为相关工程技术人员的辅助参考。
本书与以往统计学中的概率论略有不同,添加了一些复杂数据类型的概率基础知识和模拟计算中的相关概率知识。具体安排如下所述。本书共分6章。第1章为概率与计数,基本内容是随机事件、概率空间、计数方法、概率的确定方法。第2章为条件概率,基本内容是条件概率与乘法公式、事件的独立性、全概率公式与贝叶斯公式。第3章为随机变量,基本内容是随机变量及其分布函数、随机变量的分类、二维随机向量、随机变量的独立性、随机变量函数的分布。第4章为常用的概率分布,基本内容是常用的离散型随机变量、常用的连续型随机变量、随机数的产生。第5章为随机变量的数字特征,基本内容是数学期望、方差和协方差、矩和矩母函数、条件期望。第6章为不等式和极限定理,基本内容是概率不等式、大数定律及其应用、中心极限定理。
本书通过选购笔记本电脑的案例引入数据包络分析(dataenvelopmentanalysis,DEA)的基本概念和模型,并运用简单的EXCEL模型让读者更易理解和运用DEA。本书着重阐述如何将DEA作为一种运营分析工具,进行绩效评估,找出基准标杆。探讨的主题包括:平衡的基准,昀佳实践,相对效率的概念及绩效提升。特别地,本书探讨的数据分析方法能够帮助一个组织重新审视它对生产效率高低的已有观点是否合理,并为组织不断改进提供指导。本书是市面上唯一本不要求读者具备线性规划和线性代数知识,就可以熟练应用DEA方法的DEA方法指导用书。
本书是为广大数据分析师量身定制的入门读物,它旨在帮助读者站在大数据时代的制高点。数据分析处于统计学、计算机信息科学、运筹学、数据库等多个领域的交叉地带,大数据时代的到来大大丰富了数据分析的内涵,数据分析师的职责与以往相比发生了巨大的改变。本书全面介绍了经典数据分析、模式识别、机器学习、深度学习、数据挖掘、商务智能等多个领域的数据分析算法,将大数据时代的数据分析热点技术一网打尽。本书为每个数据分析算法都搭配了一个经典案例,并按照由易到难的原则构建知识框架,充分照顾了不同水平读者的阅读习惯。通过阅读本书,读者将对大数据时代下的数据分析有一个全面的认识。无论是入门级的数据分析员还是有一定基础的数据分析师,都能通过本书完善、加深对数据分析的认识。
近年来,针对互联网数据滥用、平台垄断、隐私泄漏等问题,全球兴起了Web3.0探索热潮,力图通过区块链等技术重构新一代互联网。2021年,国家《 十四五 数字经济发展规划》中指出,要推动数字技术在数据流通中的应用,鼓励企业、研究机构等主体基于区块链等数字技术探索数据授权使用、数据溯源等应用,提升数据交易流通效率;2022年,国务院《关于数字经济发展情况的报告》中也指出,数字经济成为重组全球要素资源、重塑全球经济结构、改变全球竞争格局的关键力量,其发展离不开区块链等数字产业。区块链的分布式账本和智能合约实现了数据的确权、定价、交易和赋能,是Web3.0中数字经济的 新基建 ,也是元宇宙的创作者所有权经济的基础。本书以笔者团队负责的真实区块链应用案例为蓝本,深度剖析了区块链如何赋能金融科技、智慧能源、企业管理和
本书详细介绍了意大利那不勒斯菲里德里克第二大学Massimo Aria和Corrado Cuccurullo基于R语言开发的BIBLIOMETRIX工具包。该R工具包基本上涵盖了进行科学计量和知识可视化的功能,可以满足爱好R软件,并试图使用R进行科学计量和知识图谱分析的读者。在此基础上,本书对于科学计量与知识图谱相关的一些R工具包,包括rAltmetric、wordcloud2、gender以及tidytext等工具包进行了简要介绍。
本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
技术文档翻译关乎企业全球化进程,是我国语言服务行业重要但却长期被忽视的领域,其翻译质量受制于译员对专业领域知识的系统理解。为帮助译员高效习得领域知识,本书借助知识本体技术,模拟人类认知思维过程,以云计算领域为例,构建了面向技术文档翻译的知识服务平台,论述了其构建原理、模型、流程及应用前景等。本书的研究源于技术写作行业实践,诉求于翻译人才专业知识水平的提高,延伸于企业国际形象建设,落脚于知识服务体系探索,回归于技术文档翻译质量。此过程体现了应用翻译研究与其他学科交叉融合的发展本质,更体现了数字人文建设的旨归。
本书针对微软公司数据库软件Access ,从数据库使用的实际需要出发,将基础知识与基本技能相结合,按照“以服务为宗旨,以就业为导向”的指导思想,采用“行动导向,任务驱动”的方法,将知识点穿插在学生信息管理系统实例制作的操作过程中。本书共6个项目,主要包括数据库应用系统、系统初始化、信息查询、打印数据信息、管理数据信息、应用系统实现等内容。围绕“罗斯文”数据库系统实例建设展开,按照系统开发的一般步骤,详细讲解“罗斯文”数据库系统的开发过程,坚持“在做中学,在学中做”学用结合,在不断的实践中,通过实现系统掌握数据库基础知识。每个项目有若干任务,每个任务由“任务描述”、“做一做”、“学一学”、“试一试”、“小本子”5个模块组成介绍数据库应用软件开发的实际流程与制作技巧。本书适合计算机爱好者入
《数据库项目教学实践教程(Access 2010)》首先介绍了数据库的基础理论,使读者具备基本的知识背景。在此基础之上,将建立一个教学管理数据库系统这个总任务的实现过程贯穿于各个章节之中,并将其分解为不同的子任务。每个子任务包括项目任务描述、项目预备知识、项目实施和项目延伸4个环节。学习完预备知识之后,读者即可具备完成本章子任务的技术能力,在项目实施环节,《数据库项目教学实践教程(Access 2010)》把子任务分解为更小的任务以便于实现。《数据库项目教学实践教程(Access 2010)》的设计试图让读者通过轻松完成一个项目活动而掌握和具备开发小型数据库管理系统的知识和能力。
本书基于作者近几年来的研究开发成果及应用实践,对物联网大数据技术体系进行了系统归纳,阐述了物联网环境下感知数据的特性、数据模型、事务模型以及调度处理方法等核心概念及关键技术,并对物联网大数据存储、管理、计算与分析的基本概念和关键技术进行了剖析。本书还介绍了自行研发的面向物联网的ChinDB实时感知数据库系统以及针对云计算环境下物联网大数据管理与应用的DeCloud云平台,介绍了它们在智能交通、智能电厂、教育、安全监控等多个行业的应用。书中所有实例,均来自作者所在团队的实际应用,大部分在物联网项目中得到了实践应用。本书对物联网应用的开发以及两化融合、工业4.0环境下的大数据处理分析具有重要参考价值。
《大数据相似查询关键技术研究》由清华大学计算机科学与技术系博士、华为数据库专家孙佶撰写。全书首先介绍了相似查询问题的现实应用和价值,以及面临的技术挑战;然后提出一个相似查询系统,并且介绍了高效相似查询索引、相似查询代价估算及人在回路实体相似匹配的核心技术和创新思考。全书提供了丰富的实验数据和结果,分析了各种技术的优劣,也为实际产品的技术选型提供了重要参考。 《大数据相似查询关键技术研究》共五章: 第1章绪论,介绍了全书的研究背景、研究内容及主要贡献,并概述了全书的结构安排。 第2章分布式内存相似查询系统Dima,介绍了分布式内存相似查询系统Dima。 第3章基于学习的相似查询基数估计,提出了一种基于学习的相似查询技术估计技术,使用这种基数可以帮助相似查询系统进行查询执行计划优化。 第4章基于相似
全书共由7章组成,其中:第1章主要介绍数据挖掘技术、离群挖掘、集群系统与Spark并行计算模型及大数据的相关概念、理论基础和应用。第2章利用特征分组,针对高维分类数据集,研究了一种基于加权特征分组的离群检测新方法,通过将特征分为多个特征组来发现每个组中特征模式的不同方面。第3章利用Spark计算平台,研究了高维分类数据的并行离群检测算法。第4章通过分析属性间的相关性,研究了一种基于互信息的混合属性离群检测算法。该算法在互信息机制下给出了针对数值型和分类型统一的属性加权方法和离群得分计算方法,而且不同类型属性下的相似性度量也进行了规范化处理。第5章针对互信息计算的复杂性问题,充分利用Spark并行计算框架的强大计算能力,研究了一种并行互信息计算方法,该算法利用列变换和虚拟数据划分技术降低了网络传输和计算
《统计分析:以R语言为工具》围绕经典的统计方法与 R 语言工具,从基本的统计描述分析方法出发,讲解了参数估计与假设检验、线性回归、逻辑回归、降维分析方法,每一章重点介绍一种经典方法或统计模型,对其基本定义、模型形式、统计方法的推导与解读等都给出了细致的讲解。此外,为了将理论与实践紧密结合,《统计分析:以R语言为工具》每一章均提供了不同业务场景下的R语言编程实例,帮助读者练习巩固。《统计分析:以R语言为工具》适合相关学科本科生及研究生,以及对数据分析及建模感兴趣的读者。
《物联网之云:云平台搭建与大数据处理》为 物联网工程实战丛书 第4卷。《物联网之云:云平台搭建与大数据处理》阐述了云计算的基本概念、工作原理和信息处理流程,详细讲述了云计算的数学基础及大数据处理方法,并给出了云计算和雾计算的项目研发流程,展望了云计算的发展前景。 《物联网之云:云平台搭建与大数据处理》共10章。第1章介绍了物联网数据分析中的一些数学基础、概率论和数理统计方法,以及分布式计算、网格计算和云计算方法,及其在物联网中的应用;第2章给出了云计算的概念和原理,并针对云计算的一些技术和体系架构做了详细介绍;第3、4章阐述了云计算平台的建设,重点阐述了PaaS平台的搭建流程及其针对智慧城市和垂直行业的云平台搭建实战;第5、6章阐述了大数据概念及大数据处理的常见数学方法;第7章阐述了物联网云计算
本书共分为5章,系统全面地介绍了MATLAB的基本知识和用法,包括:MATLAB基础简介、向量与矩阵运算、绘图、符号计算、程序设计。本书将MATLAB软件应用于数学、信息与计算科学专业的学习和研究中,解决相关课程中的科学计算、图形绘制、数值模拟与仿真等问题,提高科学计算与研究的效率,使读者具备利用MATLAB软件进行计算机处理、解决实际问题的能力。 本书读者对象为需要数学建模、学术研究分析、理论验证、图形仿真的各专业大学生、研究生,以及教师和科研人员。
全书内容包括SQL Server 2016的安装和操作、数据库的基本认识、表的定义和操作、数据查询和更新、视图的定义和维护、存储过程的创建、事务和锁、触发器、数据完整性、数据导入和导出、数据库还原技术、用户管理技术、数据库综合设计和实现等。为了使初学者轻松地进行学习和操作,本书在每个章节有针对性地设置了与实际生活相关的示例,帮助读者更好地理解相关概念,同时也帮助其掌握软件的操作方法。介绍了数据库基本概念的理解、SQLServer数据库管理系统的认识,数据库定义、数据操作、数据库管理维护、数据库的综合应用、以及数据库的应用开发。
本书是一本系统介绍大数据可视化技术的图书。书中首先阐述了大数据的可视化技术的基本概念以及相关的基础理论知识,然后采用理论与实践相结合的方式,针对实际应用中的各种不同类型的数据,包括时间数据,比例数据,关系数据,文本数据,复杂数据,介绍相应的可视化理论和操作方法,*后,介绍了数据可视化在各个领域中的应用。本书实例丰富,图文并茂,叙述简明,重点突出。作者专门收集和整理了相关的课程案例、典型数据和实验指导手册,帮助读者深入学习大数据可视化中的各种技术知识。本书可以作为高校计算机、数据分析、大数据等相关专业学生的教学用书,对于从事数据可视化、数据分析的技术人员也有较大的参考价值。
全书共13章,以案例是主线讲解SQL2008。内容的安排是基于案例和项目。案例贯穿于整个的内容安排,在中,通过一个实际的开发案例来组织学习内容。在很后一章,通过一个实际的项目,来对整本内容进行一个总结和回顾。
本教材是根据中等职业教育信息技术专业课程标准编写的,主要讲授Access 2016数据库基础知识、数据库的创建、数据访问、数据查询、SQL语言的应用、数据安全管理等,从而提高学生对Access数据库的操作和应用能力。全书按项目式教学设计内容,由浅入深地对Access 2016进行了详细的讲解,主要内容包括Access数据库设计、表的操作、数据查询、SQL语言应用、窗体设计、报表设计、宏、数据库维护与管理、数据库应用设计等。本书注重基本知识与实践操作的结合,每个项目包含多个任务,通过任务展开教学内容,同时给出了任务拓展练习、习题和上机操作题,有利于学生较系统的学习Access 2016数据库知识,提高数据库的应用能力。
本书所选习题,紧密围绕 考试中心发布的考试大纲,并以梯度的形式呈现给读者(从基础题进阶到拔高题),使考生的学习 具有针对性。 本书根据考研形势的变化,删除了一些不必要的讲解,精简后本书的内容 纯粹、 有针对性,成为考研知识点巩固之利器。此外,考生还可以通过关注信息平台来了解本书的*新 新并反馈信息,微信:shuaihui_ds。 本书可作为参加计算机专业研究生入学考试考生的复习指导用书,也可作为全国各高校计算机专业或非计算机专业的学生学习相关课程的辅导用书。 (编辑邮箱:jinacmp@163.com)
本书探讨了物联网的现状和未来发展趋势,以及所面临的相关安全问题。作者艾哈迈德·巴纳法( Ahmed Banafa)教授将区块链、人工智能和雾计算等新技术引入物联网安全问题的解决方案当中,向我们展示了这些新技术通过融合解决物联网安全问题的可能性。在本书中,作者就如何保护物联网的安全发展也给出了自己的一些建议, 同时就目前人们对区块链技术的一些误解给出了解释,并提出了合理应用区块链技术的一些建议。 本书适合对物联网、人工智能、区块链及雾计算等新技术感兴趣的读者阅读。
本书根据现有的大数据技术理论,综合介绍了大数据技术的相关基础理论知识,并提供了部分实践操作介绍。本书共8个章节,内容包含大数据的概念和特征,大数据计量,大数据生命周期,大数据与云计算,Hadoop,HDFS,MapReduce,大数据编程语言Python、Spark、R语言,数据预处理,聚类分析,k-邻近分类算法,数据可视化,大数据应用,大数据安全与威胁,爬虫技术,MINIST数字识别技术。本书分别在大数据采集与预处理、数据挖掘与分析等重要章节中安排了入门级的实践操作内容,以便读者 好地学习和掌握大数据关键技术。 本书可以作为高等院校数据科学与大数据等相关专业的课程教材,亦可作为大数据爱好者的科普读物。