本书是国际数据管理协会(DAMA国际)组织众多国际专家对过去30多年数据管理领域知识和实践的总结,是市场上综合了数据管理方方面面的一部具有性的基础工具书。从数据治理、数据架构、数据质量、数据安全、主数据管理、参考数据管理、元数据管理、商务智能和数据参考管理、数据建模设计、数据存储和操作、数据集成和互操作、文档和内容管理、大数据、数据管理人员的道德要求等方面介绍了数据管理的知识体系。
本书基于Flink的稳定版本1.13,从Flink数据处理思想开始讲解,带领读者深入理解Flink的基本架构,进而由浅入深,结合具体案例,详细剖析了Flink中DataStream API的使用,并对Flink中的时间语义、状态、容错机制等重要概念进行了详尽的阐述。另外,本书还对实际开发中常用的Flink SQL、CEP等高层级API进行了细致的讲解,以电商网站中的实际应用为场景,提供了大量的代码实现。本书分为三大部分:第1~5章,带领读者初步认识Flink并编写基本的Flink程序;第6~10章,深入探讨了Flink内部的高级应用;第11~12章,讲解了Flink提供的扩展功能。本书广泛适用于大数据的学习者与从业人员,以及院校大数据相关专业的学生,也可作为大数据学习的参考书。
本书以DM8 为对象,系统地介绍了DM8 数据库的安装和维护,以及达梦数据库主流的两大解决方案:达梦DW数据守护和DMDSC 高可用集群方案。本书演示了基于中标麒麟Linux 平台的大量实战操作。通过本书的学习,读者可以掌握达梦数据库的安装和基础操作,如用户、表空间、普通标、分区表、索引、参数、统计信息的管理操作,也可以系统地掌握达梦数据库的备份和恢复技能,如逻辑备份与恢复、联机备份与恢复、脱机备份与恢复。另外,本书还介绍了达梦DW 数据守护和 DMDSC 高可用集群方案,完善了达梦数据库的运维体系。
数据清洗是大数据领域不可缺少的环节,用来发现并纠正数据中可能存在的错误,针对数据审查过程中发现的错误值、缺失值、异常值、可疑数据,选用适当方法进行 清理 ,使 脏 数据变为 干净 数据。本书共分为8章:第1章主要介绍数据清洗的概念、任务和流程,数据标准化概念及数据仓库技术等;第2章主要介绍Windows和类UNIX操作系统下的数据常规格式、数据编码及数据类型转换等;第3章介绍ETL概念、数据清洗的技术路线、ETL工具及ETL子系统等;第4章介绍Excel、Kettle、OpenRefine、DataWrangler和Hawk的安装及使用等;第5章介绍Kettle下文本文件抽取、Web数据抽取、数据库数据抽取及增量数据抽取等;第6章介绍数据清洗步骤、数据检验、数据错误处理、数据质量评估及数据加载;第7章介绍网页结构,利用网络爬虫技术进行数据采集,利用JavaScript技术进行行为日志数据采集
本书以数据库应用系统实现为线索,内容除数据库技术外,还涵盖系统分析、设计、开发和部署方法,并引入 互联网 思维和热点技术。全书以一个完整的 e学习 系统实际案例驱动,采用MySQL和ASP.NET为实验环境,帮助读者通过实际应用理解数据库应用系统的相关知识和开发方法,掌握实践技能,综合运用前沿信息技术实现领域创新应用。本书提供丰富的教学资源,可以登录华信教育资源网(www.hxedu.com.cn)免费获取相关资源包,也可以扫描书中的二维码获取相关资源或观看演示视频。本书通俗易懂、实例鲜活、技术先进,可作为各类高等学校数据库技术、信息系统设计的入门教材,或者作为计算机基础教育较高层次课程的教材,也可以作为数据库应用系统开发实践的技术参考书。
本书以达梦数据库DM8为蓝本,介绍达梦数据库的存储过程、存储函数、触发器等服务器端程序,以及Java、C、Python、PHP等高级语言基于达梦数据库的应用程序设计方法。本书主要包括:DM SQL程序结构、基本语法;存储过程、存储函数、触发器、包等高级对象的基本语法及应用方法;嵌入式SQL程序Pro *c组成、基本语法及应用方法;基于ODBC、JDBC、.NET Data Provider数据库访问接口标准的应用程序设计方法;PHP、Python、Go等高级语言访问达梦数据库的程序设计方法;达梦数据库数据装载及日志分析接口的程序设计方法。本书内容实用、示例丰富、语言通俗、格式规范,可作为相关专业的教材,也可作为工程技术人员的参考书。
中国大数据专家委员会刘鹏教授联合全国上百家高校从事一线教学科研任务的教师,一起编撰高级大数据人才培养从书。本书是丛书之一,其定位是大数据挖掘技术与应用。本书系统地介绍了数据挖掘算法理论与方法、工具和应用,包括经典数据挖掘算法,大数据环境下常用数据挖掘算法的优化,大数据新常态下催生的数据分析方法(如推荐系统、链接分析与网页排序、互联网信息抽取、日志挖掘与查询分析)、工具与应用。本书适合作为相关专业本科和研究生教材。高职高专学校也可以选用部分内容开展教学。本书也很适合作为大数据分析研发人员的自学书籍。
21 世纪,互联网行业的爆发开启了全球数据量急剧增长的新时代,数据已经成为驱动企业数字化转型的核心力量。整个数据行业的技术能力不断提升,从数据库到数据仓库,再到开源大数据,都在经济社会中发挥着极其重要的作用。近年来,新兴数据技术与云计算相互辅助,共同发展,诞生了一系列云原生数据服务,让企业能够突破传统模式的局限,专注于业务,降本增效。本书以全球前沿的云原生服务为基础,详细展现了如何将数据存储、数据引入、批量数据处理、实时数据处理、数据仓库、数据可视化和机器学习等核心要素综合起来,逐步构建一个高效的大数据服务平台。
大数据管理与应用主要以信息科学、计算机科学和管理科学等学科为理论基础,其研究内容包括大数据科学基础理论、大数据预处理、大数据计算、大数据管理和分析等。本书力图通过对大数据科学相关数据管理方面内容的综合介绍,面向大数据时代的电子商务智能数据计算领域,从大数据采集、大数据预处理、大数据存储与计算、多源异构大数据分析、大数据知识融合技术和大数据的应用管理等方面说明大数据管理与应用的主要研究内容和应用方向。
本教材依据普通高校信管类专业的培养目标,按学科的课程设置要求,突出应用型、实践性和立体化的特点编写。全书以数据库系统基本概念、关系代数、SQL语言、设计理论与工程设计、实施、维护、、应用发展和系统实例为主线,强调在网络环境、知识经济和信息经济环境下数据库系统所表现出的特点。本书结构新颖,内容详实,案例丰富,实用性较强,既可作为普通高校信息管理与信息系统、管理科学与工程、工商管理等经管类相关专业的教材,也可供企事业单位和信息系统相关人员作为参考书使用。随书配备的光盘包含丰富的习题与案例,电子教案、课程设计、优秀作业展示等资料,便于教学和自学。
本书按照需求规划、需求实现、可视化的流程进行编排,通过项目开发的主要流程,介绍数据仓库的搭建过程。在整个数据仓库的搭建过程中,本书介绍了主要组件的安装部署、需求实现的具体思路,以及各种问题的解决方案等,并在其中穿插了许多与大数据和数据仓库相关的理论知识,包括数据仓库的概念、电商业务概述、数据仓库理论和数据仓库建模等。 本书共14章,其中,第1~3章是项目的前期准备阶段,主要介绍了数据仓库的概念和搭建需求,并初步搭建了本数据仓库项目所需的基本环境;第4~7章是项目的核心部分,详细介绍了数据仓库的建模理论,并完成了数据从采集到分层搭建的全过程,是本书的重点部分;第8~14章是对数据治理各功能模块的实现,针对数据治理的不同功能需求分模块进行实现。 本书适合具有一定编程基础并对大数据感兴趣的读者
本书基于流行稳定版Flink 1.13进行讲解,从Flink数据处理思想开始讲起,带领读者深入理解Flink的基本架构,进而由浅入深结合具体案例进行讲解,详细剖析了Flink中DataStream API的使用,并对Flink中的时间语义、状态、容错机制等重要概念进行了详尽的阐释。同时,本书还对实际开发过程中常用的Flink SQL、CEP等高层级API进行了细致讲解,以电商网站中的实际应用为场景,提供了大量的代码实现。本书分为12章:第1~5章,带领读者初步认识Flink并编写基本的Flink程序;第6~10章,深入探讨了Flink内部的高级应用。第11~12章,讲解了Flink提供的扩展功能。本书适用于大数据的学习者与从业人员,以及院校大数据相关专业的学生,也是大数据学习的书籍。
“空间数据库”是地理信息科学、测绘工程等相关专业的必修课程,而纵观目前有关空间数据库及其实验指导的教材,内容多为理论知识,操作性有待加强,对于本科生而言学习起来较为吃力。因此,陈鲁皖、王卫红主编的《空间数据库实验指导教程》在编写过程中本着通俗易懂、详细可行的原则,对于关系数据库建库及其管理系统开发、空间数据库建库及其管理系统开发的各个流程环节进行了翔实的描述,并使用大量的图片进行说明,步骤清晰、层次分明,具有很强的可操作性。本书既可作为地理信息科学和测绘工程本科阶段的实验指导书,也可作为交通工程、城市规划等相关专业的辅导教材,还可作为相关部门工作人员的自学教材。
数据结构教程(第3版) 第3版第2次印刷
本书是一本系统介绍大数据可视化技术的图书。书中首先阐述了大数据的可视化技术的基本概念以及相关的基础理论知识,然后采用理论与实践相结合的方式,针对实际应用中的各种不同类型的数据,包括时间数据,比例数据,关系数据,文本数据,复杂数据,介绍相应的可视化理论和操作方法,*后,介绍了数据可视化在各个领域中的应用。本书实例丰富,图文并茂,叙述简明,重点突出。作者专门收集和整理了相关的课程案例、典型数据和实验指导手册,帮助读者深入学习大数据可视化中的各种技术知识。本书可以作为高校计算机、数据分析、大数据等相关专业学生的教学用书,对于从事数据可视化、数据分析的技术人员也有较大的参考价值。
《数据分析(第2版)》介绍了数据分析的基本内容与方法,其特点是既重视数据分析的基本理论与方法的介绍,又强调应用计算机软件SAS进行实际分析和计算能力的培养。主要内容有:数据描述性分析、非参数秩方法、回归分析、主成分分析与因子分析、判别分析、聚类分析、时间序列分析以及常用数据分析方法的SAS过程简介。 《数据分析(第2版)》每章末附有大量实用、丰富的习题,并要求学生独立上机完成。 《数据分析(第2版)》可作为高等院校信息科学及数理统计专业的本科生教材,也可供有关专业的研究生及工程技术人员参考。
本书是普通高等教育“十一五”*规划教材的再版。 作为数据库理论的实验指导教材,本书主要以大型数据库管理系统SQLServer 2008和数据库设计工具PowerDesigner15.1为例,通过详尽的实验和训练来培养学生对数据库的应用、设计、开发及维护的能力。全书共分为基础篇、提高篇、设计篇、训练篇和实例篇5篇。本书好与数据库的理论教材配合使用。 本书的特点是循序渐进、由浅入深。它从细微的验证性实验入手,然后进行关系数据库的设计与维护,直至后设计与开发完整的数据库应用程序,从而使读者不仅了解数据库本身,而且清楚数据库与其他先修及后续课程的联系;不仅理解理论知识,而且能够熟练应用。本书配有大量的训练题目,既便于教师教学,又便于学生自学。 本书可作为高等学校计算机及相关专业的数据库实验教材,也可供从事数据库应用
本书是一本指导读者快速步入华为openGauss开源数据库世界的实战指导书。本书以循序渐进的方式,帮助读者一步一步地轻松掌握openGauss开源数据库。有了这些基础,读者可以 好地学习其他数据库管理系统。 本书由30个实战任务构成:前三个任务是搭建openGauss数据库的实验环境;任务四是openGauss的简单维护;任务五是准备测试数据集;任务六是学习使用openGauss DBMS的客户端工具gsql;任务七到任务二十七则涵盖了openGauss DBMS的方方面面;任务二十八和任务二十九是关系数据库设计的实战;任务三十是搭建openGauss主备数据库以及主备数据库的管理。 本书可以作为openGauss初学者、计算机专业学生学习数据库系统原理与应用的实战指导书,对从事数据库工作的工程技术人员、想快速掌握开源数据库PostgreSQL的技术人员也 有参考价值。
本书从理论、方法、技术和实现等方面系统地阐述了笔式用户界面的概念、模型、数字笔迹计算、开发方法和开发环境、关键应用系统。全文由笔式用户界面概述、笔式用户界面模型、数字笔迹技术、笔式界面软件开发方法和环境以及笔式用户界面的关键应用等内容组成.本书可作为信息科学技术领域高年级本科生或研究生的教材,也可以供从事人机交互方向的科研和技术开发人员参考。
本书以关系数据库管理系统SQL Server 2014作为平台,以商店销售数据库作为主线,全面系统地介绍了数据库原理、数据库系统和数据管理新技术。数据库原理部分包括数据库概述、关系数据库、关系数据库规范化理论和数据库设计;数据库系统部分包括SQL Server数据库基础、创建数据库和创建表、数据定义语言和数据操纵语言、数据查询语言、索引和视图、数据完整性、数据库程序设计、数据库编程技术、事务和锁、系统安全管理、备份和恢复、基于Visual C#和SQL Server数据库的学生管理系统的开发;数据管理新技术部分包括大数据和云计算。本书可作为高等院校计算机及相关专业的教学用书,为读者提供习题答案、教学课件、所有实例的源代码。
《高等职业教育项目课程改革规划教材:关系型数据库基础》共设计了两个项目,主要内容包括数据库设计,数据库的创建和修改,数据表的创建、修改和数据维护,数据查询,数据库备份和恢复,数据库规范化和完整性设计,使用视图操作数据,管理索引,数据库安全性管理。 《高等职业教育项目课程改革规划教材:关系型数据库基础》依据数据库管理和开发人员的岗位基本要求,遵循日常数据库管理系统开发和维护工作的规范和任务流程,以项目为单位,以工作任务为中心来组织学习,让学习者在以项目为载体的综合化情景中学习完整的工作过程,并获得相关的知识和技能。 《高等职业教育项目课程改革规划教材:关系型数据库基础》可作为高等职业院校以及成人教育学院计算机专业数据库方面的教学用书,也可作为参加自学考试或数据库培训
如今企业数字化转型和“互联网+”已成为热门话题。那么,如何开展转型工作,让具体工作可以落到实处呢?由于数字化转型工作的复杂性,很多企业管理者感觉无从下手,市面上也十分缺乏相关的指引和资料。本书介绍的企业架构方法以及多个领先企业和行业数字化案例,可以使读者系统地掌握数字化转型的理论和落地方法,帮助企业完成生死攸关的转型变革。本书回答了“什么是数字经济,什么是数字化转型,什么是数字化转型的关键要素”等问题,并在转型方法方面介绍了数字化企业架构的业务架构、流程、组织、IT架构,详细阐述了金融、零售、医疗、物联网、AI、智能制造等方面近期新的商业模式和技术发展。本书打开了一扇新的数字化转型方法之门,是企业管理者、信息化从业者以及管理咨询服务机构、IT服务公司从业人员、大专院校师生很好的参考资