本书是国际数据管理协会(DAMA国际)组织众多国际专家对过去30多年数据管理领域知识和实践的总结,是市场上综合了数据管理方方面面的一部具有性的基础工具书。从数据治理、数据架构、数据质量、数据安全、主数据管理、参考数据管理、元数据管理、商务智能和数据参考管理、数据建模设计、数据存储和操作、数据集成和互操作、文档和内容管理、大数据、数据管理人员的道德要求等方面介绍了数据管理的知识体系。
本书以达梦数据库管理系统(DM8)为平台,全面、系统地介绍了达梦数据库常用操作和应用方法,包括达梦数据库安装与卸载、常用对象管理、数据查询、数据操作、高级对象管理、安全管理、备份还原、作业管理等。本书突出对操作实践的指导,为了使读者更容易理解书中所介绍的内容,列举了大量详细的例子,既介绍了SQL命令方式的管理方法,又介绍了可视化图形界面的管理方法,便于读者进行操作练习,使读者轻松入门、快速提高,并能在较短时间内基本掌握达梦数据库管理系统及其应用技术。 本书内容全面、举例丰富、操作性强、语言通俗、格式规范,可作为相关专业本科生的教材,也可作为如大专、高职学生,以及广大数据库应用开发人员的参考用书。
本书从需求规划、需求实现到可视化展示等,遵循项目开发的主要流程,全景介绍了电商行业Flink实时数据仓库的搭建过程。在整个项目的搭建过程中,介绍了主要组件的安装部署、需求实现的具体思路、问题的解决方案等,并穿插了大数据和数据仓库相关的理论知识,包括数据仓库的概念介绍、电商业务概述、数据仓库理论介绍和数据仓库建模等。最核心的内容是代码中对Flink的灵活应用,为读者展示了Flink处理数据的多种可能性。本书最后还详细讲解了项目的性能调优技巧和实战案例,帮助读者掌握更多的实战经验。 本书适合具有一定编程基础的读者学习或作为参考资料,通过本书,可以使你快速了解实时数据仓库,全面掌握实时数据仓库的相关技术。
本书基于Flink的稳定版本1.13,从Flink数据处理思想开始讲解,带领读者深入理解Flink的基本架构,进而由浅入深,结合具体案例,详细剖析了Flink中DataStream API的使用,并对Flink中的时间语义、状态、容错机制等重要概念进行了详尽的阐述。另外,本书还对实际开发中常用的Flink SQL、CEP等高层级API进行了细致的讲解,以电商网站中的实际应用为场景,提供了大量的代码实现。本书分为三大部分:第1~5章,带领读者初步认识Flink并编写基本的Flink程序;第6~10章,深入探讨了Flink内部的高级应用;第11~12章,讲解了Flink提供的扩展功能。本书广泛适用于大数据的学习者与从业人员,以及院校大数据相关专业的学生,也可作为大数据学习的参考书。
本书以DM8 为对象,系统地介绍了DM8 数据库的安装和维护,以及达梦数据库主流的两大解决方案:达梦DW数据守护和DMDSC 高可用集群方案。本书演示了基于中标麒麟Linux 平台的大量实战操作。通过本书的学习,读者可以掌握达梦数据库的安装和基础操作,如用户、表空间、普通标、分区表、索引、参数、统计信息的管理操作,也可以系统地掌握达梦数据库的备份和恢复技能,如逻辑备份与恢复、联机备份与恢复、脱机备份与恢复。另外,本书还介绍了达梦DW 数据守护和 DMDSC 高可用集群方案,完善了达梦数据库的运维体系。
数据清洗是大数据领域不可缺少的环节,用来发现并纠正数据中可能存在的错误,针对数据审查过程中发现的错误值、缺失值、异常值、可疑数据,选用适当方法进行 清理 ,使 脏 数据变为 干净 数据。本书共分为8章:第1章主要介绍数据清洗的概念、任务和流程,数据标准化概念及数据仓库技术等;第2章主要介绍Windows和类UNIX操作系统下的数据常规格式、数据编码及数据类型转换等;第3章介绍ETL概念、数据清洗的技术路线、ETL工具及ETL子系统等;第4章介绍Excel、Kettle、OpenRefine、DataWrangler和Hawk的安装及使用等;第5章介绍Kettle下文本文件抽取、Web数据抽取、数据库数据抽取及增量数据抽取等;第6章介绍数据清洗步骤、数据检验、数据错误处理、数据质量评估及数据加载;第7章介绍网页结构,利用网络爬虫技术进行数据采集,利用JavaScript技术进行行为日志数据采集
本书以达梦数据库DM8为蓝本,介绍达梦数据库的存储过程、存储函数、触发器等服务器端程序,以及Java、C、Python、PHP等高级语言基于达梦数据库的应用程序设计方法。本书主要包括:DM SQL程序结构、基本语法;存储过程、存储函数、触发器、包等高级对象的基本语法及应用方法;嵌入式SQL程序Pro *c组成、基本语法及应用方法;基于ODBC、JDBC、.NET Data Provider数据库访问接口标准的应用程序设计方法;PHP、Python、Go等高级语言访问达梦数据库的程序设计方法;达梦数据库数据装载及日志分析接口的程序设计方法。本书内容实用、示例丰富、语言通俗、格式规范,可作为相关专业的教材,也可作为工程技术人员的参考书。
本书以数据库应用系统实现为线索,内容除数据库技术外,还涵盖系统分析、设计、开发和部署方法,并引入 互联网 思维和热点技术。全书以一个完整的 e学习 系统实际案例驱动,采用MySQL和ASP.NET为实验环境,帮助读者通过实际应用理解数据库应用系统的相关知识和开发方法,掌握实践技能,综合运用前沿信息技术实现领域创新应用。本书提供丰富的教学资源,可以登录华信教育资源网(www.hxedu.com.cn)免费获取相关资源包,也可以扫描书中的二维码获取相关资源或观看演示视频。本书通俗易懂、实例鲜活、技术先进,可作为各类高等学校数据库技术、信息系统设计的入门教材,或者作为计算机基础教育较高层次课程的教材,也可以作为数据库应用系统开发实践的技术参考书。
本书以达梦数据库DM8 为蓝本,围绕DM8 性能为什么优化、谁来优化、优化什么、何时优化、优化到什么程度等问题进行详细介绍,从DM8 体系架构入手,分析了DM8 的运行机制,从DM8 的实例优化、I/O 优化、SQL 语句优化3 个方面详细地介绍了影响DM8 性能的核心问题。全书共6 章,内容包括DM8 性能优化概述、DM8体系架构、DM8 调优诊断工具、DM8 实例优化、DM8 I/O 优化和DM8 SQL 语句优化等。同时,本书还将DM8 参数配置文件相关参数、DM8 系统数据字典和DM8 常用动态性能视图作为附录,便于广大读者查阅。本书内容实用、示例丰富、语言通俗、格式规范,可以作为计算机、数据库等专业的教材,也可以作为工程技术人员的参考用书。
中国大数据专家委员会刘鹏教授联合全国上百家高校从事一线教学科研任务的教师,一起编撰高级大数据人才培养从书。本书是丛书之一,其定位是大数据挖掘技术与应用。本书系统地介绍了数据挖掘算法理论与方法、工具和应用,包括经典数据挖掘算法,大数据环境下常用数据挖掘算法的优化,大数据新常态下催生的数据分析方法(如推荐系统、链接分析与网页排序、互联网信息抽取、日志挖掘与查询分析)、工具与应用。本书适合作为相关专业本科和研究生教材。高职高专学校也可以选用部分内容开展教学。本书也很适合作为大数据分析研发人员的自学书籍。
《数据结构教程》是为全国高等院校计算机及相关专业开设数据结构课程而精心组织和编著的一本实用教材,内容覆盖了*计算机科学与技术专业硕士研究生入学统一考试的大纲要求。《数据结构教程》采用C++描述,强调原理阐述与应用结合,避免大段冗长代码,并在每章后增加进阶导读和*研究成果的介绍,引导学有余力的学生进一步自学和本章内容相关的数据结构知识。
21 世纪,互联网行业的爆发开启了全球数据量急剧增长的新时代,数据已经成为驱动企业数字化转型的核心力量。整个数据行业的技术能力不断提升,从数据库到数据仓库,再到开源大数据,都在经济社会中发挥着极其重要的作用。近年来,新兴数据技术与云计算相互辅助,共同发展,诞生了一系列云原生数据服务,让企业能够突破传统模式的局限,专注于业务,降本增效。本书以全球前沿的云原生服务为基础,详细展现了如何将数据存储、数据引入、批量数据处理、实时数据处理、数据仓库、数据可视化和机器学习等核心要素综合起来,逐步构建一个高效的大数据服务平台。
大数据管理与应用主要以信息科学、计算机科学和管理科学等学科为理论基础,其研究内容包括大数据科学基础理论、大数据预处理、大数据计算、大数据管理和分析等。本书力图通过对大数据科学相关数据管理方面内容的综合介绍,面向大数据时代的电子商务智能数据计算领域,从大数据采集、大数据预处理、大数据存储与计算、多源异构大数据分析、大数据知识融合技术和大数据的应用管理等方面说明大数据管理与应用的主要研究内容和应用方向。
本教材依据普通高校信管类专业的培养目标,按学科的课程设置要求,突出应用型、实践性和立体化的特点编写。全书以数据库系统基本概念、关系代数、SQL语言、设计理论与工程设计、实施、维护、、应用发展和系统实例为主线,强调在网络环境、知识经济和信息经济环境下数据库系统所表现出的特点。本书结构新颖,内容详实,案例丰富,实用性较强,既可作为普通高校信息管理与信息系统、管理科学与工程、工商管理等经管类相关专业的教材,也可供企事业单位和信息系统相关人员作为参考书使用。随书配备的光盘包含丰富的习题与案例,电子教案、课程设计、优秀作业展示等资料,便于教学和自学。
本书按照需求规划、需求实现、可视化的流程进行编排,通过项目开发的主要流程,介绍数据仓库的搭建过程。在整个数据仓库的搭建过程中,本书介绍了主要组件的安装部署、需求实现的具体思路,以及各种问题的解决方案等,并在其中穿插了许多与大数据和数据仓库相关的理论知识,包括数据仓库的概念、电商业务概述、数据仓库理论和数据仓库建模等。 本书共14章,其中,第1~3章是项目的前期准备阶段,主要介绍了数据仓库的概念和搭建需求,并初步搭建了本数据仓库项目所需的基本环境;第4~7章是项目的核心部分,详细介绍了数据仓库的建模理论,并完成了数据从采集到分层搭建的全过程,是本书的重点部分;第8~14章是对数据治理各功能模块的实现,针对数据治理的不同功能需求分模块进行实现。 本书适合具有一定编程基础并对大数据感兴趣的读者
本书基于流行稳定版Flink 1.13进行讲解,从Flink数据处理思想开始讲起,带领读者深入理解Flink的基本架构,进而由浅入深结合具体案例进行讲解,详细剖析了Flink中DataStream API的使用,并对Flink中的时间语义、状态、容错机制等重要概念进行了详尽的阐释。同时,本书还对实际开发过程中常用的Flink SQL、CEP等高层级API进行了细致讲解,以电商网站中的实际应用为场景,提供了大量的代码实现。本书分为12章:第1~5章,带领读者初步认识Flink并编写基本的Flink程序;第6~10章,深入探讨了Flink内部的高级应用。第11~12章,讲解了Flink提供的扩展功能。本书适用于大数据的学习者与从业人员,以及院校大数据相关专业的学生,也是大数据学习的书籍。
数据结构教程(第3版) 第3版第2次印刷
本书是一本系统介绍大数据可视化技术的图书。书中首先阐述了大数据的可视化技术的基本概念以及相关的基础理论知识,然后采用理论与实践相结合的方式,针对实际应用中的各种不同类型的数据,包括时间数据,比例数据,关系数据,文本数据,复杂数据,介绍相应的可视化理论和操作方法,*后,介绍了数据可视化在各个领域中的应用。本书实例丰富,图文并茂,叙述简明,重点突出。作者专门收集和整理了相关的课程案例、典型数据和实验指导手册,帮助读者深入学习大数据可视化中的各种技术知识。本书可以作为高校计算机、数据分析、大数据等相关专业学生的教学用书,对于从事数据可视化、数据分析的技术人员也有较大的参考价值。
本书是一本为Scala和Spark初学者准备的入门书籍,很适合准备踏入大数据开发领域的新手和其他对此感兴趣的读者阅读。本书在内容上遵循从宏观到微观、由浅入深递进式的讲解方式,涵盖了Spark入门开发所需的Scala基础知识。具体来说,本书按照如下顺序进行介绍。 首先,前三章从宏观上介绍了Scala语言,包括初识Scala、安装Scala及使用Scala Shell工具。 其次,第四章到第十二章是本书的重点,详细介绍了与Spark开发密切相关的Scala语法,包括变量、数据类型、条件语句、代码块、函数、集合、循环、类和包,以及与异常处理相关的内容,每一章都对某个语法点进行深入探索。第十三章介绍了如何把写好的Scala代码进行编译和打包。 后,第十四章介绍了Spark的入门实践,将前面章节所学到的Scala知识运用到Spark开发中。 此外,本书提供了丰富生动的代码示例和章末练习,
本书详细介绍了数据库管理操作技术及应用程序设计的基本方法。全书共14章,第1、2章介绍数据处理和数据库系统的基本概念,并对微软公司的数据库产品Visual FoxPro进行了概述,使读者对数据库有一个大致的了解。第3~7章首先介绍数据类型、表达式、函数等基础知识,然后介绍数据库设计器、表、索引、SQL语言、视图和查询等概念和相应的操作方式,掌握这部分知识之后读者可以使用数据库系统进行常用的数据管理和操作。第8~14章介绍Visual FoxPro结构化编程、项目的建立和管理、面向对象编程基础、表单设计及其控件的使用、菜单系统以及如何创建输出报表等内容,通过这部分的学习,读者可以灵活运用Visual FoxPro可视化编程的特性,掌握创建普通数据管理系统的快捷方法和数据管理应用程序的设计方法。 本书适合作为高等院校非计算机专业的数据库课程
大数据可视化是一门理论性和实践性都很强的课程。《大数据可视化》针对计算机、信息管理、经济管理和其他相关专业学生的发展需求,系统、全面地介绍大数据可视化的基本知识和技能,详细介绍了数据可视化之美、Excel数据可视化方法与应用、数据引导可视化设计、数据可视化过程、数据可视化组织、Tableau应用初步、Tableau数据管理、Tableau可视化分析、Tableau仪表板与故事以及Tableau地图分析与发布等内容,共11章,各章均配套设计了导读案例、实验与思考等内容,具有较强的系统性、可读性和实用性。 《大数据可视化》为高等院校相关专业“大数据可视化”“数据媒体设计”等课程全新设计编写,是具有丰富实践特色的主教材。还可供有一定实践经验的软件开发人员、管理人员参考和作为继续教育的教材。