本书是国际数据管理协会(DAMA国际)组织众多国际专家对过去30多年数据管理领域知识和实践的总结,是市场上综合了数据管理方方面面的一部具有性的基础工具书。从数据治理、数据架构、数据质量、数据安全、主数据管理、参考数据管理、元数据管理、商务智能和数据参考管理、数据建模设计、数据存储和操作、数据集成和互操作、文档和内容管理、大数据、数据管理人员的道德要求等方面介绍了数据管理的知识体系。
本书以达梦数据库管理系统(DM8)为平台,全面、系统地介绍了达梦数据库常用操作和应用方法,包括达梦数据库安装与卸载、常用对象管理、数据查询、数据操作、高级对象管理、安全管理、备份还原、作业管理等。本书突出对操作实践的指导,为了使读者更容易理解书中所介绍的内容,列举了大量详细的例子,既介绍了SQL命令方式的管理方法,又介绍了可视化图形界面的管理方法,便于读者进行操作练习,使读者轻松入门、快速提高,并能在较短时间内基本掌握达梦数据库管理系统及其应用技术。 本书内容全面、举例丰富、操作性强、语言通俗、格式规范,可作为相关专业本科生的教材,也可作为如大专、高职学生,以及广大数据库应用开发人员的参考用书。
本书从需求规划、需求实现到可视化展示等,遵循项目开发的主要流程,全景介绍了电商行业Flink实时数据仓库的搭建过程。在整个项目的搭建过程中,介绍了主要组件的安装部署、需求实现的具体思路、问题的解决方案等,并穿插了大数据和数据仓库相关的理论知识,包括数据仓库的概念介绍、电商业务概述、数据仓库理论介绍和数据仓库建模等。最核心的内容是代码中对Flink的灵活应用,为读者展示了Flink处理数据的多种可能性。本书最后还详细讲解了项目的性能调优技巧和实战案例,帮助读者掌握更多的实战经验。 本书适合具有一定编程基础的读者学习或作为参考资料,通过本书,可以使你快速了解实时数据仓库,全面掌握实时数据仓库的相关技术。
本书以DM8 为对象,系统地介绍了DM8 数据库的安装和维护,以及达梦数据库主流的两大解决方案:达梦DW数据守护和DMDSC 高可用集群方案。本书演示了基于中标麒麟Linux 平台的大量实战操作。通过本书的学习,读者可以掌握达梦数据库的安装和基础操作,如用户、表空间、普通标、分区表、索引、参数、统计信息的管理操作,也可以系统地掌握达梦数据库的备份和恢复技能,如逻辑备份与恢复、联机备份与恢复、脱机备份与恢复。另外,本书还介绍了达梦DW 数据守护和 DMDSC 高可用集群方案,完善了达梦数据库的运维体系。
本书基于Flink的稳定版本1.13,从Flink数据处理思想开始讲解,带领读者深入理解Flink的基本架构,进而由浅入深,结合具体案例,详细剖析了Flink中DataStream API的使用,并对Flink中的时间语义、状态、容错机制等重要概念进行了详尽的阐述。另外,本书还对实际开发中常用的Flink SQL、CEP等高层级API进行了细致的讲解,以电商网站中的实际应用为场景,提供了大量的代码实现。本书分为三大部分:第1~5章,带领读者初步认识Flink并编写基本的Flink程序;第6~10章,深入探讨了Flink内部的高级应用;第11~12章,讲解了Flink提供的扩展功能。本书广泛适用于大数据的学习者与从业人员,以及院校大数据相关专业的学生,也可作为大数据学习的参考书。
达梦实时同步工具是数据库行业内数据实时同步的一个标杆。本书以达梦实时同步工具4.0为蓝本,介绍达梦数据库本地和异地容灾的解决方案,主要包括达梦实时同步工具的技术原理、特点、系统架构、配置和使用方法,以及日常运维和典型案例分析等。本书语言流畅、通俗易懂,并介绍了具体应用案例,是深入了解达梦数据中心解决方案的基础指南,具有较高的参考价值。本书可以作为计算机、数据库等专业的教材,也可以作为工程技术人员的参考用书。
数据清洗是大数据领域不可缺少的环节,用来发现并纠正数据中可能存在的错误,针对数据审查过程中发现的错误值、缺失值、异常值、可疑数据,选用适当方法进行 清理 ,使 脏 数据变为 干净 数据。本书共分为8章:第1章主要介绍数据清洗的概念、任务和流程,数据标准化概念及数据仓库技术等;第2章主要介绍Windows和类UNIX操作系统下的数据常规格式、数据编码及数据类型转换等;第3章介绍ETL概念、数据清洗的技术路线、ETL工具及ETL子系统等;第4章介绍Excel、Kettle、OpenRefine、DataWrangler和Hawk的安装及使用等;第5章介绍Kettle下文本文件抽取、Web数据抽取、数据库数据抽取及增量数据抽取等;第6章介绍数据清洗步骤、数据检验、数据错误处理、数据质量评估及数据加载;第7章介绍网页结构,利用网络爬虫技术进行数据采集,利用JavaScript技术进行行为日志数据采集
本书较系统全面地阐述了数据库系统的基础理论、基本技术和基本方法,既可以作为高等院校计算机、软件工程、信息安全、信息管理与信息系统、信息与计算科学等相关专业本科生数据库课程的教材,也可以作为电气工程相关专业研究生数据库课程及电力企业信息化教材
本书以数据库应用系统实现为线索,内容除数据库技术外,还涵盖系统分析、设计、开发和部署方法,并引入 互联网 思维和热点技术。全书以一个完整的 e学习 系统实际案例驱动,采用MySQL和ASP.NET为实验环境,帮助读者通过实际应用理解数据库应用系统的相关知识和开发方法,掌握实践技能,综合运用前沿信息技术实现领域创新应用。本书提供丰富的教学资源,可以登录华信教育资源网(www.hxedu.com.cn)免费获取相关资源包,也可以扫描书中的二维码获取相关资源或观看演示视频。本书通俗易懂、实例鲜活、技术先进,可作为各类高等学校数据库技术、信息系统设计的入门教材,或者作为计算机基础教育较高层次课程的教材,也可以作为数据库应用系统开发实践的技术参考书。
本书以达梦数据库DM8为蓝本,介绍达梦数据库的存储过程、存储函数、触发器等服务器端程序,以及Java、C、Python、PHP等高级语言基于达梦数据库的应用程序设计方法。本书主要包括:DM SQL程序结构、基本语法;存储过程、存储函数、触发器、包等高级对象的基本语法及应用方法;嵌入式SQL程序Pro *c组成、基本语法及应用方法;基于ODBC、JDBC、.NET Data Provider数据库访问接口标准的应用程序设计方法;PHP、Python、Go等高级语言访问达梦数据库的程序设计方法;达梦数据库数据装载及日志分析接口的程序设计方法。本书内容实用、示例丰富、语言通俗、格式规范,可作为相关专业的教材,也可作为工程技术人员的参考书。
本书致力于深入探讨和系统构建元宇宙这一新兴概念及其背后的理论与技术框架。全书内容详尽且前沿,不仅涵盖了元宇宙的基本定义、起源与发展脉络,更深度剖析了其关键技术支柱,包括但不限于扩展现实(XR)、人工智能、物联网、区块链、5G 通信、大数据和云计算等。本书针对元宇宙的生态系统建设进行了全方位解读,探讨了元宇宙如何打破现实与虚拟之间的界限,创建一个高度沉浸、实时互动并具有完整经济系统的新型网络空间。同时,前瞻性地描绘了元宇宙对未来生活方式、商业模式、社会治理乃至全球科技格局的影响与变革。本书适合的读者群体广泛,特别针对以下几类人群:对科技趋势保持敏感的行业决策者、科技从业者、教育工作者、科研工作者、对未来生活充满好奇的普通读者。整体而言,本书旨在用通俗易懂的语言,结合实例和专业见解,
本书以达梦数据库DM8 为蓝本,围绕DM8 性能为什么优化、谁来优化、优化什么、何时优化、优化到什么程度等问题进行详细介绍,从DM8 体系架构入手,分析了DM8 的运行机制,从DM8 的实例优化、I/O 优化、SQL 语句优化3 个方面详细地介绍了影响DM8 性能的核心问题。全书共6 章,内容包括DM8 性能优化概述、DM8体系架构、DM8 调优诊断工具、DM8 实例优化、DM8 I/O 优化和DM8 SQL 语句优化等。同时,本书还将DM8 参数配置文件相关参数、DM8 系统数据字典和DM8 常用动态性能视图作为附录,便于广大读者查阅。本书内容实用、示例丰富、语言通俗、格式规范,可以作为计算机、数据库等专业的教材,也可以作为工程技术人员的参考用书。
本书以 的开源关系数据库和主流的非关系NoSQL数据库为背景,介绍数据库系统原理及其应用开发技术。全书共7章,主要内容包括数据库系统概论、数据库关系模型、数据库SQL操作语言、数据库设计与实现、数据库管理、数据库编程、NoSQL数据库技术。本书除介绍数据库系统原理外,还针对数据库应用系统开发,介绍数据库建模设计、数据库SQL编程、数据库应用程序Java编程,以及NoSQL数据库应用实践方法。 本书取材新颖、内容详实、案例丰富,在数据库知识结构组织、项目案例设计、课后习题编写等方面强调工程教育特点。针对高水平数据库人才培养需求,本书突出对学生数据库设计能力、数据库编程能力、数据库管理能力及数据库新技术应用能力的培养。本书配套提供课程教学PPT、案例设计模型、案例编程代码、习题参考答案、课程教学大纲等学习资源。 本
中国大数据专家委员会刘鹏教授联合全国上百家高校从事一线教学科研任务的教师,一起编撰高级大数据人才培养从书。本书是丛书之一,其定位是大数据挖掘技术与应用。本书系统地介绍了数据挖掘算法理论与方法、工具和应用,包括经典数据挖掘算法,大数据环境下常用数据挖掘算法的优化,大数据新常态下催生的数据分析方法(如推荐系统、链接分析与网页排序、互联网信息抽取、日志挖掘与查询分析)、工具与应用。本书适合作为相关专业本科和研究生教材。高职高专学校也可以选用部分内容开展教学。本书也很适合作为大数据分析研发人员的自学书籍。
本书描绘了数字科技为我们的生活、工作、教育和娱乐带来的各种冲击和其中值得深思的问题,是跨入数字化新世界的很好指南。英文版曾高居《纽约时报》畅销书排行榜。“信息的DNA”正在迅速取代原子而成为人
21 世纪,互联网行业的爆发开启了全球数据量急剧增长的新时代,数据已经成为驱动企业数字化转型的核心力量。整个数据行业的技术能力不断提升,从数据库到数据仓库,再到开源大数据,都在经济社会中发挥着极其重要的作用。近年来,新兴数据技术与云计算相互辅助,共同发展,诞生了一系列云原生数据服务,让企业能够突破传统模式的局限,专注于业务,降本增效。本书以全球前沿的云原生服务为基础,详细展现了如何将数据存储、数据引入、批量数据处理、实时数据处理、数据仓库、数据可视化和机器学习等核心要素综合起来,逐步构建一个高效的大数据服务平台。