本书是国际数据管理协会(DAMA国际)组织众多国际专家对过去30多年数据管理领域知识和实践的总结,是市场上综合了数据管理方方面面的一部具有性的基础工具书。从数据治理、数据架构、数据质量、数据安全、主数据管理、参考数据管理、元数据管理、商务智能和数据参考管理、数据建模设计、数据存储和操作、数据集成和互操作、文档和内容管理、大数据、数据管理人员的道德要求等方面介绍了数据管理的知识体系。
这本书对GDPR进行了详细的评论,解释了您需要对数据保护和信息安全制度进行的更改,并确切地告诉您需要采取什么措施以避免严重的经济处罚。产品概述EU GDPR ?C实施和合规性指南是此新数据保护法的清晰而全面的指南,解释了该法规,并以您可以理解的术语列出了数据处理者和控制者的义务。任何组织中接触个人数据的的人员都应该掌握相关知识。
在数据湖仓的所有新增要素中,排名的就是可以利于数据分析和机器学习所用的分析基础设施。分析基础设施包括一众大家广为熟悉的东西,当然也包括一些可能对大家还有些陌生或略带新鲜感的概念。比如包括:元数据、数据血缘、 数据体量的度量 、数据创建的历史记录、数据转换描述。 数据湖仓的第二个新增要素,是识别和使用通用连接器。通用连接器允许合并和比较所有不同来源的数据。如果没有通用连接器,就很难(实际上是几乎不可能)将数据湖仓中的不同数据关联起来。但有了这个中西,就可以关联任何类型的数据。 使用数据湖仓,就有可能实现以往任何其它方式都不可行或不可能实现的某种程度的数据分析和机器学习。 但与其它架构一样,我们需要理解数据湖仓的架构以及它的能力,以便于我们基于这种架构创建数据分析蓝图和开展数据分析规
随着数据被纳入第五生产要素,数据治理已成为推动社会治理进程的重要动力,也是实现高质量数字化转型的重要基础。财务部门是企业的 数据中枢 ,汇聚企业从前端业务到后端财务管理的大量数据,因此在众多企业中,财务数据成了企业整体数据治理落地实践的** 试验基地 。 财务数据治理指从财务视角出发,以资产、负债、所有者权益、收入、费用和利润的会计六要素为核心关联数据,通过一系列与信息相关联的过程来确保决策权和职责分工系统的实现。 财务数据治理的终目标是提升财务相关数据的价值。财务数据治理非常有必要,它是企业实现数字战略的基础,是一个管理体系,包括组织、制度、流程和工具。 这本书将数据治理理论应用于财务管理实践,针对财务工作场景阐释数据治理方法论,总结财务数据管理的六大常见问题,分析五大财务数据问题场
本书在梳理和反思数字化转型和数字治理现状的基础上,以马克思主义政治经济学中有关生产力与生产关系的经典理论为指导,将数字化转型与数字治理之间的互动关系作为切入点,详细解读了数字经济时代的数字化转型和数字治理挑战,提出了数字化转型和数字治理的创新思路,以期走出一条科学思想与人性光辉共同闪耀的数字繁荣之路。其中,在数字化转型方面,基于"技术-社会”互构视角提出了"技术动力”与"结构调适”的数字化转型机制;在数字治理方面,基于当前的治理挑战和治理需求提出了数字治理"三位一体”体系框架。 此外,本书还对数字化转型和数字治理的未来发展进行了展望。
数据结构教程(第3版) 第3版第2次印刷
本书介绍了数据工程的基本概念和理论基础,围绕数据资源建设的规划和管理问题,介绍数据资源规划和管理的概念、特征、作用和功能,系统介绍了数据资源规划理论的发展过程、核心思想基础、主流方法体系和具体实施步骤,以及数据资源管理涉及的治理、质量、集成等理论知识、支撑平台、关键技术和主流工具。本书内容划分为数据工程基础篇、数据资源规划篇、数据资源管理篇三个部分,其中数据工程基础篇涵盖数据工程概述、数据标准、数据模型等内容,数据资源规划篇涵盖数据资源规划理论、规划方法、需求分析、模型构建、实践与工具等内容,数据资源管理篇涵盖数据治理、数据质量管理、数据集成、数据中台等内容。 本书既可以作为高等院校信息管理与信息系统、信息资源管理、大数据工程以及计算机信息管理等专业本科生的教材,还
数据清洗是大数据领域不可缺少的环节,用来发现并纠正数据中可能存在的错误,针对数据审查过程中发现的错误值、缺失值、异常值、可疑数据,选用适当方法进行 清理 ,使 脏 数据变为 干净 数据。本书共分为8章:第1章主要介绍数据清洗的概念、任务和流程,数据标准化概念及数据仓库技术等;第2章主要介绍Windows和类UNIX操作系统下的数据常规格式、数据编码及数据类型转换等;第3章介绍ETL概念、数据清洗的技术路线、ETL工具及ETL子系统等;第4章介绍Excel、Kettle、OpenRefine、DataWrangler和Hawk的安装及使用等;第5章介绍Kettle下文本文件抽取、Web数据抽取、数据库数据抽取及增量数据抽取等;第6章介绍数据清洗步骤、数据检验、数据错误处理、数据质量评估及数据加载;第7章介绍网页结构,利用网络爬虫技术进行数据采集,利用JavaScript技术进行行为日志数据采集
本书共分为5章,系统全面地介绍了MATLAB的基本知识和用法,包括:MATLAB基础简介、向量与矩阵运算、绘图、符号计算、程序设计。本书将MATLAB软件应用于数学、信息与计算科学专业的学习和研究中,解决相关课程中的科学计算、图形绘制、数值模拟与仿真等问题,提高科学计算与研究的效率,使读者具备利用MATLAB软件进行计算机处理、解决实际问题的能力。 本书读者对象为需要数学建模、学术研究分析、理论验证、图形仿真的各专业大学生、研究生,以及教师和科研人员。
《数据结构课程设计》主要围绕数据结构的基本知识点,设计了8个大型综合性练习案例,通过相关背景知识的回顾、题目解析与实现要点的分析以及测试方法分析等,为学生完成综合性的数据结构实践提供参考。《数据结构课程设计》所附光盘内容为这8个课程设计案例的源程序及教材中描述的测试数据。本教材还提供了8个课程设计题目及其简要的提示。这些案例和题目大多取材于程序设计竞赛题,具有较好的趣味性和技巧性。 本教材可作为数据结构课程配套的实验教材,也适合于对C程序设计以及数据结构有初步基础的读者学习数据结构的设计方法和提高编程技巧。
《数据结构教程》是为全国高等院校计算机及相关专业开设数据结构课程而精心组织和编著的一本实用教材,内容覆盖了*计算机科学与技术专业硕士研究生入学统一考试的大纲要求。《数据结构教程》采用C++描述,强调原理阐述与应用结合,避免大段冗长代码,并在每章后增加进阶导读和*研究成果的介绍,引导学有余力的学生进一步自学和本章内容相关的数据结构知识。
《云计算与大数据/应用型本科 物联网专业 十三五 规划教材》在阐述大数据和云计算关系的基础上,介绍了大数据和云计算的基本概念、技术及应用。全书分为基础篇、技术与应用篇和实践篇,主要内容包括:绪论、大数据环境下的云计算架构、大数据关键技术与应用、云存储、云服务与云安全、云计算应用、虚拟化技术、Hadoop和spark平台、分布式文件系统及并行计算框架、分布式数据存储与大数据挖掘。 《云计算与大数据/应用型本科 物联网专业 十三五 规划教材》是结合实际应用及实践过程来讲解相关概念、原理和技术的,实用性较强,适合作为本科院校计算机、大数据及信息管理等相关专业的教材,也可作为相关研究人员、爱好者的参考用书。
本书介绍了公司如何通过数据分析获得策略性见解,提高收益,实现增长。其中,关键的因素是整合能力和端到端能力,包括从商业角度和 IT 角度进行数据管理和分析的能力。作者通过大量的案例还原真实的场景,向读者展示优良的分析系统是如何变革公司业务的。将数据库、内存分析和 Hadoop 整合在一起使用,公司不仅可以提升业绩,还可以减少处理时间,之前需要花费数周或数月的工作现在几个小时或几分钟就可以完成。
本书全面系统地讲解如何规划、设计、构建和管理数据仓库/商务智能解决方案。本书介绍在数据仓库开发项目中如何激励用户,在整个企业范围内更好地驱动决策制定,从专业的开发人员获取详细的指导和*实践经验。本书内容涉及如何选择恰当的组件、构建企业数据模型、配置数据集市和数据仓库、构建数据流并降低风险,还涉及项目开发中变更管理、数据监理和安全方面的问题。
PowerBuilder 10是Sybase公司推出的新一代数据库应用开发前端,它提供了可视化的、面向对象的开发环境,是数据库开发工具中的主流产品,受到广大开发人员的青睐。 本书由浅入深地介绍了PowerBuilder10各个方面的知识,将基础知识和实际操作相结合,让读者轻松掌握各个知识点。本书共分为16章,分别介绍了PowerBuilder 10的开发环境、PowerScript语言、数据库应用的相关知识、窗口对象和控件、菜单、数据窗口、数据管道、Web开发、程序的调试与发布等。本书在讲解这些知识的同时,配合大量的实例及其操作步骤,使读者在实践中加深理解。 本书结构紧凑,内容丰富,讲解循序渐进,读者可以很轻松地掌握其中的知识。本书既可以作为各类院校相关专业的教材,也可以作为具有一定数据库开发工作经验用户的参考资料。
《Hive编程指南》是一本Apache Hive的编程指南,旨在介绍如何使用Hive的SQL方法——HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合。全书通过大量的实例,首先介绍如何在用户环境下安装和配置Hive,并对Hadoop和MapReduce进行详尽阐述,最终演示Hive如何在Hadoop生态系统进行工作。 《Hive编程指南》适合对大数据感兴趣的爱好者以及正在使用Hadoop系统的数据库管理员阅读使用。
卡普廖洛、万普勒、卢森格林编著的《Hive编程指南》是一本ApacheHive的编程指南,旨在介绍如何使用Hive的SQL方法——HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合。 《Hive编程指南》通过大量的实例,首先介绍如何在用户环境下安装和配置Hive,并对Hadoop和MapReduce进行详尽阐述, 终演示Hive如何在Hadoop生态系统进行工作。 《Hive编程指南》适合对大数据感兴趣的爱好者以及正在使用Hadoop系统的数据库管理员阅读使用。
本书全面深入地介绍了数据库系统的相关理论与方法。全书共分为6个部分:第1部分“基本概念”,讲述什么是数据库系统、数据库系统的体系结构、概述关系数据库系统并讲解了SQL语言;第2部分“关系模型”,将关系模型作为现代数据库技术的基础进行全面介绍;第3部分“数据库设计”,主要包括函数依赖、范式在内的设计理论,以及语义模型(E-R模型)两部分内容;第4部分“事务管理”,介绍事务管理相关技术;第5部分“扩展主题”,介绍其他多种数据库相关技术;第6部分“对象、关系和XML”,主要介绍了对象技术对数据库的影响。 本书既可作为高等学校计算机及相关专业学生的教材,亦可供从事计算机应用的工程技术人员参考。
你是否在寻找一本完整介绍Python操纵、处理、提取和压缩结构化数据的指南?本书包含了许多实例分析,通过若干个Python库——包括NumPy,pandas,matplotlib和IPython——为你展示了如何高效地解决大量数据分析的问题。 《Python数据分析(影印版)》由麦金尼撰写,他是pandas库的主要作者。本书也是一本具有实践性的指南,指导那些使用Python进行科学计算的数据密集型应用。它适用于刚刚开始使用Python的分析师,或者是进入科学计算领域的Python程序员。使用IPyth1on交互式shell作为你的主要开发环境学习NumPy(NumericalPython)的基础和高级特性接触patldas库中的数据分析工具。 《Python数据分析(影印版)》内容:使用高性能工具来加载、抽取、转换、合并和改造数据 使用matplotlib来创建散点图和静态或者交互式可视化数据运用pandas的groupby功能来对数据集进行切片、切
数据库项目开发技能是当前软件行业的技能之一。本书根据数据库设计的一般规范,介绍了真实案例的设计过程与所需技术, 使学生能够系统掌握数据库设计知识、 设计流程与设计规范等, 熟练掌握数据库设计工具的使用, 终具备中大型数据库系统设计的能力。 本书详细介绍了6个完整的典型案例, 按照“项目描述”“项目目标”“项目实施”“项目小结与拓展”等流程循序渐进地介绍数据库应用系统开发的步骤, 对复杂系统进行了数据建模与数据库设计等,主次分明, 注重系统性与实用性。本书涵盖了从数据库设计、 建立数据库、 建立与管理基本表、 数据库的增删改查等基础知识, 到数据库的安全性设计、 数据库的维护等实用知识,同时结合各个项目的特点, 对项目进行了总结与扩展。 本书是一本实用性很强的数据库项目开发实训教材, 可作为高等