SQL是使用*广泛的数据库语言,绝大多数重要的 DBMS 支持 SQL。本书由浅入深地讲解了SQL的基本概念和语法,涉及数据的排序、过滤和分组,以及表、视图、联结、子查询、游标、存储过程和触发器等内容,实例丰富,便于查阅。新版对书中的案例进行了全面的更新,并增加了章后挑战题,便于读者巩固所学知识。
本书是国际数据管理协会(DAMA国际)组织众多国际专家对过去30多年数据管理领域知识和实践的总结,是市场上综合了数据管理方方面面的一部具有性的基础工具书。从数据治理、数据架构、数据质量、数据安全、主数据管理、参考数据管理、元数据管理、商务智能和数据参考管理、数据建模设计、数据存储和操作、数据集成和互操作、文档和内容管理、大数据、数据管理人员的道德要求等方面介绍了数据管理的知识体系。
这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第壹部分(第1~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数据的管理方式
本书围绕精益创业展开讨论,融合了精益创业法、客户开发、商业模式画布和敏捷/持续集成的精华。本书汇聚了100多位创始人、投资人、内部创业者和创新者的成功创业经验,呈现了 30 多个极具价值的案例分析,可以为各阶段的创业者提供行为准则。 如果你是一名创业者,或者你是一名产品开发、产品管理、市场营销、公共关系和投资领域的商务专业人员,那么本书不容错过。
数据作为生产要素已经被提升至国家战略层面,如何激活数据要素、体现数据价值,如何有效利用数据赋能数字化转型,成为当前炙手可热的问题。本书厘清了数据治理、数据管理和数字化转型的关系,介绍了数据治理核心工作中经常出现的问题和优秀实践,明确了数字化转型的核心内容、方法路径和评估机制,通过大型企业数据治理或数字化转型案例为读者提供有价值的参考。本书适合首席执行官、首席信息官、首席数据官等从事企业管理和数据管理工作的人员阅读,有助于提升对数据治理和数字化转型的认识,为在组织中有效开展数据治理和数字化转型工作提供思路和借鉴。
这本书对GDPR进行了详细的评论,解释了您需要对数据保护和信息安全制度进行的更改,并确切地告诉您需要采取什么措施以避免严重的经济处罚。产品概述EU GDPR ?C实施和合规性指南是此新数据保护法的清晰而全面的指南,解释了该法规,并以您可以理解的术语列出了数据处理者和控制者的义务。任何组织中接触个人数据的的人员都应该掌握相关知识。
这是一本教我们如何制作完美可视化图表,挖掘大数据背后意义的书。作者认为,可视化是一种媒介,向我们揭示了数据背后的故事。他循序渐进、深入浅出地道出了数据可视化的步骤和思想。本书让我们知道了如何理解数据可视化,如何探索数据的模式和寻找数据间的关联,如何选择适合自己的数据和目的的可视化方式,有哪些我们可以利用的可视化工具以及这些工具各有怎样的利弊。 作者给我们提供了丰富的可视化信息以及查看、探索数据的多元视角,丰富了我们对于数据、对于可视化的认知。对那些对设计和分析过程感兴趣的人,本书无疑就是一本书。
随着数据被纳入第五生产要素,数据治理已成为推动社会治理进程的重要动力,也是实现高质量数字化转型的重要基础。财务部门是企业的 数据中枢 ,汇聚企业从前端业务到后端财务管理的大量数据,因此在众多企业中,财务数据成了企业整体数据治理落地实践的** 试验基地 。 财务数据治理指从财务视角出发,以资产、负债、所有者权益、收入、费用和利润的会计六要素为核心关联数据,通过一系列与信息相关联的过程来确保决策权和职责分工系统的实现。 财务数据治理的终目标是提升财务相关数据的价值。财务数据治理非常有必要,它是企业实现数字战略的基础,是一个管理体系,包括组织、制度、流程和工具。 这本书将数据治理理论应用于财务管理实践,针对财务工作场景阐释数据治理方法论,总结财务数据管理的六大常见问题,分析五大财务数据问题场
在数据湖仓的所有新增要素中,排名的就是可以利于数据分析和机器学习所用的分析基础设施。分析基础设施包括一众大家广为熟悉的东西,当然也包括一些可能对大家还有些陌生或略带新鲜感的概念。比如包括:元数据、数据血缘、 数据体量的度量 、数据创建的历史记录、数据转换描述。 数据湖仓的第二个新增要素,是识别和使用通用连接器。通用连接器允许合并和比较所有不同来源的数据。如果没有通用连接器,就很难(实际上是几乎不可能)将数据湖仓中的不同数据关联起来。但有了这个中西,就可以关联任何类型的数据。 使用数据湖仓,就有可能实现以往任何其它方式都不可行或不可能实现的某种程度的数据分析和机器学习。 但与其它架构一样,我们需要理解数据湖仓的架构以及它的能力,以便于我们基于这种架构创建数据分析蓝图和开展数据分析规
《机器学习数学基础:概率论与数理统计》从基础的概率统计知识讲起,逐步深入到机器学习以及深度学习的分类算法,并在后配合深度学习的实战案例,介绍了softmax回归函数在手写体图像识别中的具体应用。通过手动编辑代码,让读者更深入地了解概率在人工智能领域的重大作用。全书分为16章,涵盖的内容主要有概率统计在人工智能发展过程中的重要影响;随机试验及概率的概念;随机变量的分布及多维随机变量的分布情况;贝叶斯算法;正态分布现象;随机变量的数字特征;机器学习中的损失函数;大数定律;样本及抽样分布的做法;参数估计的概念;马尔科夫链;过拟合与欠拟合问题及解决方法;Tensorflow概述及安装方法;卷积神经网络介绍;实验演练之手写体数字识别等。 《机器学习数学基础:概率论与数理统计》配有大量的插图,以身边的生活现象
本书是MySQL领域的经典之作,拥有广泛的影响力。第3版更新了大量的内容,不但涵盖了*MySQL 5.5版本的新特性,也讲述了关于固态盘、高可扩展性设计和云计算环境下的数据库相关的新内容,原有的基准测试和性能优化部分也做了大量的扩展和补充。全书共分为16章和6个附录,内容涵盖MySQL架构和历史,基准测试和性能剖析,数据库软硬件性能优化,复制、备份和恢复,高可用与高可扩展性,以及云端的MySQL和MySQL相关工具等方面的内容。每一章都是相对独立的主题,读者可以有选择性地单独阅读。 本书不但适合数据库管理员(DBA)阅读,也适合开发人员参考学习。不管是数据库新手还是专家,相信都能从本书有所收获。
使用机器学习技术解决实际应用问题涉及模型的建立、训练及评估等步骤。优化算法常被用于训练模型的参数,是机器学习的重要组成部分。机器学习模型的训练可以建模成无约束优化问题或带约束优化问题,约束可以为模型增加 多的先验知识。基于梯度的算法(例如加速梯度法、随机梯度法等)是求解无约束优化问题的常用方法,而交替方向乘子法(ADMM)则是求解带约束优化问题的有力工具。《BR》 本书概述了机器学习中ADMM的新进展。书中全面介绍了各种情形下的ADMM,包括确定性和随机性的算法、集中式和分布式的算法,以及求解凸问题和非凸问题的算法,深入介绍了各个算法的核心思想,并为算法的收敛性和收敛速度提供了详细的证明。
《DAMA数据管理知识体系指南(原书第2版)》是DAMA国际(DAMA International)组织专家对过去30多年数据管理领域知识和实践的总结,是一部综合了数据管理方方面面具有权威性的基础工具书。本书从数据治理、数据架构、数据质量、数据安全、主数据管理、参考数据管理、元数据管理、商务智能和数据参考管理、数据建模设计、数据存储和操作、数据集成和互操作、文档和内容管理、大数据、数据管理人员的道德要求等方面介绍了数据管理的知识体系。DMBOK已经成为数据管理领域的“圣经”,是指导个人知识体系完善和企业数据管理能力建设的重要文献。本书适合各种组织负责信息化和数字化转型的领导(如CIO、CDO),从事数据管理的各种技术及业务人员,工作中涉及数据的会计、法律、咨询、教育、政务等领域的人士阅读。同时,也可作为高校MBA和计算机专业教学用
随着MySQL越来越受欢迎,关于如何通过MySQL解决具体问题的疑问越来越多,这本书也应运而生。这本手册为需要快速的解决方案或技术,但没有时间从零开始解决MySQL问题的程序员或专家提供大量简短且重点突出的代码,数百个完整的示例,以及清晰简明的解说。 本书的主要内容包括: ?连接到服务器、执行查询,并获取结果。从MySQL服务器获取数据。存储、获取以及处理字符串。使用日期和时间。排序查询结果,生成汇总信息。评估数据集的特征。编写存储函数和过程。使用存储例程、触发器和计划事件。执行基本的MySQL管理员任务。理解MySQL的基础监视知识。
本书以大数据发展的历史、特征、发展趋势为切入点,介绍了大数据产业的背景、大数据的显著特征、大数据的构成以及大数据带来的机遇与挑战,重点介绍了大数据采集、存储、管理及数据分析与挖掘的前沿技术,并分析了大数据在各行各业及政府机构间的具体应用案例,阐明了大数据对指导实际工作与生活的现实意义与作用。本书系作者根据自己多年的研究教学经验编著而成,结构体系科学,内容全面合理,理论联系实际,案例丰富,有助于广大读者理解大数据的基本内容、核心技术、使用机制等。
本书介绍了数据工程的基本概念和理论基础,围绕数据资源建设的规划和管理问题,介绍数据资源规划和管理的概念、特征、作用和功能,系统介绍了数据资源规划理论的发展过程、核心思想基础、主流方法体系和具体实施步骤,以及数据资源管理涉及的治理、质量、集成等理论知识、支撑平台、关键技术和主流工具。本书内容划分为数据工程基础篇、数据资源规划篇、数据资源管理篇三个部分,其中数据工程基础篇涵盖数据工程概述、数据标准、数据模型等内容,数据资源规划篇涵盖数据资源规划理论、规划方法、需求分析、模型构建、实践与工具等内容,数据资源管理篇涵盖数据治理、数据质量管理、数据集成、数据中台等内容。 本书既可以作为高等院校信息管理与信息系统、信息资源管理、大数据工程以及计算机信息管理等专业本科生的教材,还
本书以数据要素化治理的理论方法与工程实践为主线,内容按照概念篇、原理篇和工程篇依次展开。概念篇在对数据、数据要素相关概念及其演进过程进行系统梳理的基础上,首次对“数据要素”“数据要素化”进行了明确定义,并基于传统生产要素市场化配置规律,提出数据要素化治理的基本思路。在原理篇,定义了数据元件作为连接数据供需两端的“中间态”和数据要素交易流通的标的物,进而构建基于数据元件的数据要素流通模型、数据要素化安全模型以及数据要素化治理系统模型。在工程篇,详细阐述了制度体系、技术体系和市场体系“三位一体”的解决方案,并进行实践案例剖析,验证数据要素化治理模型及三大体系的可行性、有效性及可复制性。
数据治理是指通过建立组织架构,明确相关部门职责要求,制定和实施系统化的制度、流程和方法,确保数据统一管理、高效运行,并在经营管理中充分发挥价值的动态过程。数据治理有助于控制数据的开发和使用,降低与数据相关的风险,使相关主体可以战略性地利用数据,并从数据治理中获得价值。 数据治理应从以下三个方面进行理解: ,数据治理的对象是数据,即任何以电子或非电子形式记录的信息,以银行业金融机构为例,包括所有分支机构和附属机构的内部数据和外部数据,覆盖业务经营、风险管理和内部控制流程中的全部数据。第二,数据治理的目标是实现数据价值。数据治理实质上是将数据视为资产,即可以被拥有、使用并产生价值的经济资源。第三,数据治理应关注三个重点:一是数据治理架构,数据治理架构是开展数据治理工作的前提和基
这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第一部分(第1~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数据的管理方式和
编写本书的目的是使读者可以在最z短时间内掌握Excel 数据分析。本书以数据分析的整体流程和知识难易度来安排各章内容及其在全书中的次序,每一章内容都紧密围绕数据分析展开。全书共10 章,每天学习一章,10 天就能学会Excel 中的大多数数据分析工具的用法和技巧。 本书的主要内容包括数据分析的基本概念和流程、Excel 中的数据分析工具的功能和特点、导入外部数据和输入不同类型的数据、修复有问题的数据、设置数据格式、排序、筛选、分类汇总、数据透视表、公式和函数基础知识、提取和格式化文本、汇总和统计数据、计算日期、模拟分析、单变量求解、规划求解、分析工具库、图表的基本概念和基础操作、创建不同类型的图表、导入和刷新数据、使用Power Query 编辑器整理数据、使用Power Pivot 创建数据模型、创建计算列和度量值、销售分析和客户分析等
大数据时代的武器装备情报分析在信息技术特别是人工智能技术飞速发展的推动下,正面临新挑战、呈现新特点、孕育新模式。如何将大数据分析技术与武器装备情报这对具有天然底层关联的东西结合起来研究,有很多维度可以破解。本书从情报大数据分析技术维度出发,着眼大数据背景下的情报类型需求,构建情报分析技术体系架构,剖析快速决策技术、噪声数据处理技术、概念漂移处理技术的底层和应用,并通过综合案例加以应用。 本书以推进武器装备情报大数据分析技术发展为出发点,力求为情报分析、大数据分析、武器装备研发等领域的科学研究提供有益参考。
阅读本书可以学习使用Python对数据集进行操作、处理、清洗和规整。第3版针对Python3.10和pandas1.4进行了更新,并通过实操讲解和实际案例向读者展示了如何高效地解决一系列数据分析问题。读者将在阅读过程中学习新版本的pandas、NumPy、IPython和Jupyter。 本书作者Wes McKinney是Python pandas项目的创始人。本书对Python数据科学工具的介绍既贴近实战又内容新颗,非常适合刚开始学习Python的数据分析师或刚开始学习数据科学和科学计算的Python程序员阅读。读者可以从GitHub获取数据文件和相关资料。 学完本书,你将能够: ·使用Jupyter notebook和IPython shell进行探索性计算。 ·掌握NumPy的基础功能和高级功能。 ·掌握pandas库中的数据分析工具。 ·使用灵活的工具对数据进行加载、清洗、转换、合并和重塑。 ·使用matplotlib进行信息可视化。 ·使用pandas的groupBy功能对数据集进行切片、切