本书是国际数据管理协会(DAMA国际)组织众多国际专家对过去30多年数据管理领域知识和实践的总结,是市场上综合了数据管理方方面面的一部具有性的基础工具书。从数据治理、数据架构、数据质量、数据安全、主数据管理、参考数据管理、元数据管理、商务智能和数据参考管理、数据建模设计、数据存储和操作、数据集成和互操作、文档和内容管理、大数据、数据管理人员的道德要求等方面介绍了数据管理的知识体系。
本书以统计学史上著名人物的伟大成就为脉络,将数据分析这一学科的发展历程娓娓道来。从开普勒仰望星空拉开统计学序幕,贝叶斯提出主观概率,到人工智能、深度学习逐步渗透今天的日常生活。本书带领读者在数据科学的熠熠星光下,看透大数据的深邃内核。
Access是Microsoft Office套件中的一员,是一个数据库管理程序,用于管理数据。本书以Access 2021软件为平台,从管理人员和办公人员的工作需求出发,配合大量典型实例,全面而系统地讲解Access 2021在数据管理中的应用,帮助用户轻松高效地完成数据库的创建与维护。 本书以 完全掌握Access 为出发点来安排内容,全书共6篇,分为15章。第1篇为基础学习篇(第1~4章):本篇主要针对初学者,从零开始,系统并全面地讲解Access 2021的基本操作、数据库的创建与使用、数据表的创建与使用,以及规范数据库的方法。第2篇为查询分析篇(第5~6章):介绍在Access 2021中创建查询、编辑查询字段、使用SQL查询、嵌套查询和多表查询等内容。第3篇为窗体报表篇(第7~9章):介绍在Access 2021中创建普通窗体、创建主/次窗体、在窗体中添加控件和编辑控件,以及创建和分析报表的方法。
《MySQL是怎样运行的:从根儿上理解 MySQL》采用诙谐幽默的表达方式,对MySQL的底层运行原理进行了介绍,内容涵盖了使用MySQL的同学在求职面试和工作中常见的一些核心概念。总计22 章,划分为4个部分。第1部分介绍了MySQL入门的一些知识,比如MySQL的服务器程序和客户端程序有哪些、MySQL的启动选项和系统变量,以及使用的字符集等。第2部分是本书后续章节的基础,介绍了MySQL的一些基础知识,比如记录、页面、索引、表空间的结构和用法等。第3部分则与大家在工作中经常遇到的查询优化问题紧密相关,介绍了单表查询、连接查询的执行原理,MySQL基于成本和规则的优化具体指什么,并详细分析了Explain语句的执行结果。第4部分则是与MySQL中的事务和锁相关,介绍了事务概念的来源,MySQL是如何实现事务的,包括redo日志、undo日志、MVCC、各种锁的细节等。 尽管《MySQL
本书结合丰富的案例,清晰地诠释了SQL Server 2019 编程语言与数据库开发涉及的每一个核心概念和技术。全书力求阐述实际开发应用中涉及的SQL Server 2019 的功能组件和管理工具;注重实际操作,采用可视化图解的方式,对SSMS、SSCM 等关键工具的操作步骤进行了详细说明,使得读者能够直观地看到操作过程和操作效果;注重编程技巧,对于核心的T-SQL 操作,在详细介绍其语法、参数后,都会附加案例的高级编程T-SQL 代码,这些T-SQL 代码在笔者的开发环境中都经过严格的调试,读者可以直接用于自己的项目开发实践。本书可供数据库设计与开发等方向初学者、程序开发人员阅读,也可作为高等院校计算机、软件开发相关专业的教材。
本书是一本指导DBA进行数据库开发和运维的实用手册,本书共9章,包括漫谈数据库、如何提升数据库性能、如何运维好数据库、如何进行数据库设计、如何做好数据库之间的数据同步、认识HTAP技术、认识数据库的功能原理、认识数据库中的数学(逻辑与算法),以及DBA的日常:数据库管理及开发的最佳实践。另有附录DBA杂谈。 本书内容是资深DBA多年实践经验的归纳总结,涵盖DBA日常工作中的主要方面,通过剖析众多的真实案例,并解读原理、分享技巧、提供思路,内容具备较强的启发性和指导性。 本书的受众包括但不限于想要了解如何提升数据库性能的应用开发人员、DBA、业务架构师、IT架构师、数据架构师、数据分析师、系统架构师、解决方案架构师和企业高级管理人员。
《深入浅出MySQL:数据库开发、优化与管理维护(第3版)》源自网易公司多位资深数据库专家数年的经验总结和MySQL数据库的使用心得,在之前版本的基础之上,基于MySQL 5.7版本进行了内容升级,同时也对MySQL 8.0的重要功能进行了介绍。除了对原有内容的更新之外,本书还新增了作者在高可用架构、数据库自动化运维,以及数据库中间件方面的实践和积累。 《深入浅出MySQL:数据库开发、优化与管理维护(第3版)》分为“基础篇”“开发篇”“优化篇”“管理维护篇”和“架构篇”5个部分,共32章。基础篇面向MySQL的初学者,介绍了MySQL的安装与配置、SQL基础、MySQL支持的数据类型、MySQL中的运算符、常用函数等内容。开发篇面向的是MySQL设计和开发人员,内容涵盖了表类型(存储引擎)的选择、选择合适的数据类型、字符集、索引的设计和使用、开发常用数据库对
本书是一本数据科学的入门与提升教程,全书共5篇,按照由浅入深、循序渐进的方式介绍R语言的基本语法与实际应用,并结合现实数据进行实战操作。内容涵盖R语言的安装与运行、数据对象的创建与编程、R语言初级与高级绘图、数据的管理与清洗、统计分析与数据降维、无监督与有监督学习、利用R Markdown创建动态报告和制作幻灯片等。本书为读者提供了相关案例的源码(获取方式见封底)。 本书适合对数据可视化、统计建模、数据分析、数据挖掘感兴趣的研究人员和工程技术人员阅读,也可作为高等院校数学、统计学、数据科学、计算机科学、人工智能、云计算、大数据分析、生物医学、工业统计等方向本科生或研究生的参考教程。
《深入浅出数据分析》以类似"章回小说”的活泼形式,生动地向读者展现出色的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧;正文之后,意犹未尽地以三篇附录介绍数据分析十大要务、R工具及ToolPak工具,在充分展现目标知识以外,为读者搭建了走向深入研究的桥梁。
利用这本书,你将学习以下内容:了解如何选择Spark转换实现优化的解决方案。探索强大的转换和归约,包括reduceByKey()、combineByKey()和mapPartitions()。理解数据分区以实现优化查询。使用PySpark设计模式构建和应用模型。对图数据应用motif查找算法。使用GraphFrames API分析图数据。对临床医学和基因组数据应用PySpark算法。学习如何在ML算法中使用和应用特征工程。了解并使用实用的数据设计模式。
本书是MySQL领域的经典之作,拥有广泛的影响力。第3版更新了大量的内容,不但涵盖了近期新MySQL 5.5版本的新特性,也讲述了关于固态盘、高可扩展性设计和云计算环境下的数据库相关的新内容,原有的基准测试和性能优化部分也做了大量的扩展和补充。全书共分为16章和6个附录,内容涵盖MySQL架构和历史,基准测试和性能剖析,数据库软硬件性能优化,复制、备份和恢复,高可用与高可扩展性,以及云端的MySQL和MySQL相关工具等方面的内容。每一章都是相对独立的主题,读者可以有选择性地单独阅读。本书不但适合数据库管理员(DBA)阅读,也适合开发人员参考学习。不管是数据库新手还是专家,相信都能从本书有所收获。
本书示范应用的SPSS软件和R软件,是当前量化研究中的主流。 本书将研究方法、统计分析和软件操作三方面的主要知识进行了的融合,对20多种统计分析技术的讲解都配有图示清晰、步骤详细的范例,十分便于读者学习领会、照猫画虎。 本书的内容组织方式相对于将统计学和软件应用分别成书的做法,更能帮助读者在整体上对量化研究融会贯通。在难度的把握上,立足于为量化研究的初学者服务,材料选择、内容设计都比较基础,因此,完全可以作为社会学、心理学、管理学、教育学等学科的本科生和研究生的量化研究方法课程的教材。
本书围绕精益创业展开讨论,融合了精益创业法、客户开发、商业模式画布和敏捷/持续集成的精华。本书汇聚了100多位创始人、投资人、内部创业者和创新者的成功创业经验,呈现了 30 多个 价值的案例分析,可以为各阶段的创业者提供行为准则。 如果你是一名创业者,或者你是一名产品开发、产品管理、市场营销、公共关系和投资领域的商务专业人员,那么本书不容错过。
本书共分为四篇。前三篇分别对应数据血缘的理论、实现和应用:第一篇阐明数据血缘的概念,主要介绍有关数据血缘概念的综合知识;第二篇介绍如何实现数据血缘,包括一些关于实现数据血缘的可行性见解和建议;第三篇介绍如何使用数据血缘,利用数据血缘结果实现不同的业务目的。第四篇是关于“构建数据血缘业务案例”的研究,介绍如何将数据血缘落地到业务案例中。本书主要面向数据开发人员和数据管理人员,用于针对数据血缘及其应用领域拓宽思路。本书也适合具有技术背景的数据业务人员参考阅读,便于更好地理解业务需求和数据血缘需求。
本书详细介绍了Oracle、MySQL、PostgreSQL、SQL Server、DB2等各种关系数据库的SQL查询技巧和一些基础的SQL查询语句,并且通过短小精悍的实例,不仅讲解了如何插入、更新和删除数据,还介绍了如何检索记录、为查询结果排序、同时操作多张数据库表、查询元数据、处理涉及字符串和数值的操作、根据时间数据和日期数据进行运算、执行层次查询和区间查询等。随着多种SQL实现大量采用窗口函数,本书第2版针对相关实例做了优化,还新增了为数据科学家和算法工程师量身定制的实例。本书适合数据分析师、数据库管理员以及与SQL打交道的数据科学家和算法工程师阅读。
首席数据官(Chief Data Officer,CDO)是数字时代的产物,它在数字化转型的过程中,以及在转型成功后的数字经济中,都会起到关键作用。本书旨在建立一套相对完整的关于首席数据官的知识体系,帮助读者更好地参与数字时代的发展。 本书分为5篇。“第一篇 CDO概论”介绍CDO产生的背景、发展趋势、主要职责、推荐技能和工作路径等。“第二篇 管好数据”讲解CDO如何管理好数据,涉及数据战略、数据治理、数据制度、数据标准、数据架构、数据质量、数据安全、数据合规、数据建模、数据集成、数据存储、数据分析和挖掘、数据伦理、数据开放与共享等。“第三篇 做好转型”讲解CDO如何做好数字化转型。“第四篇 建好团队”讲解CDO如何构建、领导和考核数据团队。“第五篇 新技术、新模式、新业态”介绍一些与数据及CDO相关的新技术、新模式和新业态。 本书适
postgresql是目前广泛应用的开源数据库管理系统。《PostgreSQL 数据库内核分析》从postgresql数据库的源代码入手,深入分析了该数据库管理系统的底层实现细节,揭示了数据库运行的基本原理。《PostgreSQL 数据库内核分析》的主要内容包括:postgresql数据库的体系结构、 存储管理、索引机制、查询编译、查询执行、并发控制机制以及安全等。每个主题都引用了大量的数据结构、图表等进行说明,使读者对实现过程和机理一目了然。 《postgresql数据库内核分析》适合从事数据库领域相关研究的技术人员、高等院校相关专业高年级本科生或研究生阅读,有助于读者进行数据库的高级开发、基于postgresql定制满足需求的数据库系统,或者在数据库内核中实现并验证数据库新技术。
《OracleDatabasellgRMAN备份与恢复》提供了在硬件、软件、操作发生故障时保护数据库的详细信息。详细解释了如何配置数据库,创建精确的归档以及如何执行系统还原。通过命令行或Oracle企业管理器(OEM)使备份进程自动化,执行Oracle闪回恢复操作以及集成云计算技术。作为权威的资源,《OracleDatabasellgRMAN备份与恢复》也提供有关创建报告、优化性能以及执行第三方管理实用程序的相关资料。
商业分析有用吗?当然有用!商业分析是行走职场、创业启航的一项推荐技能。作者结合自己多年的工作经验,用生动的语言介绍如何用数据分析解决商业问题。本书分为6篇,共17章,其中第1篇是概念篇,讲述商业分析的基本概念;第2篇是基础篇,讲述如何用基础的分析方法评估企业经营状况;第3篇是进阶篇,讲述如何构建分析体系解决较复杂的问题;第4篇是高阶篇,讲述如何应对复杂的商业难题;第5篇是基础实践篇,通过案例讲述如何解决更复杂的商业问题;第6篇是高阶实践篇,通过案例讲述如何解决商业分析中的疑难杂症。本书的讲解思路是层层递进的,从简单场景到复杂场景,从基础的方法到复杂的方法。因此,无论读者是否有数据分析基础和经验,都建议从头开始阅读,这样可以一步步提升认知,更快地掌握商业分析的方法。
本书分为理论篇、方法篇、应用篇,共10章。理论篇( ~3章)介绍大数据共享与交易、数据服务的基本概念、区块链数据服务方法等;方法篇(第4~8章)重点阐述区块链服务的数据交易能力和密码学保障的安全能力的相关方法,包括高时效数据交易、运行时交易监管实现、区块链安全与隐私保护等;应用篇(第9、10章)介绍在服务集成应用中快速设计数据共享与交易业务场景的方法,探索基于联盟链进行数据共享与交易应用开发的实践方案。 本书取材新颖、内容丰富、重点突出、深入浅出,便于教学与自学。本书可供高等学校计算机类各专业高年级本科生、研究生,以及专注于大数据、区块链技术与软件服务新技术的从业人员、研究人员使用和参考。
Python是一门开源的计算机编程语言,凭借其易学、灵活等特点,得到了越来越多人的认可和青睐。金融科技日新月异,金融行业的数字化、科技化和智慧化快速推进,Python在金融领域有着很好的应用现状和前景。 本书在上一版的基础上进行了内容升级,持续聚焦Python在金融分析与风险管理的应用,第2版从原先的12章扩充至15章,并依次划分为基础篇(共5章)、中阶篇(共5章)以及高阶篇(共5章),基础篇结合金融场景演示了Python语言以及NumPy、pandas、Matplotlib、SciPy以及statsmodel等金融领域常用的第三方模块的编程方法;中阶篇通过Python编程结合金融实例,依次探讨利率、汇率、债券、股票、互换合约、期货合约等产品的定价、风险测度以及风险管控等内容;高阶篇则融合Python与金融案例,探究了期权的定价、希腊字母、动态对冲、隐含波动率、交易策略及其他延
"阿里云数字新基建系列”包括5本书,涉及Kubernetes、混合云架构、云数据库、CDN原理与流媒体技术、云服务器运维(Windows),囊括了领先的云技术知识与阿里云技术团队独到的实践经验,是国内IT技术图书又一重磅作品。数据库技术,被称为"计算机三驾马车”之一,几十年来,持续支持着全球亿万数字业务的运行,而云计算的出现,赋予了数据库新的能力。云数据库按引擎能力,可以分为关系型数据库、非关系型数据库、数据仓库和分布式新型数据库。本书从技术原理入手,讲解各种数据库的特点,分析不同场景的架构选型和数据库优化,继而展开到云数据库的迁移、云数据库的运维工作,期望能帮助读者了解和掌握云数据库相关知识与技能。