本书是畅销书《SQL基础教程》第2版,介绍了关系数据库以及用来操作关系数据库的SQL语言的使用方法。书中通过丰富的图示、大量示例程序和详实的操作步骤说明,让读者循序渐进地掌握SQL的基础知识和使用技巧,切实提高编程能力。每章结尾设置有练习题,帮助读者检验对各章内容的理解程度。另外,本书还将重要知识点总结为 法则 ,方便读者随时查阅。第2版除了将示例程序更新为对应*的DB的SQL之外,还新增了一章,介绍如何从应用程序执行SQL。
本书由一线数据分析师精心编写,通过大量案例介绍了数据分析工作中常用的数据分析方法与工具。本书包括5章内容,分别是数据分析入门、数据分析 从玩转Excel开始、海量数据管理 拿MySQL说事儿、数据可视化 Tableau的使用、数据分析进阶 Python数据分析。本书通俗易懂、通过大量贴近企业真实场景的案例,帮助读者在提高数据处理技能的同时加深对数据分析思维的理解。 本书适合有志于从事数据分析工作或已从事初级数据分析工作的人士自学,也可作为产品经理、运营人员、市场人员、对数据分析感兴趣的企业高管以及创业者的参考用书。
《数据库系统概念》是数据库系统方面的经典教材之一,其内容由浅入深,既包含数据库系统基本概念,又反映数据库技术新进展。本书基于该书第7版进行改编,保留其中的基本内容,压缩或删除了一些高级内容,更加适合作为国内高校计算机及相关专业本科生数据库课程教材。
本书从数据库角度全面系统地介绍数据挖掘的概念、方法和技术以及技术研究进展,并重点关注近年来该领域重要和 新的课题——数据仓库和数据立方体技术,流数据挖掘,社会化网络挖掘,空间、多媒体和其他复杂数据挖掘。本书是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都的一本书。
本书从Power BI的基础功能讲起,逐步深入到Power BI进阶实战,以系统化的实操步骤和丰富的实际案例让读者快速入门Power BI数据分析,掌握Power BI在多个业务领域的实际应用。全书共8章:商业智能与数据分析概述;Power BI简介;数据分析与可视化制作全过程;Power BI数据预处理;Power BI数据建模;Power BI数据可视化;Power BI在线服务;Power BI数据分析实战案例。 本书通俗易懂、循序渐进、内容全面、讲解详细,配备全套数据集、教学课件和学习视频,既适合读者自学Power BI数据分析与可视化,也适合大专院校作为教材,更适合从事销售、产品、电商运营、仓储物流、财务管理、人力资源等岗位的职场人士提升技能。
本书是一本系统介绍Clickhouse的指导型工具书,全书总共分为11章: 第1章 介绍ClickHouse的由来、发展历程、核心特点与核心特点。第2~6章 介绍了ClickHouse基础使用部分,包括整体架构、如何安装、数据定义、数据引擎、数据查询和函数的特性和使用方法。第7~9章介绍了ClickHouse高级特性部分,包括数据库管理操作,数据分片、数据副本和高可用的特性和使用方法。第10~11章介绍了如果自己手动实现ClickHouse中间件的思路和示例,同时也介绍了几款可视化工具与ClickHouse集成的方法。
内容简介 这是一部全面讲解数据产品经理核心知识体系的著作。12位作者大多来自国内的知名企业,涉及不同的行业,让本书拥有了更广泛的视角,能帮助读者从不同的角度去了解数据产品经理如何在数据、产品、运营、市场等多个方面产生价值。本书的*终目的是让读者全面了解数据产品经理的工作内容、系统掌握数据产品的核心知识体系,快速实现从入门到进阶的突破。 全书一共11章,重点讲解了数据产品经理应该掌握的11个核心知识点,可以概括为四个部分。 第壹部分 基础知识(第1章) 首先介绍了数据产品的定义、组成、分类,其次介绍了数据产品经理的分类和能力模型,*后介绍了数据产品经理的招聘、应聘和面试。 第二部分 通用能力(第2~3章) 讲解了数据产品经理应该具备的数据分析能力和项目运作能力(产品路线图)。 第三部分 数据管理(第4~9章
Elasticsearch是一款高性能的文档数据库,广泛应用于分布式搜索和分析引擎等相关领域,本书首先介绍了数据建模的通用设计原理,然后针对Elasticsearch 介绍了文档数据库建模的特点和要求,例如和设计模式有关的实现、注意事项,以及实践过程中的注意点等。 本书的两位作者,一位是资深的Elasticsearch 专家,一位是建模领域的大师,联合为读者呈现了这本著作。如果你是一名希望扩展Elasticsearch 建模技能的读者,或者是一名了解Elasticsearch 但需要提高模式设计技能的从业人员,推荐阅读本书。
算力、数据、AI已经成为驱动当今社会技术发展的三架马车,而算力也从传统的超级计算向云超算的方向发展。本书旨在探讨当前超级计算与云计算的融合而给算力带来的新的发展,介绍当前在算力领域的一些实践和探索,从理论到工程,帮助读者了解超级计算的关键技术与未来发展,从而更好地应用和发展高性能技术。
数据库技术自从上世纪60年代诞生以来,经历了网状数据库、层次数据库等发展阶段,zui终在80年代确立了关系数据库技术的主导地位。关系数据库技术经过几十年的发展,在各行各业都取得了巨大的成功。但是,进入21世纪后,随着互联网、物联网、云计算等技术的快速发展,传统的关系数据库技术由于在可扩展性、灵活性等方面存在的不足,难以支持层出不穷的新型应用。在此背景下,键值数据库、文档数据库、列存储数据库、图数据库等新型数据库技术因运而生。本书与现有的介绍关系数据库技术为主的书籍不同,重点介绍当前数据库领域中出现的各类新型数据库系统的概念、基础理论、关键技术以及典型应用。在理论方面,本书除了介绍各类新型数据库系统中基本的理论和原理之外,还将侧重于对这些理论的研究背景和动机进行讨论,使读者能够了解新型数
本书包括导论以及对齐(Align)、细化(Refine)、设计(Design)三章。通过将业务术语、逻辑和物理三个建模层次重命名为对齐、细化、设计,在名称中包含了该层次所做的工作。 导论介绍了数据模型的三个特征 精确性、最小化和可视化;数据模型的三个组件 实体、关系和属性;数据模型的三个层次 业务术语(对齐)、逻辑(细化)和物理(设计),以及数据建模的三个视角 关系、维度和查询。第1章对齐是关于通用业务术语的,以便每个人都能在术语和总体计划范围上保持一致。第2章细化是关于搜集业务需求的,即完善我们对项目的了解,专注于关键业务要点。第3章设计是关于技术需求的,即针对独特软硬件需求进行模型设计。 对齐、细化和设计,这就是本书遵循的方法,并通过 宠物之家 案例对概念加以强化。本书适合需要将建模技能扩展到MongoDB的数据
随着物联网、云计算、大数据与人工智能等技术的蓬勃发展,计算服务逐渐从计算密集型向数据密集型(Data Intensive)转变。高性能、高通量的数据服务关键技术成为智慧城市、智能制造、智慧农业等国家重大需求解决方案的核心基础。并行与分布式数据处理的概念启发于上世纪80年代,源自讨论在内存及二级存储极为有限的条件下如何跨越 内存墙 ,完成计算任务的优化技术。而今,互联网与私有网络数据指数级增长、数据服务的事务性需求复杂多变、跨地域数据同步需求动态不统一、如何应对当前及未来大数据服务及其上的人工智能计算对并行与分布式数据服务提出了新的问题与挑战。本书从并行与分布式数据服务的基础理论、事务模型、数据处理语言等基础内容,并进一步讨论分布式数据一致性模型及全观性的数据处理架构方面的先进及实用的研究及系统软件
本书是畅销书《SQL基础教程》第2版,介绍了关系数据库以及用来操作关系数据库的SQL语言的使用方法。书中通过丰富的图示、大量示例程序和详实的操作步骤说明,让读者循序渐进地掌握SQL的基础知识和使用技巧,切实提高编程能力。每章结尾设置有练习题,帮助读者检验对各章内容的理解程度。另外,本书还将重要知识点总结为“法则”,方便读者随时查阅。第2版除了将示例程序更新为对应近期新的DB的SQL之外,还新增了一章,介绍如何从应用程序执行SQL。
数据作为生产要素已经被提升至国家战略层面,如何激活数据要素、体现数据价值,如何有效利用数据赋能数字化转型,成为当前炙手可热的问题。本书厘清了数据治理、数据管理和数字化转型的关系,介绍了数据治理核心工作中经常出现的问题和优秀实践,明确了数字化转型的核心内容、方法路径和评估机制,通过大型企业数据治理或数字化转型案例为读者提供有价值的参考。本书适合首席执行官、首席信息官、首席数据官等从事企业管理和数据管理工作的人员阅读,有助于提升对数据治理和数字化转型的认识,为在组织中有效开展数据治理和数字化转型工作提供思路和借鉴。
本书在畅销书《企业数据治理那些事》的基础上,进一步聚焦数据治理的两大场景之一 源端数据治理(另一场景是末端数据治理)进行系统介绍,更加匹配数据治理领域的实践场景。全书共 3 篇 12 章内容,19 个实践,全面探讨了企业源端数据治理的方向、策略、总体架构、治理机制、运维管理等内容。本书首先介绍了企业源端数据治理的发展方向,提出了企业源端数据治理的 八步走 策略;然后从项目层面对企业如何进行源端数据治理进行了深入分析,分别对源端数据治理项目的前期准备、项目实施方法论及调研分析、构建数据管理体系、存量数据清洗、完善源端数据交换架构、优化增量数据质量、企业源端数据治理项目的管理,以及源端数据治理项目实施后的数据运维工作、风险管控进行了介绍,并分享了大量源端数据治理项目实践案例。 本书主要面向企业源
本书围绕数据中心业务如何经营这一主题展开论述,以数据中心产业演变为切入点,围绕“布局-建设-服务”三大核心环节,针对数据中心产业面临的集群化布局、低碳化建设、智能化服务的机遇与挑战,通过变革中的数据中心产业、数据中心产业面临的挑战、数据中心布局之道、数据中心低碳建设之道、数据中心智能服务之道、数据中心产业政策实施之道、新形态数据中心经营之道等内容剖析原因、洞察规律、研讨案例、搭建模型,为相关经营主体给出了专业务实的策略。 本书实用性强,内涵丰富,采用情景对话方式编写,可读性强,具备较高参考价值。 本书可供通信运营商、第三方专业服务商、跨界服务商等各类数据中心运营主体的从业人员阅读,也可供主管数据中心建设与运营的政府部门的工作人员阅读。
本书将现代统计学的重要思想引入数理统计课程中,强调了数据分析、图形工具和计算机技术,并注重统计的实务和应用.本书内容丰富,几乎涵盖了所有经典和前沿的概率论与数理统计理论和方法,主要包括概率、*变量、联合分布、期望、极限定理、抽样调查、参数估计、假设检验、数据汇总、两样本比较、方差分析、分类数据分析和线性小二乘等. 本书用真实数据分析了实际问题,以此增强读者对理论的理解;作者将自助方法与传统的推论性过程结合起来,增加了蒙特卡罗方法.此外,为了使概念更清晰,书中提供了大量的示例,而且还有丰富的习题,以增强读者的计算能力. 本书适合作为统计学、数学、其他理工科专业以及社会科学和经济学专业高年级本科生和低年级研究生的教材,同时也可供相关领域技术人员参考.
本书分12章重点阐述了数据管理的重要性,数据管理面临的挑战,DAMA的数据管理原则,数据伦理,数据治理,数据生命周期管理的规划及设计,数据赋能和数据维护,使用和增强数据,数据保护、隐私、安全和风险管理,元数据管理,数据质量管理,以及现在应该怎么办,能够帮助企业管理层在了解和执行数据管理的过程中不致迷失在技术术语的迷宫之中。本书可供非数据专业人士、企业管理者、数据行业研究者等读者学习和参考。
本书系统讲述数据仓库的基本概念、基本原理以及建立数据仓库的方法和过程。主要内容包括:决策支持系统的发展、数据仓库环境结构、数据仓库设计、数据仓库粒度划分、数据仓库技术、分布式数据仓库、ElS系统和数据仓库的关系,外部和非结构化数据与数据仓库的关系、数据装载问题、数据仓库与Web、ERP与数据仓库以及数据仓库设计的复查要目。 本书是数据仓库之父撰写的关于数据仓库的 权威著作,既可作为相关专业的研究生教材,也是数据仓库的研究、开发和管理人员的指南。
本书全面介绍了预测性分析相关方法,不仅直观地阐述了相关概念,还给出了现实的示例问题和真实的案例研究 包括从失败项目获得的经验教训。 本书理论和实践内容相对平衡,便于读者加深理解。 全书共9章,外加一个附录。 第1章为分析导论, 第2章为预测性分析和数据挖掘导论, 第3章介绍预测性分析的标准流程, 第4章介绍预测性分析的数据和方法, 第5章介绍预测性分析算法, 第6章探讨预测性建模中的高阶主题, 第7章介绍文本分析、主题建模和情感分析, 第8章介绍预测性分析使用的大数据, 第9章介绍深度学习和认知计算, 附录展望了商业分析和数据科学工具的前景。 本书适合计算机科学、数据科学和商业分析领域的相关从业人员阅读。
本书通过大量案例研究介绍数据可视化的基础知识,以及如何利用数据创造出吸引人的、信息量大的、有说服力的故事,进而达到有效沟通的目的。具体内容包括:如何充分理解上下文,如何选择合适的图表,如何消除杂乱,如何聚焦受众的视线,如何像设计师一样思考,以及如何用数据讲故事。 本书适合所有需要用图表展示信息和数据的人士阅读。
本书不是一本关于数据管理的 如何做 的书(如规范数据属性或是创建数据库),而是一本关于数据管理 如何思考 的书。本书将心理学和哲学与数据管理巧妙的融合在一起。将心理学和哲学学科与数据管理结合在一起,以创造有关我们如何感知和管理信息的知识。书中阐述了当今数据库系统通过数据来捕获现实世界的方式及缺陷,作者运用非常清晰的逻辑、仔细地描述了信息系统中所表示的现实世界的各个方面。对系统中所使用的数据模型、语言、语义和现实世界描述下的哲学问题进行了深刻的检视,对这些核心概念、其对信息系统的影响,是坊间遍寻不到的。这本书的价值在于批判性地探索解决现实世界的信息系统建模方法,这是一本令读者愉悦并具有启发性的佳作。适合从事数据建模、大数据、数据管理的人士阅读。