在数字时代,我们就可以完全相信数据吗 对数字的过度依赖,是否会让经济学和人文学视角长期冲突 是人类利用量化造福,还是量化用数字局限人类的思维 本书是多篇文章的汇编。本书主要讲述了定量分析的弊端,通过对定量分析在实际运用中的分析,指出定量分析在很多时候并不能成为我们做判断的依据。本书肯定了定量分析有价值的部分,同时指出了定量分析的局限性和不正确使用带来的问题,提倡我们在运用中应综合定量分析与定性分析两种方式,根据实际情况进行选择。
本书是来自一线MySQL DBA的技能进阶笔记,凝结了作者多年数据库管理心得。 全书从运维管理、架构优化和运维开发三个层面娓娓道来,精心筛选了作者在实际工作 中总结的技巧、对常见问题的处理方法以及对于运维体系的思考和实践;尤其是运维开 发章节从0 到1 构建运维体系,能够对DBA已有知识体系和技能栈做到全新梳理。
本书以 Power BI 数据分析软件为平台,将企业实际工作需求作为出发点,分别从思维、技术、实践这三个方面,全面系统地讲解和分享了Power BI在企业日常数据分析场景的运用思维、实操技能及综合管理应用的思路。 本书分为部分。 篇( ~ 4 章)以循序渐进的方式介绍企业数据分析的基本流程、常见模型及应用案例。第 2 篇(第 5 ~ 8 章)主要介绍和讲解了企业数据分析人员必知必会的 Power BI 工具的操作技能、应用技巧及经验,内容包括各种实用工具的使用技能、常见问题的解决方法,以及各类函数和各种图表的作用及具体运用方法。这部分知识可帮助商业数据分析人员精进、精通 Power BI 的核心技术。第 3 篇(第 9 ~ 10 章)则是主要介绍如何通过 Power BI 来制作数据分析报表,并结合常见的应用案例,综合前面篇章所讲的各种技能,讲解 Power BI 在企业日常数据分
本书是来自一线MySQL DBA的技能进阶笔记,凝结了作者多年数据库管理心得。 全书从运维管理、架构优化和运维开发三个层面娓娓道来,精心筛选了作者在实际工作 中总结的技巧、对常见问题的处理方法以及对于运维体系的思考和实践;尤其是运维开 发章节从0 到1 构建运维体系,能够对DBA已有知识体系和技能栈做到全新梳理。
《生态学数据分析:方法、程序与软件》介绍了生态学数据处理方法,包括数据转换和标准化、物种和遗传水平的多样性、种群空间分布格局、生态位、聚类分析、主成分分析、除趋势对应分析、典范对应分析、基于熵模型的物种分布区预测,以及生态学实验中的单因素与双因素方差分析、成对样本T-检验、独立样本T-检验等。对于每一种方法,提供了相应的程序和软件,《生态学数据分析:方法、程序与软件》的重点不是介绍生态学数据处理方法的理论基础和数学公式推导,而是在简要介绍方法的基础上,利用案例数据,手把手地教大家如何利用《生态学数据分析:方法、程序与软件》介绍的程序和软件实现数据定量分析。可作为生态学、环境科学及其他相关领域(例如植物学、动物学、农学和土壤科学)本科生和研究生的教材,也可作为相关专业科研人员的自学参
《Flink内核原理与实现》既讲解了Flink的入门、安装、流计算开发入门、类型和序列化系统、监控运维、安全管理配置等基础知识,又讲解了Flink的时间概念、Window的实现原理及其代码解析,Flink的容错机制原理,Flink容错的关键设计、代码实现分析,Flink Job从源码到执行整个过程的解析,Flink Job的调度策略、资源管理策略、内存管理、数据交换的关键设计和代码实现分析,Flink的RPC通信框架等深度内容。 《Flink内核原理与实现》适合对实时计算感兴趣的大数据开发、运维领域的从业人员阅读,此外对机器学习工程技术人员也有所帮助。
本书基于Hadoop 2.7.1版本进行分析,全面描述了HDFS 2.X的核心技术与解决方案,书中描述了HDFS内存存储、异构存储等几大核心设计,包括源码细节层面的分析,对于HDFS中比较特殊的几个场景过程也做了细粒度的分析。还分享了作者在实际应用中的解决方案及扩展思路。阅读本书可以帮助读者从架构设计与功能实现角度了解HDFS 2.X,同时还能学习HDFS 2.X框架中的设计思想、设计模式、Java语言技巧等。这些对于读者全面提高自己分布式技术水平有很大的帮助。本书分为部分:核心设计篇、细节实现篇、解决方案篇,“核心设计篇”包括HDFS的数据存储原理、HDFS的数据管理与策略选择机制、HDFS的新颖功能特性;“细节实现篇”包括HDFS的块处理、流量处理等细节,以及部分结构分析;“解决方案篇”包括HDFS的数据管理、HDFS的数据读写、HDFS的异常场景等。本书适合于云计算相
数据中心是当今乃至今后一个时期信息化建设普遍关注的热点领域。近几年,云计算、大数据、人工智能等技术层出不穷,在这些新技术的背后,数据中心的基础设施和相关技术也在不断演进和创新,谁能够掌握新的数据中心技术,谁就能在激烈的行业竞争中处于优势地位。 《Docker数据中心及其内核技术》介绍了Docker数据中心的概念和管理、容器技术、微服务技术、Docker数据中心的核心组件、规模化使用Docker等基础知识,结合实例介绍了企业级数据建模、数据库性能调优、数据库重构等高级知识。 《Docker数据中心及其内核技术》可作为数据科学、计算机、网络工程、信息管理专业本科生/研究生的高端教材,适合具有计算机基础知识的读者学习,也可作为数据分析师、系统架构师、企业IT主管、系统管理员学习数据中心的培训教材,以及各企(事)业组织
随着The Data Warehouse Toolkit(1996)版的出版发行,Ralph Kimball为整个行业引入了维度建模技术。从此,维度建模成为一种被广泛接受的表达数据仓库和商业智能(DW/BI)系统中数据的方法。该经典书籍被认为是维度建模技术、模式和实践的资源。 这本《数据仓库工具箱(第3版)——维度建模指南》汇集了到目前为止最全面的维度建模技术。本书采用新的思路和实践对上一版本进行了全面修订,给出了设计维度模型的全面指南,既适合数据仓库新手,也适合经验丰富的专业人员。 本书涉及的所有技术都基于作者实际从事DW/BI的设计经验,通过实际案例加以描述。 主要内容 实用设计技术——有关维度和事实表的基本和高级技术 14个案例研究,涉及零售业、电子商务、客户关系管理、采购、库存、订单管理、会计、人力资源、金融服务、医疗卫生、
本书为读者深度解析分布式键值存储系统,全书分为3部分,部分是对分布式系统的概念和一致性协议的综述,重点解析Raft协议,使读者对分布式键值存储系统有初步了解;第2部分介绍etcd安装、部署、运维、安全等方面的知识,帮助读者进一步掌握分布式系统的使用方法,熟悉其常见功能和使用场景;第3部分是本书的特色部分,从代码层次深入探讨了etcd各大关键特性的具体设计与实现原理,读者读完本部分,会对整个etcd的架构有更加清晰的认识,可以从中汲取灵感,从而将一些实用的经验应用到自己的分布式系统中。
本书从Kafka的基本概念入手,主要从生产端、消费端、服务端等3个方面进行全面的陈述,主要内容包括Kafka的基本使用方式、生产者客户端的使用、消费者客户端的使用、主题与分区、日志存储、深入原理解析、监控的设计、高级应用的扩展以及与Spark的集成等。虽然Kafka的内核使用Scala语言编写,但是本书基本以Java语言作为主要的示例语言,方便绝大多数读者的理解。本书虽然没有明确的界定,但是总体上可以隐性的划分为三个部分:基础篇、原理篇和扩展篇,以这种循序渐进的方式更能让读者容易接受。
这本易于上手的初学指南详细介绍了数据库的核心概念、DBA的职责和企业数据库的功能,能引导你完成数据库的配置、管理、规划、备份、恢复以及实现高可用性。你会获得对SQL和PL/SQL的深入了解,同时学习到管理大型数据库和使用Oracle工程系统的重要相关信息。