了解数据结构与算法是透彻理解计算机科学的前提。随着Python日益广泛的应用,Python程序员需要实现与传统的面向对象编程语言相似的数据结构与算法。本书是用Python描述数据结构与算法的开山之作,汇聚了作者多年的实战经验,向读者透彻讲解在Python环境下,如何通过一系列存储机制有效地实现各类算法。通过本书,读者将深刻理解Python数据结构、递归、搜索、排序、树与图的应用,等等。这一版重写了书中的示例代码,并对诸多内容做了修正。
本书通过大量案例研究介绍数据可视化的基础知识,以及如何利用数据创造出吸引人的、信息量大的、有说服力的故事,进而达到有效沟通的目的。具体内容包括:如何充分理解上下文,如何选择合适的图表,如何消除杂乱,如何聚焦受众的视线,如何像设计师一样思考,以及如何用数据讲故事。 本书适合所有需要用图表展示信息和数据的人士阅读。
《深入浅出数据分析》以类似"章回小说”的活泼形式,生动地向读者展现出色的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧;正文之后,意犹未尽地以三篇附录介绍数据分析十大要务、R工具及ToolPak工具,在充分展现目标知识以外,为读者搭建了走向深入研究的桥梁。
本书示范应用的SPSS软件和R软件,是当前量化研究中的主流。 本书将研究方法、统计分析和软件操作三方面的主要知识进行了的融合,对20多种统计分析技术的讲解都配有图示清晰、步骤详细的范例,十分便于读者学习领会、照猫画虎。 本书的内容组织方式相对于将统计学和软件应用分别成书的做法,更能帮助读者在整体上对量化研究融会贯通。在难度的把握上,立足于为量化研究的初学者服务,材料选择、内容设计都比较基础,因此,完全可以作为社会学、心理学、管理学、教育学等学科的本科生和研究生的量化研究方法课程的教材。
本书详细剖析LevelDB从使用到设计实现的方方面面,读后可了解谷歌Bigtable数据库的设计精髓,逻辑上可分为两部分。 第一部分着重讲解LevelDB的基础知识,主要内容如下。 1)基本数据结构,这是理解后续内容的基础,也可以加深对比较器、迭代器等常见数据结构的理解。 2)基本使用,如数据库打开、关闭以及基本的读写操作。 3)总体架构与设计思想,读后可掌握LevelDB的整体情况与设计思路。 4)公用基础类,读后可了解LevelDB中如何实现数值编码、内存管理以及文件读取等。 第二部分着重讲解LevelDB各模块的实现细节,主要内容如下。 1)Log模块的实现细节,以及如何通过Log进行崩溃恢复,并生成一个MemTable文件。 2)MemTable模块的实现细节,以及MemTable超过内存阈值时如何生成一个SSTable文件。 3)SSTable模块的实现细节。 4)Compaction原理与多版本管理。
本书根据PL/SQL的新版本进行了全面更新,涵盖从基础语法、程序控制到近期新的优化和调优增强等方面的知识,通过真实的实验、大量的示例讲解了PL/SQL技能,是一本逐步分解的、详尽的PL/SQL编程教程。读者可以按照本书的步骤一步一步地完成每一个关键任务,掌握Oracle 21c PL/SQL编程技术,深度探索PL/SQL编程技术及很好实践。本书既适合新手数据库开发人员和DBA阅读,也适合有一定经验的从业人员阅读。
这是一本从OLAP核心概念出发,以Presto为例,从整体执行流程到不同SQL的执行原理,完整呈现OLAP查询的核心流程和OLAP引擎设计思路,并指导读者形成OLAP引擎设计解决方案的专业技术工具书。本书不仅面向初级读者介绍了OLAP查询的基本原理和Presto使用方法,还从源码级剖析了OLAP引擎核心原理,包括SQL查询解析器、优化器、调度器、执行器等核心组件,并将内容扩展到OLAP引擎的常见高性能优化方案上。全书由浅入深,图文并茂,把晦涩难懂的内容讲解得透彻易懂。本书分为6篇,包括14章。第一篇(第1章和第2章)总体介绍业界常见的OLAP引擎并分析其优劣,讨论OLAP引擎的技术发展趋势及选型方法,介绍Presto背景知识及其使用方法、技巧。第二篇(第3章和第4章)串讲OLAP查询执行的整个过程,并概要性介绍查询解析器、优化器、调度器、执行器等核心模块的工作原理,
本书是热销书《SQL基础教程》的作者MICK为志在向中级进阶的数据库工程师编写的一本SQL技能提升指南。全书可分为两大部分。第一部分介绍了SQL语言不同寻常的使用技巧,带领读者重新认识CASE表达式、窗口函数、自连接、EXISTS谓词、HAVING子句、外连接、行间比较、集合运算、数列处理等SQL常用技术,发掘它们的新用法。这部分不仅穿插讲解了这些技巧背后的逻辑和相关知识,而且辅以丰富的示例程序,旨在帮助读者从面向过程的思维方式转换为面向集合的思维方式。第二部分介绍了关系数据库的发展史,并从集合论和逻辑学的角度讲述了SQL和关系模型的理论基础,旨在帮助读者加深对SQL语言和关系数据库的理解。此外,本书很多节的末尾设置有练习题,并在书末提供了解答,方便读者检验自己对书中知识点的掌握程度。本书适合具有半年以上SQL使用经验、已掌握S
本书详细介绍了Oracle、MySQL、PostgreSQL、SQL Server、DB2等各种关系数据库的SQL查询技巧和一些基础的SQL查询语句,并且通过短小精悍的实例,不仅讲解了如何插入、更新和删除数据,还介绍了如何检索记录、为查询结果排序、同时操作多张数据库表、查询元数据、处理涉及字符串和数值的操作、根据时间数据和日期数据进行运算、执行层次查询和区间查询等。随着多种SQL实现大量采用窗口函数,本书第2版针对相关实例做了优化,还新增了为数据科学家和算法工程师量身定制的实例。本书适合数据分析师、数据库管理员以及与SQL打交道的数据科学家和算法工程师阅读。
本书以TiDB数据库为基础介绍分布式数据库的运行原理、性能优化和应用场景架构设计。首先,剖析分布式数据库的运行原理与架构;然后,阐述分布式数据库TiDB在表与索引的设计优化、SQL优化、系统级优化方面的方法论,通过融入多个有代表性的案例,帮助读者将方法论对应到生产实践中;最后,梳理场景选型和架构设计过程中读者应该掌握的主要知识点,并对一些分布式数据库的优势场景进行了详细介绍。 本书适合希望了解分布式数据库原理,学习TiDB数据库的开发工程师、数据库管理员和架构师阅读,也可以作为高等学校教师或学生学习分布式数据库的参考教材。
这是一本能从业务、方法、场景3个维度帮助读者使用AI技术提升数据分析和数据化运营能力的著作。用扎实的理论框架、丰富的实践案例、实用的操作技巧,全面展示了如何用AI延伸业务分析广度、拓展业务分析深度、优化业务分析效能,从而达到帮助企业用智能的数据化运营实现业务持续增长的目的。 阅读并实践本书,你将有以下收获: (1)理解并掌握AI辅助数据分析的思路,以及应该具备的AI能力、方法和工具。 (2)系统掌握AI在数据分析报告中的创新应用,包括思维导图生成、报告材料整理、核心内容撰写以及报告试讲和优化等。 (3)掌握AI在市场分析和行业分析中的应用,包括数据采集、宏观分析、行业与市场概况分析、市场细分与目标市场定位、市场发展趋势与市场风险分析。 (4)掌握AI在竞争分析中的应用,包括收集竞争分析报告与数据、竞品调研
本书包括导论以及对齐 (Align)、细化 (Refine)、设计 (Design) 三章。通过将业务术语、逻辑和物理三个建模层次重命名为对齐、细化、设计, 在名称中包含了该层次所做的工作。 导论介绍了数据模型的三个特征——准确性、最小化和可视化; 数据模型的三个组件——实体、关系和属性; 数据模型的三个层次——业务术语 (对齐)、逻辑 (细化) 和物理 (设计), 以及数据建模的三个视角——关系、维度和查询。第1章对齐 (Align) 是关于通用业务术语的, 以便每个人都能在术语和总体计划范围上保持一致。第2章细化 (Refine) 是关于搜集业务需求的, 即完善我们对项目的了解, 专注于关键业务要点。第3章设计 (Design) 是关于技术需求的, 即针对独特软硬件需求进行模型设计。 对齐、细化和设计,这就是本书遵循的方法,并通过“宠物之家”案例对概念加以强化。本书适合需要将建模技能
图作为一种新型的建模方式,非常适合在不确定模式下建模和存储数据。Neo4j是一款高性能的图数据库,作为图数据库的先驱,已广泛应用在金融风控、知识图谱、社交、政企关系和工业设计等领域。本书的两位作者,一位是资深的Neo4j专家,另一位是建模领域的大师,联合为我们呈现了图数据库Neo4j数据建模和模式设计的相关方法与技巧。本书适合所有对数据建模,尤其是非结构化的图建模感兴趣的读者阅读学习。
全书共9章,分为三部分。第一部分(第1~3章)讲解存储引擎的全貌,涉及存储引擎中高频使用的数据结构、存储介质等,为深入学习后面的内容做铺垫。第二部分(第4~6章)介绍基于B+树的存储引擎,重点介绍为什么选择B+树作为存储引擎索引结构、B+树存储引擎解决哪些问题以及如何解决,并以BoltDB存储引擎项目为例来讲解核心原理与实现细节。第三部分(第7~9章)介绍基于LSM派系的存储引擎,重点介绍LSM Tree中各组件的功能及作用,最后剖析了LevelDB项目的核心原理与实现细节。
【为宏观掌握Oracle基础(第1~3章)】,介绍了进程管理、内存管理及存储等基础知识,并且讲解了常用Linux操作系统性能工具的使用及结果分析方法,旨在帮助读者了从宏观视角掌握Oracle数据库体系架构和进程组织方案。【微观理解Oracle原理(第4~8章)】,围绕Oracle内部运行原理展开讲解。首先,在Oracle数据结构的基础上讨论日志和回滚。其次,引入了排队论和排队系统中的概念,对比法讲解了Oracle的数据缓冲区高速缓存和共享池设计思想及运行原理。【串联Oracle运行流程(第9~11章)】,结合实践案例将从提交SQL至结果返回的整个过程串起来,首先总结归纳了Oracle算法和数据结构的重要知识点,打通了Oracle原理与数据结构之间的桥梁。其次,通过典型案例讲解AWR报告,让读者能够了解完整的Oracle诊断思路。再次,介绍了集群技术、OracleRAC及其日志结构。然后,对Orac
这是一本讲解在数据要素大背景下,企业如何将数据资源开发成数据产品,进而通过数据产品实现数据资产化和资本化的著作,为企业释放数据价值提供了科学的方法论和国内领先的实践方案。这本书由全球数据资产理事会(DAC)组织编写,融合了国内数据资产管理领域多家企业的10位专家的研究成果和实战经验,得到了湖南数据产业集团、广州数据集团、深圳数据交易所、浙江大数据交易中心、华为、平安、安永、毕马威、德勤、普华永道、浙江大学等企业、机构和高校等近20位高层领导、技术专家和学者的高度评价和一致推荐。从概念到方法,从理论到实践,从产业政策到行业解决方案,本书将为读者构建全面的数据产品知识体系,核心内容如下:(1)国家和地方出台的数据资产相关政策及其解读,为数据资产实践提供法律准绳;(2)详细阐释数据从原始数据
本书介绍了数字孪生的概念和流程,帮助读者了解当前数字化的环境和趋势,并快速建立MicroStation直觉式绘图环境。本书分为13章,从数字孪生基础概念讲到数字孪生生态环境,然后进一步讲述如何使用MircoStation。内容包括使用方法、工作环境、空间定位、对象创建与修改、视图、三维操作、引用、单元对象、图纸输出、注释对象、打印输出。本书不仅适合作为广大学习、使用MicroStation软件人员的参考书,而且也可作为建筑行业的专业人员、研究人员、软件开发工程师、BIM爱好者及高校师生的常备参考书。
本书在对大数据的概念特征及发展现状进行了梳理的基础上,列举了近20个不同行业中大数据应用的经典案例,以点带面,展现了各行业实战中体现出的大数据新思维,并以充足的实例为基础,提炼出大数据应用思维的新常态,给出了大数据应用的切实建议。为读者,特别是向位于政府或企业决策岗位的读者全面展现了大数据的的应用行业图景。
本书在对大数据的概念特征及发展现状进行了梳理的基础上,列举了近20个不同行业中大数据应用的经典案例,以点带面,展现了各行业实战中体现出的大数据新思维,并以充足的实例为基础,提炼出大数据应用思维的新常态,给出了大数据应用的切实建议。为读者,特别是向位于政府或企业决策岗位的读者全面展现了大数据的的应用行业图景。
本书在对大数据的概念特征及发展现状进行了梳理的基础上,列举了近20个不同行业中大数据应用的经典案例,以点带面,展现了各行业实战中体现出的大数据新思维,并以充足的实例为基础,提炼出大数据应用思维的新常态,给出了大数据应用的切实建议。为读者,特别是向位于政府或企业决策岗位的读者全面展现了大数据的的应用行业图景。
本书共分三个部分。第一部分从第1章到第4章,旨在复习C++程序设计的概念以及程序性能的分析和测量方法。第二部分从第5章到第16章,研究数据结构,包括线性表、数组和矩阵、栈、队列、字典、二叉树、优先级队列、竞赛树、搜索树和图等。第三部分从第17章到第21章,研究常用算法,包括贪婪算法、分而治之算法、动态规划、回溯算法和分枝定界算法。本书有800多道练习题和50多个应用实例。内容广博,组织合理,论述清晰,循序渐进,而且对程序性能的分析和测量系统入微。本书不仅是数据结构和算法的经典教材,而且是计算机科学与工程领域的理想参考书。
这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第一部分(第1~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数据的管理方式和
这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第一部分(第1~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数据的管理方式和
这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第一部分(第1~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数据的管理方式和
《MySQL必知必会》 MySQL是世界上受欢迎的数据库管理系统之一。书中从介绍简单的数据检索开始,逐步深入一些复杂的内容,包括联结的使用、子查询、正则表达式和基于全文本的搜索、存储过程、游标、触发器、表约束,等等。通过重点突出的章节,条理清晰、系统而扼要地讲述了读者应该掌握的知识,使他们不经意间立刻功力大增。 《MySQL必知必会》注重实用性,操作性很强,适用于广大软件开发和数据库管理人员学习参考。