《华为数据之道》 《华为数据之道》 这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在优选170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第一部分(~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细
了解数据结构与算法是透彻理解计算机科学的前提。随着Python日益广泛的应用,Python程序员需要实现与传统的面向对象编程语言相似的数据结构与算法。本书是用Python描述数据结构与算法的开山之作,汇聚了作者多年的实战经验,向读者透彻讲解在Python环境下,如何通过一系列存储机制有效地实现各类算法。通过本书,读者将深刻理解Python数据结构、递归、搜索、排序、树与图的应用,等等。这一版重写了书中的示例代码,并对诸多内容做了修正。
阅读本书可以学习使用Python对数据集进行操作、处理、清洗和规整。第3版针对Python3.10和pandas1.4进行了更新,并通过实操讲解和实际案例向读者展示了如何高效地解决一系列数据分析问题。读者将在阅读过程中学习新版本的pandas、NumPy、IPython和Jupyter。 本书作者Wes McKinney是Python pandas项目的创始人。本书对Python数据科学工具的介绍既贴近实战又内容新颗,非常适合刚开始学习Python的数据分析师或刚开始学习数据科学和科学计算的Python程序员阅读。读者可以从GitHub获取数据文件和相关资料。 学完本书,你将能够: ·使用Jupyter notebook和IPython shell进行探索性计算。 ·掌握NumPy的基础功能和高级功能。 ·掌握pandas库中的数据分析工具。 ·使用灵活的工具对数据进行加载、清洗、转换、合并和重塑。 ·使用matplotlib进行信息可视化。 ·使用pandas的groupBy功能对数据集进行切片、切
《深入浅出数据分析》以类似"章回小说”的活泼形式,生动地向读者展现出色的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧;正文之后,意犹未尽地以三篇附录介绍数据分析十大要务、R工具及ToolPak工具,在充分展现目标知识以外,为读者搭建了走向深入研究的桥梁。
商业分析有用吗?当然有用!商业分析是行走职场、创业启航的一项推荐技能。作者结合自己多年的工作经验,用生动的语言介绍如何用数据分析解决商业问题。本书分为6篇,共17章,其中第1篇是概念篇,讲述商业分析的基本概念;第2篇是基础篇,讲述如何用基础的分析方法评估企业经营状况;第3篇是进阶篇,讲述如何构建分析体系解决较复杂的问题;第4篇是高阶篇,讲述如何应对复杂的商业难题;第5篇是基础实践篇,通过案例讲述如何解决更复杂的商业问题;第6篇是高阶实践篇,通过案例讲述如何解决商业分析中的疑难杂症。本书的讲解思路是层层递进的,从简单场景到复杂场景,从基础的方法到复杂的方法。因此,无论读者是否有数据分析基础和经验,都建议从头开始阅读,这样可以一步步提升认知,更快地掌握商业分析的方法。
《零基础学Oracle》是针对零基础编程学习者研发的Oracle入门教程。从初学者角度出发,通过通俗易懂的语言、流行有趣的实例,详细地介绍了使用Oracle 11g进行数据管理的各方面技术。全书共分16章,包括Oracle 11g概述、Oracle管理工具、SQL*Plus命令、数据表操作、SQL查询基础、SQL查询进阶、子查询及常用系统函数、PL/SQL语言编程、游标以及企业人事管理系统等。书中所有知识都结合具体实例进行讲解,涉及的程序代码给出了详细的注释,可以使读者轻松领会Oracle 11g数据库管理的精髓,快速提高数据库管理技能。本书通过大量实例及一个完整项目案例,帮助读者更好地巩固所学知识,提升能力;随书附赠的《小白实战手册》中给出了3个实用数据库、数据表的创建、操作和系统维护流程,力求让学习者能学以致用,真正获得数据库管理经验;附赠的光盘中给出了视频讲解
Python是一种面向对象的脚本语言,其代码简洁优美,类库丰富,开发效率也很高,得到越来越多开发者的喜爱,广泛应用于Web开发、网络编程、爬虫开发、自动化运维、云计算、人工智能、科学计算等领域。预测技术在当今智能分析及其应用领域中发挥着重要作用,也是大数据时代的核心价值所在。随着AI技术的进一步深化,预测技术将更好地支撑复杂场景下的预测需求,其商业价值不言而喻。基于Python来做预测,不仅能够在业务上快速落地,还让代码维护更加方便。对预测原理的深度剖析和算法的细致解读,是本书的一大亮点。本书共分为3篇。第1篇介绍预测基础,主要包括预测概念理解、预测方法论、分析方法、特征技术、模型优化及评价,读者通过这部分内容的学习,可以掌握预测的基本步骤和方法思路。第2篇介绍预测算法,该部分包含多元回归分析、复杂
Python是一门开源的计算机编程语言,凭借其易学、灵活等特点,得到了越来越多人的认可和青睐。金融科技日新月异,金融行业的数字化、科技化和智慧化快速推进,Python在金融领域有着很好的应用现状和前景。 本书在上一版的基础上进行了内容升级,持续聚焦Python在金融分析与风险管理的应用,第2版从原先的12章扩充至15章,并依次划分为基础篇(共5章)、中阶篇(共5章)以及高阶篇(共5章),基础篇结合金融场景演示了Python语言以及NumPy、pandas、Matplotlib、SciPy以及statsmodel等金融领域常用的第三方模块的编程方法;中阶篇通过Python编程结合金融实例,依次探讨利率、汇率、债券、股票、互换合约、期货合约等产品的定价、风险测度以及风险管控等内容;高阶篇则融合Python与金融案例,探究了期权的定价、希腊字母、动态对冲、隐含波动率、交易策略及其他延
本书根据PL/SQL的新版本进行了全面更新,涵盖从基础语法、程序控制到最新的优化和调优增强等方面的知识,通过真实的实验、大量的示例讲解了PL/SQL技能,是一本逐步分解的、详尽的PL/SQL编程教程。读者可以按照本书的步骤一步一步地完成每一个关键任务,掌握Oracle 21c PL/SQL编程技术,深度探索PL/SQL编程技术及最佳实践。本书既适合新手数据库开发人员和DBA阅读,也适合有一定经验的从业人员阅读。
本书在前四版畅销书的基础上,根据SPSS 26.0软件升级的市场应用需求进行第5次升级修订。 本书结合具体的SPSS统计分析实例,图文并茂地介绍了近期新版本SPSS 26.0的各种统计分析方法,包括基本统计分析、参数与非参数检验、方美分析、相关分析、同归分析、名重响应分析、聚类分析、判别分析、因子分析、主成分分析、对应分析、时间序列模型、信度分析、生存分析和缺失值分析的原理和使用方法。全书注重内容的实用性,在译细介绍SPSS常用的提作功能基础上,通过一些综合应用案例(在医学、经济管理、自然科学和社会科学中的应用)来演示实际统计分析中SPSS的使用。 本书适用于SPSS软件17.0~26.0版本,作者录制了96个视频教学文件,读者可通过扫描各章节二维码阅读学习。本书可作为高校经济学、管理学、统计学、公共管理、社会学和卫生统计等专业学生学
本书以面向应用为原则,深入浅出的介绍了oracle平台上使用pl/sql语言进行数据库开发的技术。通过大量的示例,详细介绍了pl/sql的语言特性、使用技巧,同时配以2个在实际工作中的示例来深入的剖析了pl/sql进行oracle开发的方方面面。 本书附带1张dvd光盘,内容为作者为本书录制的全程语音教学视频及本书所涉及的源代码。 本书共分为20章,分为5大篇。涵盖的内容主要有pl/sql语言基础、开发环境、变量与类型、控制语句、数据表的管理和查询、数据表的操纵、使用pl/sql的记录与集合、各种内置函数、游标、事务处理、异常处理、子程序、包、面向对象的开发等等技术点。通过示例性的代码,由浅入深,详细介绍了每一个技术要点在实际工作中的应用,对于各种技术要点的应用场合进行了细致的分析。 本书适合于使用pl/sql进行应用程序开
这是一本关于如何更好、更有效地进行数据可视化的书。本书分为3个部分。第1部分是创建有效可视化的通用指导原则,我们将了解受众的重要性,以及思考哪类图表能更好地契合他们的需求。第2部分是本书的核心部分,我们将定义和讨论80多张图表,这些图表分为八大类:比较、时间、分布、地缘、关系、构成、定性和表格。我们将看到各类图表是如何起作用的,以及它们的优缺点。第3部分整合了两块内容,一是构建数据可视化样式指南,二是如何结合不同的经验对图表进行重新设计。本书将指导你选择最适合展示相关数据的图表,并有效地传递你想传达的信息。
本书提供了学习大数据技术及架构的一站式解决方案,覆盖了大数据生态圈中的完整技术体系,包括数据采集、数据存储、分布式资源管理、数据计算、数据分析、任务调度、数据检索、大数据底层基础技术和大数据集群安装与管理。 本书还介绍了多个企业级大数据应用案例(包括海量数据采集、“双十一”数据大屏、海量数据全文搜索系统等)和大数据平台架构案例(包括离线数据仓库架构、实时数据仓库架构、批流一体化数据仓库架构、数据中台架构、直播大数据平台架构、电商大数据平台架构等),可以帮助读者从全局角度理解大数据。 在本书中,技术内容基本上都是从零讲起的,结合原理和架构,以“图解+实战”的形式帮助读者轻松理解复杂的知识。 本书适合对大数据感兴趣的开发人员。无论读者是否接触过大数据开发,只要具备一定的Java开发
本书示范应用的SPSS软件和R软件,是当前量化研究中的主流。 本书将研究方法、统计分析和软件操作三方面的主要知识进行了的融合,对20多种统计分析技术的讲解都配有图示清晰、步骤详细的范例,十分便于读者学习领会、照猫画虎。 本书的内容组织方式相对于将统计学和软件应用分别成书的做法,更能帮助读者在整体上对量化研究融会贯通。在难度的把握上,立足于为量化研究的初学者服务,材料选择、内容设计都比较基础,因此,完全可以作为社会学、心理学、管理学、教育学等学科的本科生和研究生的量化研究方法课程的教材。
本书主要介绍从高维数据中感知、处理、分析和学习低维结构的基本数学原理和高效计算方法,系统地归纳了建模高维空间中低维结构的数学原理,梳理了处理高维数据模型的可扩展高效计算方法,阐明了如何结合领域具体知识或考虑其他非理想因素来正确建模并成功解决真实世界中的应用问题。本书包括基本原理、计算方法和真实应用三个部分:基本原理部分系统地介绍稀疏、低秩和一般低维模型的基本性质和理论结果,计算方法部分介绍解决凸优化和非凸优化问题的有效算法,真实应用部分通过实例演示利用前两部分的知识改进高维数据处理和分析问题的解决方案。本书适合作为计算机科学、数据科学和电气工程专业的高年级本科生和研究生的教材,也适合学习稀疏性、低维结构和高维数据课程的学生参考。
本书分为以下几个主要部分:第1-3章介绍方法和技术。在这些章节中,我们描述了一种性能调优方法。还提供了一些关于MongoDB架构和MongoDB提供的用于调查、监控和诊断MongoDB性能的工具的背景知识。第4章和第5章介绍应用程序和数据库设计。第6-10章介绍应用程序代码的优化。第11-14章讨论MongoDB服务器及其运行硬件的优化。
《企业级数据架构:核心要素、架构模型、数据管理与平台搭建》由李杨著
本书根据PL/SQL的新版本进行了全面更新,涵盖从基础语法、程序控制到近期新的优化和调优增强等方面的知识,通过真实的实验、大量的示例讲解了PL/SQL技能,是一本逐步分解的、详尽的PL/SQL编程教程。读者可以按照本书的步骤一步一步地完成每一个关键任务,掌握Oracle 21c PL/SQL编程技术,深度探索PL/SQL编程技术及很好实践。本书既适合新手数据库开发人员和DBA阅读,也适合有一定经验的从业人员阅读。
这是一本从OLAP核心概念出发,以Presto为例,从整体执行流程到不同SQL的执行原理,完整呈现OLAP查询的核心流程和OLAP引擎设计思路,并指导读者形成OLAP引擎设计解决方案的专业技术工具书。本书不仅面向初级读者介绍了OLAP查询的基本原理和Presto使用方法,还从源码级剖析了OLAP引擎核心原理,包括SQL查询解析器、优化器、调度器、执行器等核心组件,并将内容扩展到OLAP引擎的常见高性能优化方案上。全书由浅入深,图文并茂,把晦涩难懂的内容讲解得透彻易懂。本书分为6篇,包括14章。第一篇(第1章和第2章)总体介绍业界常见的OLAP引擎并分析其优劣,讨论OLAP引擎的技术发展趋势及选型方法,介绍Presto背景知识及其使用方法、技巧。第二篇(第3章和第4章)串讲OLAP查询执行的整个过程,并概要性介绍查询解析器、优化器、调度器、执行器等核心模块的工作原理,
本书是热销书《SQL基础教程》的作者MICK为志在向中级进阶的数据库工程师编写的一本SQL技能提升指南。全书可分为两大部分。第一部分介绍了SQL语言不同寻常的使用技巧,带领读者重新认识CASE表达式、窗口函数、自连接、EXISTS谓词、HAVING子句、外连接、行间比较、集合运算、数列处理等SQL常用技术,发掘它们的新用法。这部分不仅穿插讲解了这些技巧背后的逻辑和相关知识,而且辅以丰富的示例程序,旨在帮助读者从面向过程的思维方式转换为面向集合的思维方式。第二部分介绍了关系数据库的发展史,并从集合论和逻辑学的角度讲述了SQL和关系模型的理论基础,旨在帮助读者加深对SQL语言和关系数据库的理解。此外,本书很多节的末尾设置有练习题,并在书末提供了解答,方便读者检验自己对书中知识点的掌握程度。本书适合具有半年以上SQL使用经验、已掌握S
本书详细介绍了Oracle、MySQL、PostgreSQL、SQL Server、DB2等各种关系数据库的SQL查询技巧和一些基础的SQL查询语句,并且通过短小精悍的实例,不仅讲解了如何插入、更新和删除数据,还介绍了如何检索记录、为查询结果排序、同时操作多张数据库表、查询元数据、处理涉及字符串和数值的操作、根据时间数据和日期数据进行运算、执行层次查询和区间查询等。随着多种SQL实现大量采用窗口函数,本书第2版针对相关实例做了优化,还新增了为数据科学家和算法工程师量身定制的实例。本书适合数据分析师、数据库管理员以及与SQL打交道的数据科学家和算法工程师阅读。
对于企业而言,大数据的重要性不言而喻,如何构建、实施和应用大数据系统是很复杂的。 本书将为大家全面而深入地介绍Hadoop、Spark和NoSQL平台的构建,深入浅出地讲解Hadoop、Spark和NoSQL的基础知识、架构方案与实战技巧等。通过阅读本书,读者可以对大数据平台架构有一个明确、清晰的认识,掌握Hadoop、Spark、NoSQL平台的使用技巧,从而搭建一个安全可靠的大数据集群平台,来满足企业的实际需求。 本书共15章,可分为五大部分。第一部分(第1章)为大数据平台架构概述,讲述大数据平台的基本概念与实际应用;第二部分(第2章?第6章)主要讲解Hadoop的基本使用方法,以及Hadoop生态圈的其他组件;第三部分(第7章)主要介绍NoSQL;第四部分(第8章?第10章)主要介绍Spark生态圈与Spark实战案例;第五部分(第11章?第15章)讲解如何构建大数据平台,阐述大数据平台的
本书以TiDB数据库为基础介绍分布式数据库的运行原理、性能优化和应用场景架构设计。首先,剖析分布式数据库的运行原理与架构;然后,阐述分布式数据库TiDB在表与索引的设计优化、SQL优化、系统级优化方面的方法论,通过融入多个有代表性的案例,帮助读者将方法论对应到生产实践中;最后,梳理场景选型和架构设计过程中读者应该掌握的主要知识点,并对一些分布式数据库的优势场景进行了详细介绍。 本书适合希望了解分布式数据库原理,学习TiDB数据库的开发工程师、数据库管理员和架构师阅读,也可以作为高等学校教师或学生学习分布式数据库的参考教材。
本书通过真实案例,全面介绍Python 3编程基础及其数据分析工具的应用,培养读者通过数据分析问题、解决问题以及对结果评价的能力。全书内容包括:Python 3基本配置和编程基础、编程进阶、数据预处理、数据描述与数据探索、绘图与可视化、统计推断、相关分析、关联分析、回归分析、主成分和因子分析、聚类、判别与分类、列联分析、对应分析、定性数据分析、神经网络和深度学习、时间序列分析、信号滤波等,将读者关注的基本数据分析方法进行剖析。
这是一本能从业务、方法、场景3个维度帮助读者使用AI技术提升数据分析和数据化运营能力的著作。用扎实的理论框架、丰富的实践案例、实用的操作技巧,全面展示了如何用AI延伸业务分析广度、拓展业务分析深度、优化业务分析效能,从而达到帮助企业用智能的数据化运营实现业务持续增长的目的。 阅读并实践本书,你将有以下收获: (1)理解并掌握AI辅助数据分析的思路,以及应该具备的AI能力、方法和工具。 (2)系统掌握AI在数据分析报告中的创新应用,包括思维导图生成、报告材料整理、核心内容撰写以及报告试讲和优化等。 (3)掌握AI在市场分析和行业分析中的应用,包括数据采集、宏观分析、行业与市场概况分析、市场细分与目标市场定位、市场发展趋势与市场风险分析。 (4)掌握AI在竞争分析中的应用,包括收集竞争分析报告与数据、竞品调研