《深入浅出数据分析》以类似"章回小说”的活泼形式,生动地向读者展现出色的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧;正文之后,意犹未尽地以三篇附录介绍数据分析十大要务、R工具及ToolPak工具,在充分展现目标知识以外,为读者搭建了走向深入研究的桥梁。
本书是一本关于Oracle数据库体系结构的图书,涵盖了所有重要的Oracle体系结构特性,包括文件、内存结构和进程,锁和闩,事务、并发和多版本,表和索引,数据类型,分区和并行,以及数据加密等,并利用具体的例子来全面介绍每个特性,不仅讨论了各个特性是什么,还说明了它是如何工作的,如何使用这个特性来开发软件,以及有关的常见陷阱。本书的读者对象是数据库开发人员。
本书共分为四篇。前三篇分别对应数据血缘的理论、实现和应用:第一篇阐明数据血缘的概念,主要介绍有关数据血缘概念的综合知识;第二篇介绍如何实现数据血缘,包括一些关于实现数据血缘的可行性见解和建议;第三篇介绍如何使用数据血缘,利用数据血缘结果实现不同的业务目的。第四篇是关于“构建数据血缘业务案例”的研究,介绍如何将数据血缘落地到业务案例中。本书主要面向数据开发人员和数据管理人员,用于针对数据血缘及其应用领域拓宽思路。本书也适合具有技术背景的数据业务人员参考阅读,便于更好地理解业务需求和数据血缘需求。
本书详细介绍了Oracle、MySQL、PostgreSQL、SQL Server、DB2等各种关系数据库的SQL查询技巧和一些基础的SQL查询语句,并且通过短小精悍的实例,不仅讲解了如何插入、更新和删除数据,还介绍了如何检索记录、为查询结果排序、同时操作多张数据库表、查询元数据、处理涉及字符串和数值的操作、根据时间数据和日期数据进行运算、执行层次查询和区间查询等。随着多种SQL实现大量采用窗口函数,本书第2版针对相关实例做了优化,还新增了为数据科学家和算法工程师量身定制的实例。本书适合数据分析师、数据库管理员以及与SQL打交道的数据科学家和算法工程师阅读。
首席数据官(Chief Data Officer,CDO)是数字时代的产物,它在数字化转型的过程中,以及在转型成功后的数字经济中,都会起到关键作用。本书旨在建立一套相对完整的关于首席数据官的知识体系,帮助读者更好地参与数字时代的发展。 本书分为5篇。“第一篇 CDO概论”介绍CDO产生的背景、发展趋势、主要职责、推荐技能和工作路径等。“第二篇 管好数据”讲解CDO如何管理好数据,涉及数据战略、数据治理、数据制度、数据标准、数据架构、数据质量、数据安全、数据合规、数据建模、数据集成、数据存储、数据分析和挖掘、数据伦理、数据开放与共享等。“第三篇 做好转型”讲解CDO如何做好数字化转型。“第四篇 建好团队”讲解CDO如何构建、领导和考核数据团队。“第五篇 新技术、新模式、新业态”介绍一些与数据及CDO相关的新技术、新模式和新业态。 本书适
首席数据官(Chief Data Officer,CDO)是数字时代的产物,它在数字化转型的过程中,以及在转型成功后的数字经济中,都会起到关键作用。本书旨在建立一套相对完整的关于首席数据官的知识体系,帮助读者更好地参与数字时代的发展。 本书分为5篇。“第一篇 CDO概论”介绍CDO产生的背景、发展趋势、主要职责、推荐技能和工作路径等。“第二篇 管好数据”讲解CDO如何管理好数据,涉及数据战略、数据治理、数据制度、数据标准、数据架构、数据质量、数据安全、数据合规、数据建模、数据集成、数据存储、数据分析和挖掘、数据伦理、数据开放与共享等。“第三篇 做好转型”讲解CDO如何做好数字化转型。“第四篇 建好团队”讲解CDO如何构建、领导和考核数据团队。“第五篇 新技术、新模式、新业态”介绍一些与数据及CDO相关的新技术、新模式和新业态。 本书适
《OracleDatabasellgRMAN备份与恢复》提供了在硬件、软件、操作发生故障时保护数据库的详细信息。详细解释了如何配置数据库,创建精确的归档以及如何执行系统还原。通过命令行或Oracle企业管理器(OEM)使备份进程自动化,执行Oracle闪回恢复操作以及集成云计算技术。作为权威的资源,《OracleDatabasellgRMAN备份与恢复》也提供有关创建报告、优化性能以及执行第三方管理实用程序的相关资料。
商业分析有用吗?当然有用!商业分析是行走职场、创业启航的一项推荐技能。作者结合自己多年的工作经验,用生动的语言介绍如何用数据分析解决商业问题。本书分为6篇,共17章,其中第1篇是概念篇,讲述商业分析的基本概念;第2篇是基础篇,讲述如何用基础的分析方法评估企业经营状况;第3篇是进阶篇,讲述如何构建分析体系解决较复杂的问题;第4篇是高阶篇,讲述如何应对复杂的商业难题;第5篇是基础实践篇,通过案例讲述如何解决更复杂的商业问题;第6篇是高阶实践篇,通过案例讲述如何解决商业分析中的疑难杂症。本书的讲解思路是层层递进的,从简单场景到复杂场景,从基础的方法到复杂的方法。因此,无论读者是否有数据分析基础和经验,都建议从头开始阅读,这样可以一步步提升认知,更快地掌握商业分析的方法。
Python是一门开源的计算机编程语言,凭借其易学、灵活等特点,得到了越来越多人的认可和青睐。金融科技日新月异,金融行业的数字化、科技化和智慧化快速推进,Python在金融领域有着很好的应用现状和前景。 本书在上一版的基础上进行了内容升级,持续聚焦Python在金融分析与风险管理的应用,第2版从原先的12章扩充至15章,并依次划分为基础篇(共5章)、中阶篇(共5章)以及高阶篇(共5章),基础篇结合金融场景演示了Python语言以及NumPy、pandas、Matplotlib、SciPy以及statsmodel等金融领域常用的第三方模块的编程方法;中阶篇通过Python编程结合金融实例,依次探讨利率、汇率、债券、股票、互换合约、期货合约等产品的定价、风险测度以及风险管控等内容;高阶篇则融合Python与金融案例,探究了期权的定价、希腊字母、动态对冲、隐含波动率、交易策略及其他延
全书分为 8 章, 主要内容如下:第1章介绍学术论文插图绘制的规范性和基本原则以及学术论文插图的配色基础;第2章介绍绘制学术论文插图的主要工具,并重点介绍 Matplotlib、Seaborn、ProPlot 以及 SciencePlots 工具包的语法及其重要特征;第3章介绍学术论文中常见的单变量图及其绘制方法,包括直方图、密度图、Q-Q 图等;第4章介绍学术论文中常见的双变量图及其绘制方法, 具体包括误差线、柱形图、箱线图、相关性散 点图以及矩阵热力图等;第5 章介绍学术论文中常见的多变量图及其绘制方法,包括等高线图、点图系列、 三元相图、 3D 图系列以及 RadViz 图等;第 6 章介绍学术论文中常见的空间数据型图及其绘制方法,包括分 级统计地图、连接线地图、等值线地图以及子地图等;第 7 章介绍学术论文中常见的可视化图及其绘制方法,包括配对图系列、韦恩图、泰勒图
"阿里云数字新基建系列”包括5本书,涉及Kubernetes、混合云架构、云数据库、CDN原理与流媒体技术、云服务器运维(Windows),囊括了领先的云技术知识与阿里云技术团队独到的实践经验,是国内IT技术图书又一重磅作品。数据库技术,被称为"计算机三驾马车”之一,几十年来,持续支持着全球亿万数字业务的运行,而云计算的出现,赋予了数据库新的能力。云数据库按引擎能力,可以分为关系型数据库、非关系型数据库、数据仓库和分布式新型数据库。本书从技术原理入手,讲解各种数据库的特点,分析不同场景的架构选型和数据库优化,继而展开到云数据库的迁移、云数据库的运维工作,期望能帮助读者了解和掌握云数据库相关知识与技能。
本书介绍了NoSQL数据库生态圈体系,包括Redis、MongoDB和HBase,内容涉及开发、运维、管理与架构。“第1篇基于内存的NoSQL数据库”(第1~5章)包括:内存对象缓存技术Memcached、Redis基础、Redis高级特性及原理、Redis集群与高可用和Redis故障诊断与优化。“第2篇基于文档的NoSQL数据库”(第6~10章)包括:MongoDB基础、操作MongoDB的数据、MongoDB的数据建模、MongoDB的管理和MongoDB的集群。“第3篇列式存储NoSQL数据库”(第11~15章)包括:HBase基础、部署与操作HBase、HBase原理剖析、HBase的高级特性和监控与优化HBase集群。本书适合对 NoSQL数据库感兴趣的平台架构师、运维管理人员和项目开发人员,读者只需要具备Linux基础和SQL基础,就能够通过本书快速掌握 NoSQL数据库。
《MySQL是怎样运行的:从根儿上理解MySQL》采用诙谐幽默的表达方式,对MySQL的底层运行原理进行了介绍,内容涵盖了使用MySQL的同学在求职面试和工作中常见的一些核心概念。 《MySQL是怎样运行的:从根儿上理解MySQL》总计22章,划分为4个部分。第1部分介绍了MySQL入门的一些知识,比如MySQL的服务器程序和客户端程序有哪些、MySQL的启动选项和系统变量,以及使用的字符集等。第2部分是本书后续章节的基础,介绍了MySQL的一些基础知识,比如记录、页面、索引、表空间的结构和用法等。第3部分则与大家在工作中经常遇到的查询优化问题紧密相关,介绍了单表查询、连接查询的执行原理,MySQL基于成本和规则的优化具体指什么,并详细分析了Explain语句的执行结果。第4部分则是与MySQL中的事务和锁相关,介绍了事务概念的来源,MySQL是如何实现事务的,包括redo日志、undo日
本书以数据思维为主题,以数据分析全流程为主线,融合了编程语言、统计学基础及案例分析等内容,全书分为4篇,囊括了数据思维的概念和培养方法、数据来源及体系建设、数据分析三大思维方式及用户流失、用户转化实战等共11章的内容。本书囊括了数据分析中常用的分析方法,包括经典的海盗(AARRR)模型、麦肯锡的MECE模型、逻辑树、漏斗分析、路径分析、对比分析、A/B试验、RFM模型、K-Means算法、5W2H等分析方法,还包括各类方法的实践案例及Python实操项目。可以说本书是数据分析方法论与统计学知识、编程语言及应用案例的完美结合。
本书介绍了数字孪生的概念和流程,帮助读者了解当前数字化的环境和趋势,并快速建立MicroStation直觉式绘图环境。本书分为13章,从数字孪生基础概念讲到数字孪生生态环境,然后进一步讲述如何使用MircoStation。内容包括使用方法、工作环境、空间定位、对象创建与修改、视图、三维操作、引用、单元对象、图纸输出、注释对象、打印输出。本书不仅适合作为广大学习、使用MicroStation软件人员的参考书,而且也可作为建筑行业的专业人员、研究人员、软件开发工程师、BIM爱好者及高校师生的常备参考书。
要构建一个实用的“智能”推荐系统,不仅需要有好的算法,还需要了解接收推荐的用户。本书分为两部分,第一部分侧重于基础架构,主要介绍推荐系统的工作原理,展示如何创建推荐系统,以及给应用程序增加推荐系统时,应该如何收集和应用数据;第二部分侧重于算法,介绍推荐系统算法,以及如何使用系统收集的数据来计算向用户推荐什么内容。作者还教授了如何使用最流行的推荐算法,并剖析它们在Amazon和Netflix等网站上的实际应用。本书适合对推荐系统感兴趣的开发人员阅读,从事数据科学行业的读者也能从书中获得启发。
《Oracle RAC核心技术详解》由Oracle RAC资深专家结合其多年的研究和工作经验撰写而成,不仅系统介绍了RAC的基本原理,同时包含一些测试和实际案例,以帮助读者更好地理解RAC的工作原理,以及如何在实际工作中运用这些知识来解决问题。 本书分为两部分,共13章。部分(章~第9章)对集群管理软件进行了详细介绍,涵盖关于10g CRS 和11g GI 的核心技术的详细介绍,包含集群的核心组件CSS、CRS以及11gR2新增的OHAS组件和守护进程,同时还包含诊断集群问题常用的诊断工具介绍。此外,由于从11gR2版本开始ASM已经变成了集群管理软件的一个组件,作者在这部分还介绍了和集群、数据库相关的ASM知识。第二部分(0章~3章)讲解RAC 数据库的核心技术—内存融合(Cache Fusion),详细介绍了内存融合技术的核心组件以及工作原理,并且还对RAC相关的性能调优知识进行了介绍,同
开发JavaScript库是入门前端领域的重要一步。本书旨在帮助前端开发者掌握现代JavaScript库的开发技术,让每个人都可以开源自己的现代JavaScript库。本书系统介绍了现代JavaScript库开发涉及的技术、原理和很好实践,以及将库开源后如何做好维护工作。在很好实战部分,本书选取了9个典型库作为案例,展示开发流程,代码清晰、完善。 本书既适合对现代JavaScript库开发及开源感兴趣的前端开发者阅读,也适合想要学习前端项目开发技术的初学者阅读。
本书提供了学习大数据技术及架构的一站式解决方案,覆盖了大数据生态圈中的完整技术体系,包括数据采集、数据存储、分布式资源管理、数据计算、数据分析、任务调度、数据检索、大数据底层基础技术和大数据集群安装与管理。 本书还介绍了多个企业级大数据应用案例(包括海量数据采集、“双十一”数据大屏、海量数据全文搜索系统等)和大数据平台架构案例(包括离线数据仓库架构、实时数据仓库架构、批流一体化数据仓库架构、数据中台架构、直播大数据平台架构、电商大数据平台架构等),可以帮助读者从全局角度理解大数据。 在本书中,技术内容基本上都是从零讲起的,结合原理和架构,以“图解+实战”的形式帮助读者轻松理解复杂的知识。 本书适合对大数据感兴趣的开发人员。无论读者是否接触过大数据开发,只要具备一定的Java开发
本书介绍了如何使用 Python 实现企业级的大数据全栈式开发、设计和编程工作,涉及的知识点包括数据架构整体设计、数据源和数据采集、数据同步、消息队列、关系数据库、NoSQL 数据库、批处理、流处理、图计算、人工智能、数据产品开发。 本书既深入浅出地介绍了不同技术组件的基本原理,又通过详细对比介绍了如何根据不同场景选择很好实践技术方案,并通过代码实操帮助读者快速掌握常用技术的应用过程,最后通过项目案例介绍了如何将所学知识应用于实际业务场景中。
本书是Inside Microsoft SQL Server 2005系列四本著作中的一本。本书及其续篇——《Microsoft SQL Server 2005技术内幕:T-SQL程序设计》介绍了SQL Server 2005中高级T-SQL查询、查询优化及编程相关的知识。这两本书侧重于解决实践中的常见问题,并讨论了解决这些问题的方法。它们将向你揭示基于集合(set-based)查询的强大威力,并解释为什么它比使用游标的过程化编程(procedural programming)更具优势。同时,它还会教你识别使用基于游标解决方案与基于集合解决方案的优劣。 书中还讲述了其他几种争议较多的构造(camstruct)——如临时表、动态执行、XML和.NET集成——它们在具有强大功能的同时,也具有极大的风险。 本书适合于需要编写或检查T-SQL代码的有经验的T-SQL程序员和数据库专业人员。读者可从中学到大量精湛的技巧,这些技巧会充实您的工具箱和编码技能,并让您顺利
本书详细讲述了如何充分利用革命性的Oracle Wait Interface(OWI)快速确定并解决数据库系统的主要问题和瓶颈,从而极大地提高工作效率。书中包含所有OWI特性的大量细节,包括等待事件视图及其应用,以及扩展的SQL追踪文件。这些宝贵资源有助于您充分利用这个进的诊断工具,从而将处理时间减到最少。 本书主要内容:使用等待事件统计信息确定性能问题; 监控会话级等待事件,并收集历史数据,以确定根本问题; 解释与I/O有关的常见等待事件; 诊断并解决与锁和串行化相关的问题 分析与延迟相关的等待事件; 确定秘解决Oracle Real Application Clusters环境中的瓶颈; 学习Oracle Database 10g中性能诊断和调整的有效方法。
、最完整的Oracle DBA资源 运用《Oracle Database 12c DBA官方手册(第8版)》披露的实践和专家级技术来维护性能卓越的Oracle数据库。本书在上一版的基础上做了全面更新,涵盖新功能和实用工具,如多租户体系结构、Oracle Database In-Memory选项和更强大的云功能;并列举每种主要配置的示例。你将学习如何成功地管理高度可用、 可靠、安全和可扩展的Oracle企业级数据库环境。 主要内容 升级到Oracle Database 12c 规划和管理表空间 借助高效的物理数据库布局和存储管理方法比较大限度地提高数据 库性能 监视数据库对象使用的磁盘空间 用撤消表空间管理事务 实施专家级性能调整技术 使用新增的Oracle Database In-Memory选项提高查询速度 利用身份验证、授权和审核等方式管理数据库安全 充分利用多租户数据库体系结构 利用Oracle RAC和Oracle Active Data Guard实现高可用性和高度扩展
本书内容包括高可用性、数据库备份与恢复,以及数据库优化。这三部分是 Oracle DBA必须掌握的内容,尤其是 RAC、Data Guard和 Stream部署在很多企业应用系统上,提供了系统的高可用性以及高可靠性,已经成为企业招聘面试的必考内容。 本书高可用部分介绍了 RAC、Data Guard和 Stream的原理、架构以及安装部署技术,同时还介绍了 ASM存储以及 Clusterware的维护技术。备份与恢复部分详细介绍了 Oracle的所有备份和恢复技术。数据库优化包括 SQL优化和数据库实例优化技术,并介绍了性能分析工具 Statspack与 AWR。各部分所涉及的技术都使用了大量的实例来说明。 本书面向需要进阶的初级 DBA、中级 DBA以及准备 OCM考试的读者。如果读者有着丰富的 DBA经验,但对于某些原理如 RAC、Data Guard、Stream和 ASM等不甚了解,也可以从书中获得解答。