《深入浅出数据分析》以类似"章回小说”的活泼形式,生动地向读者展现出色的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧;正文之后,意犹未尽地以三篇附录介绍数据分析十大要务、R工具及ToolPak工具,在充分展现目标知识以外,为读者搭建了走向深入研究的桥梁。
阅读本书可以学习使用Python对数据集进行操作、处理、清洗和规整。第3版针对Python3.10和pandas1.4进行了更新,并通过实操讲解和实际案例向读者展示了如何高效地解决一系列数据分析问题。读者将在阅读过程中学习新版本的pandas、NumPy、IPython和Jupyter。 本书作者Wes McKinney是Python pandas项目的创始人。本书对Python数据科学工具的介绍既贴近实战又内容新颗,非常适合刚开始学习Python的数据分析师或刚开始学习数据科学和科学计算的Python程序员阅读。读者可以从GitHub获取数据文件和相关资料。 学完本书,你将能够: ·使用Jupyter notebook和IPython shell进行探索性计算。 ·掌握NumPy的基础功能和高级功能。 ·掌握pandas库中的数据分析工具。 ·使用灵活的工具对数据进行加载、清洗、转换、合并和重塑。 ·使用matplotlib进行信息可视化。 ·使用pandas的groupBy功能对数据集进行切片、切
Python是一门开源的计算机编程语言,凭借其易学、灵活等特点,得到了越来越多人的认可和青睐。金融科技日新月异,金融行业的数字化、科技化和智慧化快速推进,Python在金融领域有着很好的应用现状和前景。 本书在上一版的基础上进行了内容升级,持续聚焦Python在金融分析与风险管理的应用,第2版从原先的12章扩充至15章,并依次划分为基础篇(共5章)、中阶篇(共5章)以及高阶篇(共5章),基础篇结合金融场景演示了Python语言以及NumPy、pandas、Matplotlib、SciPy以及statsmodel等金融领域常用的第三方模块的编程方法;中阶篇通过Python编程结合金融实例,依次探讨利率、汇率、债券、股票、互换合约、期货合约等产品的定价、风险测度以及风险管控等内容;高阶篇则融合Python与金融案例,探究了期权的定价、希腊字母、动态对冲、隐含波动率、交易策略及其他延
商业分析有用吗?当然有用!商业分析是行走职场、创业启航的一项推荐技能。作者结合自己多年的工作经验,用生动的语言介绍如何用数据分析解决商业问题。本书分为6篇,共17章,其中第1篇是概念篇,讲述商业分析的基本概念;第2篇是基础篇,讲述如何用基础的分析方法评估企业经营状况;第3篇是进阶篇,讲述如何构建分析体系解决较复杂的问题;第4篇是高阶篇,讲述如何应对复杂的商业难题;第5篇是基础实践篇,通过案例讲述如何解决更复杂的商业问题;第6篇是高阶实践篇,通过案例讲述如何解决商业分析中的疑难杂症。本书的讲解思路是层层递进的,从简单场景到复杂场景,从基础的方法到复杂的方法。因此,无论读者是否有数据分析基础和经验,都建议从头开始阅读,这样可以一步步提升认知,更快地掌握商业分析的方法。
本书在前四版畅销书的基础上,根据SPSS 26.0软件升级的市场应用需求进行第5次升级修订。 本书结合具体的SPSS统计分析实例,图文并茂地介绍了近期新版本SPSS 26.0的各种统计分析方法,包括基本统计分析、参数与非参数检验、方美分析、相关分析、同归分析、名重响应分析、聚类分析、判别分析、因子分析、主成分分析、对应分析、时间序列模型、信度分析、生存分析和缺失值分析的原理和使用方法。全书注重内容的实用性,在译细介绍SPSS常用的提作功能基础上,通过一些综合应用案例(在医学、经济管理、自然科学和社会科学中的应用)来演示实际统计分析中SPSS的使用。 本书适用于SPSS软件17.0~26.0版本,作者录制了96个视频教学文件,读者可通过扫描各章节二维码阅读学习。本书可作为高校经济学、管理学、统计学、公共管理、社会学和卫生统计等专业学生学
本书旨在为包括研究生和工业从业者在内的研究人员提供有关为数据驱动的进化优化而开发的近期新方法的全面描述。本书共分12章。为了本书的自足性,第1~4章简要介绍了优化、进化计算和机器学习中精心挑选的重要主题和方法。第5章提供了数据驱动优化的基础知识,包括启发式算法和基于获取函数的代理模型管理。第6~8章介绍使用多个代理模型进行单目标优化的方法,其中第7章和第8章描述用于求解多目标和高维多目标优化算法的代表性进化算法以及代理模型辅助数据驱动的进化多目标和高维多目标优化。第9章详细阐述了高维数据驱动优化的方法,介绍了在半监督学习的帮助下,将知识从未标记数据转移到标记数据,从廉价目标迁移到昂贵目标、从廉价问题迁移到昂贵问题的大量技术,迁移学习和迁移优化在第10章中进行了描述。由于数据驱动优化是一个强
首席数据官(Chief Data Officer,CDO)是数字时代的产物,它在数字化转型的过程中,以及在转型成功后的数字经济中,都会起到关键作用。本书旨在建立一套相对完整的关于首席数据官的知识体系,帮助读者更好地参与数字时代的发展。 本书分为5篇。“第一篇 CDO概论”介绍CDO产生的背景、发展趋势、主要职责、推荐技能和工作路径等。“第二篇 管好数据”讲解CDO如何管理好数据,涉及数据战略、数据治理、数据制度、数据标准、数据架构、数据质量、数据安全、数据合规、数据建模、数据集成、数据存储、数据分析和挖掘、数据伦理、数据开放与共享等。“第三篇 做好转型”讲解CDO如何做好数字化转型。“第四篇 建好团队”讲解CDO如何构建、领导和考核数据团队。“第五篇 新技术、新模式、新业态”介绍一些与数据及CDO相关的新技术、新模式和新业态。 本书适
《零基础学Oracle》是针对零基础编程学习者研发的Oracle入门教程。从初学者角度出发,通过通俗易懂的语言、流行有趣的实例,详细地介绍了使用Oracle 11g进行数据管理的各方面技术。全书共分16章,包括Oracle 11g概述、Oracle管理工具、SQL*Plus命令、数据表操作、SQL查询基础、SQL查询进阶、子查询及常用系统函数、PL/SQL语言编程、游标以及企业人事管理系统等。书中所有知识都结合具体实例进行讲解,涉及的程序代码给出了详细的注释,可以使读者轻松领会Oracle 11g数据库管理的精髓,快速提高数据库管理技能。本书通过大量实例及一个完整项目案例,帮助读者更好地巩固所学知识,提升能力;随书附赠的《小白实战手册》中给出了3个实用数据库、数据表的创建、操作和系统维护流程,力求让学习者能学以致用,真正获得数据库管理经验;附赠的光盘中给出了视频讲解
本书根据PL/SQL的新版本进行了全面更新,涵盖从基础语法、程序控制到最新的优化和调优增强等方面的知识,通过真实的实验、大量的示例讲解了PL/SQL技能,是一本逐步分解的、详尽的PL/SQL编程教程。读者可以按照本书的步骤一步一步地完成每一个关键任务,掌握Oracle 21c PL/SQL编程技术,深度探索PL/SQL编程技术及最佳实践。本书既适合新手数据库开发人员和DBA阅读,也适合有一定经验的从业人员阅读。
本书深入剖析了组织中数据质量的重要性及提升方法,为组织打造优质数据提供了全面的指导。书中首先揭示了糟糕的数据质量对企业流程、决策及合规的潜在影响,进而阐述了提高数据质量的核心要素和端到端的实践流程。详细解析了数据质量提升方案的每个步骤,从构建业务案例到管理初期的繁忙阶段,再到确定关键利益相关者并明确数据规则,为读者提供了清晰的操作路径。此外,书中还介绍了数据监控与修正的有效方法,并探讨了如何将良好的数据实践融入企业日常运营。最后,作者总结了一份提升数据质量的完整纲要,配以实例和模板工具,以点燃读者的探索热情,并助力数据质量工作持续高效推进。 本书是企业数据质量管理的推荐指南,适合各类组织的数据从业者和管理者阅读参考。
本书以数据思维为主题,以数据分析全流程为主线,融合了编程语言、统计学基础及案例分析等内容,全书分为4篇,囊括了数据思维的概念和培养方法、数据来源及体系建设、数据分析三大思维方式及用户流失、用户转化实战等共11章的内容。本书囊括了数据分析中常用的分析方法,包括经典的海盗(AARRR)模型、麦肯锡的MECE模型、逻辑树、漏斗分析、路径分析、对比分析、A/B试验、RFM模型、K-Means算法、5W2H等分析方法,还包括各类方法的实践案例及Python实操项目。可以说本书是数据分析方法论与统计学知识、编程语言及应用案例的完美结合。
本书讲述了数据库技术的发展史,从数据和数据库始,到区块链和大模型止,全面介绍了数据库技术的发展历程,包括数据库领域天才科学家、产品先行者的贡献,以及中国数据库的探索和发展格局,并试图对中国数据库的根社区发展、数据库架构演进方向做出推导和建议。 本书深入浅出地探讨了数据库发展过程中的关键技术、核心挑战,以及那些引人入胜的趣闻轶事。同时,书中还对数据库行业内的典型企业进行了细致的分析。通过阅读本书,读者不仅能领略到技术的魅力,还能从中汲取关于个人职业发展和企业产品研发的宝贵启示。此外,本书通过对数据库历史上成功与失败的企业案例剖析,还为读者提供了技术与商业融合的宝贵经验。 本书不仅适合对数据库技术感兴趣的读者,也非常适合作为本科生和研究生的教材,帮助他们深入了解数据库行业的发展历
为什么花更少的钱买更偏远的房子不一定划算? 为什么得分最多的运动员不一定是好运动员? 为什么癌症发病率上升竟可能是一件好事? 泰勒主义、绩效管理、科学管理、关键绩效指标等理论都建立在同一个假设之上:如果你考核员工并提供激励,你就会得到理想的结果。但事实真的是这样吗? 我们使用衡量指标来了解世界上许多重要的事:教育和医疗系统是否高效,一个国家是否比另一个国家更富裕,哪个城市的生活质量更高……在这本书中,作者分享了许多选用错误的衡量指标,进而带来糟糕结果的案例,展示了衡量指标如何影响教育、医疗、商业,甚至城市发展。 为什么人们总是测量错误的数据,而忽视重要的指标设定?这本启发性的书提醒我们,并非所有重要的东西都计算得清楚,也并非所有计算得清楚的东西都重要。被各种量化指标裹挟的我们,要
ChatGPT能够辅助用户完成从数据收集、预处理、分析到报告撰写的全过程,大大降低了数据分析的门槛。本书共分为 12 章,内容包括ChatGPT 的注册与登录、提示词的设计、GPTs、数据的收集与预处理、特征工程、各类数据分析方法(包括对比分析、分组分析、回归分析、分类分析和聚类分析等)、数据可视化,以及如何利用 ChatGPT 撰写数据分析报告等。每章都提供了丰富的示例和实用技巧,旨在帮助读者掌握利用ChatGPT 进行数据分析的方法,提高数据处理和分析的效率。本书适合数据分析师、市场研究人员、高校师生、科研人员以及任何对数据分析感兴趣的读者。通过阅读本书,读者不仅能学习到如何使用 ChatGPT 进行数据分析,还能深刻理解数据分析的核心概念和应用场景,从而在实践中更加游刃有余。
许多开发者掌握了Java、Spring Boot和MySQL等基础知识后,能够搭建一个简单的单体系统,但面对复杂系统的构建和管理时,往往感到迷茫和力不从心:对于高性能、高可用、高并发的分布式系统一头雾水,束手无策。本书首先介绍从单体架构到微服务架构的演化过程,帮助读者开阔技术视野。然后带领读者摆脱单体架构的束缚,深入领略集群、主从架构、分库分表、读写分离、微服务、API网关、NoSQL数据库、HDFS、分布式事务等分布式技术的无限魅力。此外,本书深入剖析了如何运用Kafka、RabbitMQ、RocketMQ等消息中间件和Elasticsearch搜索引擎来解耦应用,如何利用Docker、Kubernetes快速部署与隔离应用,以及如何借助冗余备份、高可用和异地多活策略保障系统稳定运行,让系统焕发新生。最后通过“支持5000万用户同时在线的短视频系统设计”和“日均订单量8000万的外卖系统设
本书以面向应用为原则,深入浅出的介绍了oracle平台上使用pl/sql语言进行数据库开发的技术。通过大量的示例,详细介绍了pl/sql的语言特性、使用技巧,同时配以2个在实际工作中的示例来深入的剖析了pl/sql进行oracle开发的方方面面。 本书附带1张dvd光盘,内容为作者为本书录制的全程语音教学视频及本书所涉及的源代码。 本书共分为20章,分为5大篇。涵盖的内容主要有pl/sql语言基础、开发环境、变量与类型、控制语句、数据表的管理和查询、数据表的操纵、使用pl/sql的记录与集合、各种内置函数、游标、事务处理、异常处理、子程序、包、面向对象的开发等等技术点。通过示例性的代码,由浅入深,详细介绍了每一个技术要点在实际工作中的应用,对于各种技术要点的应用场合进行了细致的分析。 本书适合于使用pl/sql进行应用程序开
本书通过真实案例,全面介绍Python 3编程基础及其数据分析工具的应用,培养读者通过数据分析问题、解决问题以及对结果评价的能力。全书内容包括:Python 3基本配置和编程基础、编程进阶、数据预处理、数据描述与数据探索、绘图与可视化、统计推断、相关分析、关联分析、回归分析、主成分和因子分析、聚类、判别与分类、列联分析、对应分析、定性数据分析、神经网络和深度学习、时间序列分析、信号滤波等,将读者关注的基本数据分析方法进行剖析。
本书作为循证医学微专业系列丛书的第一本,阐述了Meta分析与网状Meta分析以及GRADE分级方法的基础知识,并结合案例介绍了19种Meta分析软件如何实现单臂、双臂、网状和诊断试验准确性研究Meta分析,同时介绍了5种文献自动化检索软件、5种文献自动化筛选软件、2种偏倚风险评估辅助软件、3种数据辅助提取软件、4种辅助撰写软件以及2种证据分级软件。本书系统全面呈现了37种软件,实现了Meta分析数据分析和呈现一体化;力求“教了就会用”,利用图片把每个软件使用过程中遇到的核心问题与难点展示给读者,图文并茂,讲解深入浅出,可操作性强;内容实用性强,贴近前沿进展,具有指导意义。
全书分为 8 章, 主要内容如下:第1章介绍学术论文插图绘制的规范性和基本原则以及学术论文插图的配色基础;第2章介绍绘制学术论文插图的主要工具,并重点介绍 Matplotlib、Seaborn、ProPlot 以及 SciencePlots 工具包的语法及其重要特征;第3章介绍学术论文中常见的单变量图及其绘制方法,包括直方图、密度图、Q-Q 图等;第4章介绍学术论文中常见的双变量图及其绘制方法, 具体包括误差线、柱形图、箱线图、相关性散 点图以及矩阵热力图等;第5 章介绍学术论文中常见的多变量图及其绘制方法,包括等高线图、点图系列、 三元相图、 3D 图系列以及 RadViz 图等;第 6 章介绍学术论文中常见的空间数据型图及其绘制方法,包括分 级统计地图、连接线地图、等值线地图以及子地图等;第 7 章介绍学术论文中常见的可视化图及其绘制方法,包括配对图系列、韦恩图、泰勒图
本书是一本指导读者用数据分析思维解决商业问题的实战指南。用数据分析思维解决商业问题更重要的是了解如何思考问题。真正具备数据分析思维的人,即使对数据工具和分析思路了解得不多,也能够很好地解决问题。 本书分为三部分:思维篇、流程篇和实战篇。思维篇介绍了数据分析师需要掌握的思维能力,包括定义问题的思维、分析问题的思维、解决问题的思维。流程篇介绍了一个完整的案例分析流程,以及每个步骤内的具体操作方法和注意事项,包括分析流程、定义和分析问题、提出建议、结论汇报、其他分析方法。实战篇通过介绍不同场景的分析案例,帮助读者更好地掌握思维和流程的具体应用,包括用户增长分析案例、产品的用户留存分析案例、营销转化率分析案例、经营分析案例。 本书适合数据领域从业者、业务与管理人员、在校学生阅读。
本书详细介绍数值分析的理论和方法,并用Julia编程语言给出了算法实现。第1章除了复习数值分析要用到的微积分知识外,还介绍了Julia基础,以及实数的计算机表达与由此产生的误差;第2~5章涵盖数值分析课程的四部分内容:方程求根、插值、数值积分和数值微分、逼近理论。本书通过直观图示或简单例子引入方法,然后透彻讲解方法的思路并给出几何解释。线性代数与微积分基础较好的学生可以用本书进行自学,教师则可以从中开阔眼界,学到与众不同的思维方式与教学方法。
本书在基本数据结构的基础上,围绕一些常用的高级数据结构,结合大量实战例题,深入分析“数据结构是如何服务于算法的”,这也是本书编写的一个核心理念:学习数据结构是为了“用好”数据结构。本次修订除了改错,主要是更换全书的程序代码为(C++)。本书的适用对象包括:中学信息学竞赛选手及辅导老师、大学ACM比赛选手及教练、高等院校计算机专业的师生、程序设计爱好者等。
本书全面讲解了Microsoft SQL Server故障排除和性能优化的很好实践。数据库工程师,包括数据库开发人员和数据库管理员,都将学习如何识别性能问题、并通过利用各种方法来排除系统故障,以及如何确定优化工作的优先级,从而尽可能获得很好系统性能。 本书作者是Microsoft数据平台的MVP和Microsoft认证大师(MCM),他解释了SQL Server数据库组件之间的相互依赖关系。你将学会如何快速检测分析你的系统并找到问题的根本原因。本书中提到的所有技术与所有版本的SQL Server都兼容,并涵盖了基于云的SQL Server安装步骤。 ·了解性能问题是如何体现在SQL Server中的。 ·了解SQL Server的检测工具、检测方法和检测技术。 ·对SQL Server的安装进行健康检查。 ·了解SQL Server组件之间的依赖关系。 ·优化SQL Server来提高性能并减少瓶颈。 ·检测优化效果不佳的查询语句和查询执行计划中效率低
本书共分为四篇。前三篇分别对应数据血缘的理论、实现和应用:第一篇阐明数据血缘的概念,主要介绍有关数据血缘概念的综合知识;第二篇介绍如何实现数据血缘,包括一些关于实现数据血缘的可行性见解和建议;第三篇介绍如何使用数据血缘,利用数据血缘结果实现不同的业务目的。第四篇是关于“构建数据血缘业务案例”的研究,介绍如何将数据血缘落地到业务案例中。本书主要面向数据开发人员和数据管理人员,用于针对数据血缘及其应用领域拓宽思路。本书也适合具有技术背景的数据业务人员参考阅读,便于更好地理解业务需求和数据血缘需求。