本书旨在为包括研究生和工业从业者在内的研究人员提供有关为数据驱动的进化优化而开发的近期新方法的全面描述。本书共分12章。为了本书的自足性,第1~4章简要介绍了优化、进化计算和机器学习中精心挑选的重要主题和方法。第5章提供了数据驱动优化的基础知识,包括启发式算法和基于获取函数的代理模型管理。第6~8章介绍使用多个代理模型进行单目标优化的方法,其中第7章和第8章描述用于求解多目标和高维多目标优化算法的代表性进化算法以及代理模型辅助数据驱动的进化多目标和高维多目标优化。第9章详细阐述了高维数据驱动优化的方法,介绍了在半监督学习的帮助下,将知识从未标记数据转移到标记数据,从廉价目标迁移到昂贵目标、从廉价问题迁移到昂贵问题的大量技术,迁移学习和迁移优化在第10章中进行了描述。由于数据驱动优化是一个强
为什么花更少的钱买更偏远的房子不一定划算? 为什么得分最多的运动员不一定是好运动员? 为什么癌症发病率上升竟可能是一件好事? 泰勒主义、绩效管理、科学管理、关键绩效指标等理论都建立在同一个假设之上:如果你考核员工并提供激励,你就会得到理想的结果。但事实真的是这样吗? 我们使用衡量指标来了解世界上许多重要的事:教育和医疗系统是否高效,一个国家是否比另一个国家更富裕,哪个城市的生活质量更高……在这本书中,作者分享了许多选用错误的衡量指标,进而带来糟糕结果的案例,展示了衡量指标如何影响教育、医疗、商业,甚至城市发展。 为什么人们总是测量错误的数据,而忽视重要的指标设定?这本启发性的书提醒我们,并非所有重要的东西都计算得清楚,也并非所有计算得清楚的东西都重要。被各种量化指标裹挟的我们,要
本书作为循证医学微专业系列丛书的第一本,阐述了Meta分析与网状Meta分析以及GRADE分级方法的基础知识,并结合案例介绍了19种Meta分析软件如何实现单臂、双臂、网状和诊断试验准确性研究Meta分析,同时介绍了5种文献自动化检索软件、5种文献自动化筛选软件、2种偏倚风险评估辅助软件、3种数据辅助提取软件、4种辅助撰写软件以及2种证据分级软件。本书系统全面呈现了37种软件,实现了Meta分析数据分析和呈现一体化;力求“教了就会用”,利用图片把每个软件使用过程中遇到的核心问题与难点展示给读者,图文并茂,讲解深入浅出,可操作性强;内容实用性强,贴近前沿进展,具有指导意义。
本书主要介绍常用数学建模方法及其MATLAB实现与应用,内容包括MATLAB数组运算、程序设计、绘图、数据管理、符号计算、数值计算、多项式与插值拟合、常用统计及优化建模方法与MATLAB求解、人工神经网络方法、排队论方法、以层次分析法和模糊评价法为代表的多指标综合评价方法、MATLAB图像处理基础、Simulink建模与仿真、全国大学生数学建模竞赛真题解析等内容。同时,为便于学习,本书免费提供配套的所有数据及源程序。本书可以作为高等院校学生的数学建模或与数学实验相关课程的教材或教学参考书,也可作为从事数学建模应用的研究人员的参考用书。
本书是一本指导读者用数据分析思维解决商业问题的实战指南。用数据分析思维解决商业问题更重要的是了解如何思考问题。真正具备数据分析思维的人,即使对数据工具和分析思路了解得不多,也能够很好地解决问题。 本书分为三部分:思维篇、流程篇和实战篇。思维篇介绍了数据分析师需要掌握的思维能力,包括定义问题的思维、分析问题的思维、解决问题的思维。流程篇介绍了一个完整的案例分析流程,以及每个步骤内的具体操作方法和注意事项,包括分析流程、定义和分析问题、提出建议、结论汇报、其他分析方法。实战篇通过介绍不同场景的分析案例,帮助读者更好地掌握思维和流程的具体应用,包括用户增长分析案例、产品的用户留存分析案例、营销转化率分析案例、经营分析案例。 本书适合数据领域从业者、业务与管理人员、在校学生阅读。
本书在基本数据结构的基础上,围绕一些常用的高级数据结构,结合大量实战例题,深入分析“数据结构是如何服务于算法的”,这也是本书编写的一个核心理念:学习数据结构是为了“用好”数据结构。本次修订除了改错,主要是更换全书的程序代码为(C++)。本书的适用对象包括:中学信息学竞赛选手及辅导老师、大学ACM比赛选手及教练、高等院校计算机专业的师生、程序设计爱好者等。
本书系统地介绍边缘计算及其资源管理技术,首先讲解边缘计算的基本知识,分别阐述边缘计算的网络架构、基础技术与服务模式,以及资源管理的各类使能技术与平台。随后,深入分析边缘计算资源管理的基本问题和优化方法,分别讨论边缘智能、多无线接入网中的边缘计算、车辆边缘计算、工业物联网中的边缘计算、卫星边缘计算共5个典型应用场景下的边缘计算资源管理技术。 本书内容对边缘计算及其资源管理领域的知识获取、科学研究、技术研发等工作具有重要的参考价值,适合高校和科研院所的科研人员和学生、企业研发人员,以及其他需要了解和掌握边缘计算的技术人员和管理人员阅读参考。
这是一本从业务和技术双重视角解读数智化风控的著作,是企业界和学术界强强合作的重要成果。本书贯穿风控全链路,深度剖析了各业务环节所面对的核心风险,以及基于数据资源和智能技术来管控多重风险的解决方案。除了介绍通常关注的贷前、贷中、贷后风险管理,本书还讨论了反欺诈、反洗钱、特殊名单管理、多头风险管控等其他类型风险的应对方案,以及基于联邦学习的数据孤岛打通、基于关系网络的数据挖掘与风险建模等前沿方案。与同类书相比,本书以更完整的体系涵盖了营销、准入、授信、定价、定额、监控、处置等各个环节,以更开阔的视野涉及了信用、欺诈、洗钱等各类风险,以更丰富的维度拆解了核心业务的场景、问题、数据、技术和解决方案,既是对一线技术与业务实践经验的总结,也是对当下解决方案发展趋势的概括。
许多开发者掌握了Java、Spring Boot和MySQL等基础知识后,能够搭建一个简单的单体系统,但面对复杂系统的构建和管理时,往往感到迷茫和力不从心:对于高性能、高可用、高并发的分布式系统一头雾水,束手无策。本书首先介绍从单体架构到微服务架构的演化过程,帮助读者开阔技术视野。然后带领读者摆脱单体架构的束缚,深入领略集群、主从架构、分库分表、读写分离、微服务、API网关、NoSQL数据库、HDFS、分布式事务等分布式技术的无限魅力。此外,本书深入剖析了如何运用Kafka、RabbitMQ、RocketMQ等消息中间件和Elasticsearch搜索引擎来解耦应用,如何利用Docker、Kubernetes快速部署与隔离应用,以及如何借助冗余备份、高可用和异地多活策略保障系统稳定运行,让系统焕发新生。最后通过“支持5000万用户同时在线的短视频系统设计”和“日均订单量8000万的外卖系统设
Python是众多研究人员眼中的一流工具,主要原因在于它所提供的可用于存储、操作、洞察数据的各种库。数据科学堆栈的各个部分都存在多种资源,但只有本书的新版将它们汇集于一处,包括IPython、NumPy、pandas、Matplotlib、Scikit-Learn以及其他相关工具。熟悉阅读和编写Python代码的在职科技人员和数据处理人员会发现这份全面的案头参考书的第二版非常适合处理各种日常问题:数据的操作、转换、清理;不同类型数据的可视化;使用数据建立统计或机器学习模型。一句话,这是Python科学计算的推荐参考。
高质量的数据关乎企业运营、合规、决策和业绩的关键,哈佛商业评论的一项研究发现,企业中只有3%的数据符合质量标准,绝大多数公司都在寻求切实可行的指导来提高数据质量。本书作者基于多年在数据、数据分析和人工智能方面的实践经验,阐述了4步构建高质量数据体系。他提出了高质量数据的四阶段DARS方法(定义、评估、实现、持续)和10个数据质量很好实践案例,以此来提高业务中的数据质量水平,为业务提供数据价值,保证生成的数据可以有效支持高级分析和人工智能。在本书中,您将学习定义和评估数据质量的技术、标准和度量指标,了解如何确保公司的数据收集实践避免常见的陷阱。本书适合数据科学家、数据分析师、商业智能专业人士、首席技术官和数据官,以及对收集和使用高质量数据感兴趣的人士。对于有志成为首席数据官的各位读者,这
本书结合数据科学的具体应用场景,由浅入深、循序渐进地引导读者入门数据科学,覆盖了数据获取、数据预处理、数据分析等方面的内容,共10章。本书首先概括性地介绍各章的主要内容,然后通过一个个生动的案例讲解数据获取、数据预处理、自然语言处理、机器学习和深度学习等方面的典型应用,最后为读者提供进一步学习Python的方向和方法建议。本书各章的案例均基于具体应用场景,以简单、清晰的方式对数据科学相关的技术原理和实际操作进行讲解。 本书适合高等院校的理工科、管理学科的本科生、研究生学习,尤其适合非计算机专业但对计算机编程感兴趣的学生参考学习,同时也适合数据科学行业的从业者阅读。
本书讲述了数据库技术的发展史,从数据和数据库始,到区块链和大模型止,全面介绍了数据库技术的发展历程,包括数据库领域天才科学家、产品先行者的贡献,以及中国数据库的探索和发展格局,并试图对中国数据库的根社区发展、数据库架构演进方向做出推导和建议。 本书深入浅出地探讨了数据库发展过程中的关键技术、核心挑战,以及那些引人入胜的趣闻轶事。同时,书中还对数据库行业内的典型企业进行了细致的分析。通过阅读本书,读者不仅能领略到技术的魅力,还能从中汲取关于个人职业发展和企业产品研发的宝贵启示。此外,本书通过对数据库历史上成功与失败的企业案例剖析,还为读者提供了技术与商业融合的宝贵经验。 本书不仅适合对数据库技术感兴趣的读者,也非常适合作为本科生和研究生的教材,帮助他们深入了解数据库行业的发展历
本书通过真实案例,全面介绍Python 3编程基础及其数据分析工具的应用,培养读者通过数据分析问题、解决问题以及对结果评价的能力。全书内容包括:Python 3基本配置和编程基础、编程进阶、数据预处理、数据描述与数据探索、绘图与可视化、统计推断、相关分析、关联分析、回归分析、主成分和因子分析、聚类、判别与分类、列联分析、对应分析、定性数据分析、神经网络和深度学习、时间序列分析、信号滤波等,将读者关注的基本数据分析方法进行剖析。
《零基础学Python数据分析》(升级版)以数据分析“三剑客”Pandas、Matplotlib和NumPy为主线,从学习与应用的角度出发,全面介绍了数据分析推荐入门知识,帮助读者快速掌握数据分析技能,拓宽职场道路。本书通过大量的示意图辅助讲解,力求使读者能够快速理解晦涩难懂的专业术语,同时通过快速示例将知识与应用相结合,并给出实际项目的数据分析案例,让读者能够轻松学习,从而将数据分析与预测知识应用到实际工作中。 全书共10章,包括数据分析基础、搭建Python数据分析环境、Pandas入门、Pandas进阶、可视化数据分析图表、图解数组计算模块NumPy、数据统计分析案例、机器学习Scikit-Learn、Python股票数据分析(Jupyter Notebook版)、电商销售数据分析与预测。本书提供丰富的资源,包含快速示例、案例、项目、视频讲解,力求为读者打造一本“知识讲解+快速示例+综合
本书以Python3.10.7为平台,以实际应用为背景,通过概述+算法+经典应用的形式,深入浅出地介绍Python数据分析的相关知识。全书共9章,主要内容包括Python概述、科学计算库、开源科学集、数据分析利器、数据分析的可视化、基于回归的数据分析、基于分类的数据分析、基于聚类的数据分析、数据特征分析等。通过学习本书,读者可领略到Python的简单、易学、易读、易维护等特点,同时也可感受到利用Python实现数据分析应用领域广泛,功能强大。 本书可作为高等学校相关专业本科生和研究生的教学用书,也可作为相关专业科研人员、学者、工程技术人员的参考用书。
《Doris实时数据仓库理论与实战》系统地介绍了Doris的核心概念、架构原理和各项功能。全书共7章。第1章对Doris做了初步介绍。第2章重点介绍了Doris的数据表设计。第3章聚焦于Doris的数据导入。第4章介绍了Doris的数据导出和数据管理。第5章讨论了Doris中的数据更新和删除操作。第6章将读者带入Doris的进阶使用领域。第7章展示了Doris的生态扩展。通过《Doris实时数据仓库理论与实战》的学习,读者可以全面而深入地了解运用Doris构建高效、可扩展、实时数据仓库系统的方法,从理论到实践,从基础到进阶。《Doris实时数据仓库理论与实战》适用于Doris开发人员和数据工程师,或有志从事数据仓库开发的技术人员。
MySQL是风靡全球的数据库管理系统,被广泛应用于互联网场景。作为一名开发人员,掌握MySQL是推荐技能。本书从MySQL的安装与使用开始,逐步深入。首先宏观地介绍MySQL的目录结构、用户与权限管理、逻辑架构、存储引擎、InnoDB存储引擎中的数据存储结构等;然后介绍MySQL中的索引、性能分析工具的使用、索引优化、数据库的设计规范、数据库调优等;接着介绍MySQL中的事务和锁机制,以及MySQL如何保证事务的特性,涉及redo日志、undo日志、MVCC及各种锁的细节等知识;最后介绍数据库软硬件的性能优化,包括主从复制、数据库备份与恢复等。本书内容全面细致,讲解深入浅出,书中穿插了大量案例,做到了理论和实践相结合。本书主要以MySQL 8.0以后的版本为例进行讲解,同时融合了MySQL 8.0以前的版本进行比较,适用性更强。无论你是致力于构建和管理高性能、高可用
大数据时代,各行各业积累的数据不断增多,海量数据经过清洗、整理以后,基于分析与挖掘工作,才能获取到有用的数据信息,挖掘到数据背后的价值,掌握大数据的规律。而数据分析与挖掘的核心工作即是数据建模。数据建模,通俗地说,就是通过建立数据科学模型的手段解决现实问题的过程。 《数据建模方法与案例》共分为五章,内容包括数据建模概述、数据建模常用数据计算软件MATLAB和SPSS入门介绍、数据建模方法、实战案例分析等。《数据建模方法与案例》注重理论与实践相结合,不仅有详细的数据建模理论方法,还有赛题案例,以及非常详细的程序代码,让读者既能具备数据建模理论的基础,又能掌握解决数据建模问题的技巧与方法,还能轻松应对大数据问题的编程计算。
本书全面系统地介绍了大数据的测试技术与质量体系建设。本书共11章,第1~4章涵盖认识大数据,大数据技术生态,数据仓库的设计与构建,以及大数据项目开发流程;第5~7章讲解大数据测试方法、大数据测试实践和数据质量管理;第8~10章介绍大数据测试平台实践、数据治理平台建设,以及DataOps的理念与实践;第11章提供大数据测试学习路线。附录列出了大数据技术经典面试题。本书适合想要了解大数据技术的读者,以及想要学习和掌握大数据测试与大数据开发的从业者。通过阅读本书,测试工程师可以系统地学习大数据技术基础、大数据开发和大数据测试等知识;大数据开发工程师可以借鉴大数据质量保障的方法,拓宽数据工程实践的思路;技术专家和技术管理者可以了解大数据质量保障体系、数据治理建设和DataOps实践等内容。
数据要素是新型生产要素之一,因其蕴含着巨大价值,其重要性被提到了新的高度,但其理论体系尚未完全形成,全生命周期各个环节的理论和技术还在不断探索中。 《数据要素概论及案例分析》以数据要素知识体系构建和数据要素价值的发掘应用为主线,从理论和行业案例两个方面,对数据要素生命周期涉及的基础理论、概念和方法及数据要素驱动业务发展行业应用案例进行梳理和呈现。基础知识部分包括数据要素的属性、价值、支撑技术,数据要素规范管理、数据确权和交易,以及数据要素市场化配置等内容。行业案例部分从主数据管理实践、数据治理能力提升、数据要素驱动业务创新应用、数据要素催生创新模式四个方面梳理了21个案例,旨在通过多个行业领域的应用案例分析来帮助数据要素相关理论知识的理解和应用。
全书的知识点讲解主要分为4部分:第1部分主要介绍MySQL的基本语法,包括数据库简介、SQL语法、查询操作、数据统计、高级查询、内置函数、数据修改、表的操作、列的属性等;第2部分是高级技术,主要介绍MySQL的高级技术,包括多表查询、视图、索引、存储程序;第3部分提供了经典案例,供读者体会技术的应用;最后本书还提供了常用的参考资料。 为了让读者更好地掌握知识,本书结合实际工作以及面试需求,精心挑选了大量高质量的练习题。此外,本书还赠送配套的课件PPT以及各种资源供各大中专院校老师教学以及学生自学使用。
DolphinDB不仅支持海量数据的高效存储与查询,更开创性地提供了功能完备的编程语言以支持复杂分析,以及高吞吐、低延时、开发便捷的流数据分析框架,是计算能力不错的数据库系统之一。本书不仅介绍了如何使用DolphinDB这一兼有存储和高性能计算功能的数据库系统进行数据分析实践,还提供了大量金融和物联网等场景的实践案例,使读者通过借鉴和修改案例中的解决方案,将它们应用于自己的数据分析系统之中。本书从入门概念到实践应用分析均讲解得深入浅出、易于理解,是一本具有实践意义的数据分析工具书。即使是零基础的读者,也能通过学习本书,快速上手实践。
随着三维激光扫描传感设备硬件的快速发展,可保留三维空间中原始语义信息(几何信息、颜色、反射强度等)的点云已成为代表性的新型数据源之一。语义分割作为三维场景语义分析与解译的重要前提,在无人驾驶、高精地图、智慧城市等国家重大需求的推动下,已成为测绘遥感、计算机视觉等领域的重大研究课题。《点云数据语义分割的理论与方法》以语义分割的理论与方法为研究内容,以点云为研究对象,从点云类型、深度学习基础知识、点云的组织与管理、融合点云与图像的语义分割以及直接基于点云的语义分割等方面进行介绍,是一部多学科交叉、融合的点云语义分割著作。 本书可作为高等院校测绘遥感、卫星导航、计算机视觉、地理信息等学科的教学参考书,也可供科研院所、企业相关专业从业人员参考。
深度学习技术的引入使得多模态信息处理领域取得了巨大的突破。本书在介绍多模态信息处理的基础概念和典型任务的基础上,重点介绍最通用、最基础的基于深度学习的多模态信息处理技术。本书内容包括初识多模态信息处理、单模态深度学习表示技术、多模态深度学习基础技术、多模态预训练技术4部分:初识多模态信息处理部分介绍多模态信息处理的基础概念和典型任务;单模态深度学习表示技术部分介绍多模态深度学习模型中常用的文本表示和图像表示技术;多模态深度学习基础技术部分介绍多模态表示、对齐、融合和转换这4种技术;多模态预训练技术部分介绍多模态预训练技术。此外,为了让读者更好地理解理论的细节并实践这些多模态深度学习技术,本书提供了4个可运行的完整的实战案例,分别对应多模态表示、对齐、融合和转换这4种技术。 本书既