当前,数据驱动的理念已渗透到各个领域,数据科学和人工智能技术在制造业、金融、教育等多个行业中得到了广泛应用。Python作为一种编程语言,已成为数据科学和人工智能领域的事实标准,它丰富的生态系统进一步增强了它在这些领域中的重要性。然而,随着数据量的不断增长,如何利用Python加速数据科学处理,并将它扩展到集群上的并行计算,已成为数据科学家面临的重要挑战。本书详细介绍了4种数据科学工具:Dask、Ray、Xorbits和mpi4py,这些工具可以帮助数据工程师和科学家处理更大规模的数据集、训练更复杂的模型,并更高效地进行机器学习模型的迭代和部署。本书面向具备一定数据科学基础的数据工程师、数据科学家或领域专家,同时也适合大学生和研究生作为进入高性能数据科学领域的入门读物。
本书系统地介绍向量数据库的原理、技术实现及其应用,重点分析传统数据库在处理高维向量数据时的局限性,并提供相应的解决方案。本书分为4个部分,共13章,内容涵盖从理论基础到技术实践的多个方面,详细讨论高维向量表示中的信息丢失、嵌入空间误差和维度诅咒等问题,结合FAISS和Milvus等主流开源工具,深入剖析向量数据库的索引机制、搜索算法和优化策略。通过实际案例,展示向量数据库在推荐系统、行为分析、智能诊断、语义搜索等领域的应用,并特别强调企业级语义搜索系统的开发与部署经验。 本书不仅提供深度的理论指导,还通过丰富的案例帮助读者掌握如何构建高效的向量搜索引擎,适合从事搜索引擎与推荐系统开发的工程师,数据科学、人工智能及相关领域的从业者、研究人员,以及对向量数据库与相似性搜索感兴趣的读者,也可作为培训
ChatGPT能够辅助用户完成从数据收集、预处理、分析到报告撰写的全过程,大大降低了数据分析的门槛。本书共分为 12 章,内容包括ChatGPT 的注册与登录、提示词的设计、GPTs、数据的收集与预处理、特征工程、各类数据分析方法(包括对比分析、分组分析、回归分析、分类分析和聚类分析等)、数据可视化,以及如何利用 ChatGPT 撰写数据分析报告等。每章都提供了丰富的示例和实用技巧,旨在帮助读者掌握利用ChatGPT 进行数据分析的方法,提高数据处理和分析的效率。本书适合数据分析师、市场研究人员、高校师生、科研人员以及任何对数据分析感兴趣的读者。通过阅读本书,读者不仅能学习到如何使用 ChatGPT 进行数据分析,还能深刻理解数据分析的核心概念和应用场景,从而在实践中更加游刃有余。
本书旨在帮助数据行业的从业者在 AI 时代提升数据管理和数据技术认知水平,内容覆盖数据价值创造的理论、技术和实践。 本书共 8 章。第 1 章回顾企业数据的发展历史,并讲解现代企业数据组织。第 2 章从多维度解析数据价值的创造路径,包括从构建数字化决策、加速业务创新和推动 AI 变革等视角介绍数据价值创造的方法和成果。第 3 章系统讲解数据管理的方法与技术,包括数据资产管理、数据资产运营、数据平台架构的规划及实践案例。第 4 章讲解数据要素价值化的路径探索,包括数据要素在多行业的应用、基础体系、可信数据流通技术及数据资产入表。第 5 章讲解数据底座的技术与实践,包括数据底座的架构要求、分布式存储技术、分布式计算技术等,以及多种架构介绍。第 6 章讲解数据与 AI 的融合,包括推荐系统、基于 LLM 的数据治理分析、数据标注
《Python数据分析从入门到精通(第2版)》从数据分析初学者角度出发,以通俗易懂的语言、丰富多彩的实例,详细介绍了使用Python进行数据分析程序开发应掌握的各方面技术。全书共分21章,包括数据分析基础、搭建数据分析开发环境、NumPy模块之数组计算、Pandas模块基础、Pandas模块之数据的读取、Pandas模块之数据的处理、Pandas模块之数据的清洗、数据的计算与格式化、数据统计及透视表、处理日期与时间、Scikit-Learn机器学习模块、Matplotlib模块入门、Matplotlib模块进阶、Seaborn图表、Plotly图表、Bokeh图表、Pyecharts图表等内容,以及4个项目实战综合案例。书中所有知识结合具体实例进行介绍,涉及的程序代码给出了详细的注释,读者可轻松领会Python数据分析程序开发的精髓,从而快速提升数据分析开发技能。
本书根据各个公司的SQL复杂查询面试题进行编写,可以更好辅助读者进行针对性的学习。尤其每个SQL复杂查询面试题都通过步骤的形式进行解读,而非直接摆出一个答案。对比答案而言,解题思路更为重要。希望学习本书之后,读者可以拥有一份自己针对复杂查询的解题思路。本书共13章,分别对应SQL语句的查询基础、多表联查、元数据的查询与管理、字符串的查询与处理、数字的查询与处理、日期的查询与处理、JSON和XML的查询与处理、结果集的查询与处理、视图与临时表、存储过程与预编译语句、触发器与自定义函数、事务与锁、数据库备份、复杂查询面试题等相关内容。作者精心设计多种案例与复杂查询题目,非随意摆出的“难题”,而是基于工作时积攒的业务场景。本书适合初学者入门,适合准备开始面试的学生进行面试准备,适合开发多年却仍然对复杂查
本书以ANSYS 2021版本为依据,对ANSYS分析的基本思路、操作步骤、应用技巧进行了详细介绍,并结合典型工程应用实例详细讲解了ANSYS的具体应用方法。 全书分为两篇,共计15章。第1篇为操作基础,详细讲解了ANSYS分析全流程的基本步骤和方法,包括ANSYS概述、几何建模、划分网格、施加载荷、求解和后处理等内容。第2篇为专题实例,按不同的分析专题讲解了参数设置的方法与技巧,包括静力学分析、模态分析、谐响应分析、非线性分析、结构屈曲分析、谱分析、瞬态动力学分析、接触问题分析、高级分析等内容。 本书适用于ANSYS软件的初、中级用户,以及有初步使用经验的技术人员;本书可作为理工科院校相关专业的本科生、研究生及教师学习ANSYS软件的教材,也可作为从事结构分析相关行业的工程技术人员使用ANSYS软件的参考书。
本书以一个计算机教师的教学过程为场景,讲解数据结构和相关算法的知识。全书以趣味方式来叙述,大量引用各种各样的生活知识来类比,并充分运用全彩色图形语言来解读抽象内容,对数据结构所涉及的一些经典算法做出逐行分析、多算法比较。与同类图书相比,本书内容有趣易读,算法讲解细致深入,是一本非常适合自学的读物。对于学习数据结构来说,难点之一是对相关算法的理解。本书创新性地采用全彩印刷,图表、流程、代码等内容结合色彩来重新进行约定和归纳,使得对一些难以理解的知识点的解析更加清晰顺畅,极大提升了阅读体验。本书主要内容包含:数据结构介绍、算法推导大O阶的方法;顺序结构与链式结构差异、栈与队列的应用;串的朴素模式匹配、KMP模式匹配算法;二叉树前中后序遍历、哈夫曼树及应用;图的深度、广度遍历;最小生成
本书作为循证医学微专业系列丛书的第一本,阐述了Meta分析与网状Meta分析以及GRADE分级方法的基础知识,并结合案例介绍了19种Meta分析软件如何实现单臂、双臂、网状和诊断试验准确性研究Meta分析,同时介绍了5种文献自动化检索软件、5种文献自动化筛选软件、2种偏倚风险评估辅助软件、3种数据辅助提取软件、4种辅助撰写软件以及2种证据分级软件。本书系统全面呈现了37种软件,实现了Meta分析数据分析和呈现一体化;力求“教了就会用”,利用图片把每个软件使用过程中遇到的核心问题与难点展示给读者,图文并茂,讲解深入浅出,可操作性强;内容实用性强,贴近前沿进展,具有指导意义。
工业大数据分析与知识图谱作为人工智能领域的核心技术,已经成为当前学术研究和工程应用的焦点,受到越来越多的关注。本书从技术和实践的角度,为读者阐述工业大数据分析和知识图谱的核心技术及其实践应用。本书内容分为三篇。第一篇以物联网数据为基础,围绕工业大数据技术的“虚实融合”的CPS核心内容,开展数据治理、数据分析、数据平台的相关阐述,揭示数据驱动的生产系统优化模式;第二篇以人(社会网)机(互联网)物(物联网)数据为基础,围绕人工智能先进技术即知识图谱,探讨知识发现、知识图谱构建、知识服务、工业智能制造及知识服务平台等核心关键技术,为企业向智能制造的转型升级提供知识驱动的智慧共享的创新模式;第三篇基于前两篇的关键技术创新,开展重点行业、重点领域的典型场景应用,围绕钢铁、民用航空、电气等国民经济
《Power BI商业数据分析完全自学教程》是一本系统地讲解利用Power BI进行商业数据智能分析的自学宝典。本书以“完全精通Power BI”为出发点,以“用好Power BI”为目标来安排内容,全书共5篇,分为14章,循序渐进地介绍了Power BI的基本操作、数据导入、数据整理、数据建模、数据可视化分析、数据发布等相关技能。第1篇为基础入门篇(第1~3章),主要针对初学者,从零开始,系统、全面地讲解了Power BI的入门知识点、基本操作及数据的输入和连接操作。第2篇为数据处理篇(第4~6章),介绍了Power BI数据的整理操作、表格中行/列数据的管理,以及Power BI数据的高级处理、M函数的使用等。第3篇为数据分析篇(第7~9章),介绍了Power BI数据的建模操作及DAX语言的入门和进阶操作等。第4篇为数据可视化篇(第10~12章),介绍了Power BI数据的可视化呈现过程及如何对报表
普及医疗大数据挖掘与可视化技术,对提升医疗行业数据的质量与处理效率、实现数据的价值优选化、推动精准医疗深入应用有着重要的作用。本书内容立足于医疗大数据的挖瓢与可视化,分为总体篇、数据基础篇、数据挖据篇、可视化篇、应用篇等5个部分,共10章,包含医疗大数据及其平台的概述,医疗大数据的采集、清洗、融合,医疗大数据挖掘概述、工具与方法,医疗大数据可视化概述、工具与方法,以及用实例展示医疗大数据可视化分析平台的设计与使用方法等内容。本书结构清晰,图文并茂,从实际应用角度探讨医疗大数据与数据挖掘及可视化技术的深度结合,适合从事医疗大数据相关工作的读者阅读,也适合作为高校相关专业学生的参考书。
首席数据官(Chief Data Officer,CDO)是数字时代的产物,它在数字化转型的过程中,以及在转型成功后的数字经济中,都会起到关键作用。本书旨在建立一套相对完整的关于首席数据官的知识体系,帮助读者更好地参与数字时代的发展。 本书分为5篇。“第一篇 CDO概论”介绍CDO产生的背景、发展趋势、主要职责、推荐技能和工作路径等。“第二篇 管好数据”讲解CDO如何管理好数据,涉及数据战略、数据治理、数据制度、数据标准、数据架构、数据质量、数据安全、数据合规、数据建模、数据集成、数据存储、数据分析和挖掘、数据伦理、数据开放与共享等。“第三篇 做好转型”讲解CDO如何做好数字化转型。“第四篇 建好团队”讲解CDO如何构建、领导和考核数据团队。“第五篇 新技术、新模式、新业态”介绍一些与数据及CDO相关的新技术、新模式和新业态。 本书适
本书以时间流线为经,以项目管理的三要素(质量、进度、投资)作纬,概述数据中心全过程的概念和优势,介绍项目前期工作、规划设计、工程实施、运维管理等阶段,以及不同的建设模式,旨在提供数据中心项目管理指引,帮助数据中心从业者实现安 全可靠、节能降碳的建设目标,推动数据中心行业朝可持续发展的方向转型。 本书适合数据中心建设和运维的各相关从业人员,以及政府和企事业单位的信息化部门、网络部门、运维部门等的各相关工作人员阅读。
《Oracle从入门到项目实践:超值版》采取“基础知识→核心技术→核心应用→不错应用→项目实践”的结构和“由浅入深,由深到精”的学习模式进行讲解。全书共5篇24章,篇讲解Oracle数据安装、配置与管
全书共10章:第1章介绍金融业务系统架构、数据库使用现状及太保的数据库转型历程;第2章介绍金融行业分布式数据库选型标准以及数据库选型考察要点;第3章重点介绍金融数据库转型降本策略,包括应用改造、测试成本、迁移成本、硬件成本、架构设计等环节,具有指导意义;第4~7章结合数据库转型实战经验以及OceanBase 4.2版本新特性,从数据库配置基线、开发规范、性能调优、管理转型等方面介绍OceanBase的很好实践;第8~9章介绍数据库改造及迁移案例,内容翔实;第10章介绍OceanBase备份与恢复的很好实践。 本书适用于金融IT从业者及OceanBase使用者。
互联网时代,数据和信息的规模急剧膨胀,各行各业都与数据紧密相连,因此急需能够充分利用数据和信息的人才。企业通过对数据和信息进行深入分析,可以提高收入、降低成本,从而获得竞争优势。 本书以企业长久生存为目标,以收入优选化、风险最小化、成本最小化三条业务主线思想为指导,逐步构建数据分析体系、数据评估体系、数据产品化体系共同运作的商业分析框架,详细描述如何利用商业分析技能帮助企业获取竞争优势。 本书融理论与实践于一体,本书方法论经过网易、的项目实践验证。无论是商业分析人员、数据分析人员,还是业务人员、企业管理人员,都会在阅读本书后受益匪浅。
本书主要讲解了应对数据分析师面试所需的基础知识与典型面试题的解答方法,内容以读者的阅读需求进行架构,力求使该者对面试题涉及的原理与解题思路有清晰的认知,以帮助读者在面试时举一反三,从容作答。本书共分为7章。第1章介绍了正确认识数据分析的一些必要知识,以及用人单位对数据分析师的要求,第2~5 章,分别介绍了概率论与数理统计基础、分析工具的使用、面试时常见的数据思维、数据挖掘等 4个部分的知识,其中分析工具包括 Python、Pandas、SQL 和Excel,第6章讲解了知名公司近年来典型面试题的解题思路:第7章讲解面试中除了答题之外的其他方面的知识,并基于真实的面试流程,从面试技巧角度给出了建议。本书适合想从事数据分析及相关岗位工作的读者阅读。
《matplotlib数据可视化实战》借助matplotlib讲解开展数据可视化实践所需要掌握的关键知识和技能,从设置图表基础元素(坐标轴、标签、颜色、数学符号等),到根据表现内容绘制不同类型的图表(折线图、条形图、圆饼图、小提琴图等),全面讲解了matplotlib的使用方法。为方便读者学习,书中对相关操作都配以案例及代码进行讲解,读者可以根据自身需求,灵活使用其中的函数和语句。本书适合数据分析、数据可视化领域的爱好者、从业者阅读,也适合作为高校相关专业的教材。
本书通过真实案例,全面介绍Python 3编程基础及其数据分析工具的应用,培养读者通过数据分析问题、解决问题以及对结果评价的能力。全书内容包括:Python 3基本配置和编程基础、编程进阶、数据预处理、数据描述与数据探索、绘图与可视化、统计推断、相关分析、关联分析、回归分析、主成分和因子分析、聚类、判别与分类、列联分析、对应分析、定性数据分析、神经网络和深度学习、时间序列分析、信号滤波等,将读者关注的基本数据分析方法进行剖析。
本书旨在帮助读者深入了解如何在数据中心网络矩阵中使用VXLAN BGPEVPN。本书首先介绍了数据中心的发展概况、如今的要求以及可编程矩阵的基本知识;然后,讲解了矩阵语义、BGP EVPN、多租户、控制并与数据平面交互、单播和组播、外部连通性、服务集成和设备部署等技术。通过阅读本书,读者可以了解并掌握VXLAN BGP EVPN的相关知识和功能,并将其运用于自己的系统中。本书适合网络架构师、工程师和运营人员阅读,也适合网络管理员和想要通过相应考试的考生学习。
本书从零基础读者的角度出发,通过通俗易懂的语言、丰富多彩的实例,循序渐进地让读者在实践中学习Oracle编程知识,并提升自己的实际开发能力。 全书共分为5篇18章,内容包括Oracle 19c概述、Oracle管理工具、SQL*Plus命令、数据表操作、SQL查询基础、SQL查询进阶、子查询、常用系统函数、PL/SQL语言编程、游标、过程与函数、触发器、索引和视图、完整性约束、管理表空间和数据文件、事务、数据导入与导出和企业人事管理系统等。书中知识点讲解细致,侧重介绍每个知识点的使用场景,涉及的代码给出了详细的注释,可以使读者轻松领会Oracle的精髓,快速提高开发与运维技能。同时,本书配套了大量教学视频,扫码即可观看,还提供所有程序源文件,方便读者实践。 本书适合Oracle初学者、数据库技术入门者自学使用,也可用作高等院校相关专业的教材
来自Oracle ACE的 书籍《Oracle RAC12.2架构高可用数据库 指南:概念、管理、优化和故障排除》已全面 新,覆盖当下 的工具和相关特性。在本书中,可以找到如何准备硬件、部署Oracle RAC集群以及无缝集成故障转移的保护机制。另外,故障诊断、性能调优以及应用开发等相关内容,也可以在本书中找到。 安装并配置Oracle Database 12cR2 RAC,使用Oracle ASM配置并管理磁盘组,使用服务、表决盘和OCR,探究Oracle RAC中备份恢复的内部工作机制,使用OWI诊断性能问题,洞察缓存融合和GRD操作的内部机制,部署工作负载均衡与TAF,使用 诊断技术处理Oracle集群软件故障。
本书以若干数据处理任务为主线,循序渐进地引导读者使用KNIME开源数据平台。书中提供了一些富有趣味性的数据处理案例,在一步一步解决问题的过程中,帮助读者熟悉KNIME当中众多节点的使用方法,以便在其他数据任务中举一反三。作为大数据时代的“Excel”,它将成为未来数字化、信息化社会工程师的工具之一。编写本书的目的就是以KNIME平台作为人与机器之间的有效媒介,助力各行各业高效发掘数据资产当中的价值。本书适合初学者入门,精心设计的案例对于工作多年的开发者也有参考价值,并可作为高等院校和培训机构相关专业的教学参考书。