阅读本书可以学习使用Python对数据集进行操作、处理、清洗和规整。第3版针对Python3.10和pandas1.4进行了更新,并通过实操讲解和实际案例向读者展示了如何高效地解决一系列数据分析问题。读者将在阅读过程中学习新版本的pandas、NumPy、IPython和Jupyter。 本书作者Wes McKinney是Python pandas项目的创始人。本书对Python数据科学工具的介绍既贴近实战又内容新颗,非常适合刚开始学习Python的数据分析师或刚开始学习数据科学和科学计算的Python程序员阅读。读者可以从GitHub获取数据文件和相关资料。 学完本书,你将能够: ·使用Jupyter notebook和IPython shell进行探索性计算。 ·掌握NumPy的基础功能和高级功能。 ·掌握pandas库中的数据分析工具。 ·使用灵活的工具对数据进行加载、清洗、转换、合并和重塑。 ·使用matplotlib进行信息可视化。 ·使用pandas的groupBy功能对数据集进行切片、切
本书主要介绍从高维数据中感知、处理、分析和学习低维结构的基本数学原理和高效计算方法,系统地归纳了建模高维空间中低维结构的数学原理,梳理了处理高维数据模型的可扩展高效计算方法,阐明了如何结合领域具体知识或考虑其他非理想因素来正确建模并成功解决真实世界中的应用问题。本书包括基本原理、计算方法和真实应用三个部分:基本原理部分系统地介绍稀疏、低秩和一般低维模型的基本性质和理论结果,计算方法部分介绍解决凸优化和非凸优化问题的有效算法,真实应用部分通过实例演示利用前两部分的知识改进高维数据处理和分析问题的解决方案。本书适合作为计算机科学、数据科学和电气工程专业的高年级本科生和研究生的教材,也适合学习稀疏性、低维结构和高维数据课程的学生参考。
信息系统监理师考试是全国计算机技术与软件专业技术资格(水平)考试(简称“软考”)中的中级资格考试,通过信息系统监理师考试可获得中级工程师职称。 软考目前已经变为机考,本书在全面分析知识点的基础之上,结合第2版考试大纲对机考的要求,对整个内容架构进行了科学重构,可以极大地提高考生的学习效率。尤其是针对单选题、案例分析题的核心考点,分别从理论与实践方面进行了重点梳理。通过学习本书,考生可掌握考试的重点,熟悉试题形式及解答问题的方法和技巧等。 本书可供备考信息系统监理师考试的考生学习参考,也可供各类培训班使用。
本书主要围绕南京图书馆非物质文化遗产影像资源的采集、制作、加工、传播以及数据库建构这几个方面展开,对近十年来的工作加以总结和思考,对非遗影像的制作和收藏提出建设性的意见。本书共分为九章,层层递进。第一章主要介绍公共图书馆与非物质文化遗产的关系,阐述其中的渊源,引出公共图书馆的非遗影像制作工作的必要性和重要性。第二章主要介绍南京图书馆十年来非遗影像数据库的建构历程,介绍工作经验和基本情况。第三章从《何处忆江南》这个项目来分析非遗影像专题中对非遗项目的选择标准。第四章从技术层面介绍南京图书馆外拍团队的拍摄技术和后期剪辑技术。第五章以《何处忆江南》这个项目分析非遗影像中非遗传承人的选择和人物的形象架构。第六章从视听语言角度,分析非遗影像的声音和画面,如何做到声画的统一。第七章从精
本书教你如何从基于时间的数据(如日志、客户分析和其他事件流)中获得即时、有意义的预测。在这本通俗易懂的书中,作者通过带有注释的Python代码进行全面演示,你将学习用于时间序列预测的统计和深度学习方法。通过跟随书中的实例锻炼你的技能,你很快就会准备好建立自己的准确、有洞察力的预测。
在数字中国这一国家战略的牵引下,数据要素和数字化转型的研究和落地如火如荼。数据中台是企业开展数据要素相关实践和数字化转型的关键基础设施,本书在这样的时代背景下,以帮助企业“管好数据、用好数据”为宗旨,内容围绕数据中台架构与建设方法论、数据中台建设流程和内容、数据中台工程化交付、数据中台行业解决方案4个维度全面、深度展开。 本书一共17章,逻辑上分为四个部分: *第1部分数据中台建设方法与架构设计(第1~3章) 首先,从产生、定义、认知、相关概念、建设方法论、架构等方面对数据中台进行了全面介绍,帮助读者建立对数据中台的清晰认识和理解,熟悉数据中台的建设机制;然后,总结了企业数据应用成熟度评估、数据中台在各个行业的应用场景,以及数据中台的成功要素。 *第2部分数据中台建设内容与运营方法(第4~10章)
《企业级数据架构:核心要素、架构模型、数据管理与平台搭建》由李杨著
本书由国内资深MySQL专家亲自执笔,国内外多位数据库专家联袂推荐。作为国内专享一本关于InnoDB的专著,本书的第1版广受好评,第2版不仅针对近期新的MySQL 5.6对相关内容进行了全面的补充,还根据广大读者的反馈意见对第1版中存在的不足进行了完善,全书大约重写了50%的内容。本书从源代码的角度深度解析了InnoDB的体系结构、实现原理、工作机制,并给出了大量很好实践,能帮助你系统而深入地掌握InnoDB,更重要的是,它能为你设计管理高性能、高可用的数据库系统提供不错的指导。 全书一共10章,首先宏观地介绍了MySQL的体系结构和各种常见的存储引擎以及它们之间的比较;接着以InnoDB的内部实现为切入点,逐一详细讲解了InnoDB存储引擎内部的各个功能模块的实现原理,包括InnoDB存储引擎的体系结构、内存中的数据结构、基于InnoDB存储引擎的表和页的物理存
这既是一本引导读者如何使用ChatGPT低门槛、高效率学习Python数据分析与挖掘方法的著作,又是一本指导读者如何使用ChatGPT精准、高效地进行Python数据分析与挖掘实操的著作。从读者对象的角度看,本书既大大降低了没有编程经验的读者学习Python数据分析的门槛,又为有经验的Python数据分析师提供了大量实用的AI数据分析技巧,帮助他们快速转型为具备AI能力的数据分析师。从核心内容的角度看,本书不仅讲解了如何在数据预处理、数据清洗、数据可视化等基础的数据分析环节使用AI工具,而且还讲解了如何在聚类分析、预测分析等高级的数据建模环节使用AI工具。阅读完本书,你将掌握以下知识:(1)数据分析、数据挖掘以及机器学习算法的基础知识。(2)ChatGPT等AI工具的注册及使用,以及如何使用这些AI工具学习Python。(3)使用ChatGPT辅助各种常见的数据操作和数
这是一部讲解企业如何利用指标推动数字化转型和实现数字化经营的著作,详细讲解了指标体系的设计方法、指标平台的产品设计和技术架构、指标在各行业落地应用的方法。本书由行业领先的数据智能产品提供商数势科技官方出品,融合了其创始人在百度、平安、等头部企业的技术研发经验和其团队服务近百家企业的实战经验,得到了来自清华大学、信通院、腾讯、、百度等10余位专家的鼎力推荐。具体地,本书主要讲解了以下五个方面的内容:(1)从指标驱动的数字化经营新模式开始,介绍指标管理对企业经营的重要意义。(2)指标体系的设计方法论,带着设计思维模拟指标拆解、设计、落地的全过程。(3)指标管理平台的产品设计与技术架构,介绍了作者团队在多年实践中总结出的“一处定义、全局使用”的指标平台建设方法。(4)深入零售、金融、制造
本书紧密结合当前边缘计算领域近期新的发展趋势与研究成果,本着务实具体、详略得当、启发创新的指导思想,系统、全面地介绍了边缘计算的原理与应用,包括基本概念、架构原理、核心技术、主要研究方向与挑战,以及多个应用的近期新研究进展。撰写本书时最艰难的是选择从哪些应用视角来讲述边缘计算。最终,我们选择了计算卸载、服务部署、视频分析、模型推断、联邦学习等当下应用最为广泛的若干应用进行了阐述。
本书分为两部分。第一部分为第1~7章,介绍了Python的语法、编程基础和对常见错误的处理。第二部分为第8~14章,介绍了Python的各种实践应用,分别是对目录和文件的操作,对Excel、Word和PDF文件的操作,在图像处理、网络爬虫领域的应用,以及Python的图形用户接口编程。本书以实践应用为目的,希望读者能够前后对应,根据例题举一反三。 本书可供Python爱好者和技术人员参考和自学,也非常适于用作高等院校的自动化类、电子信息类、机械类、计算机类等相关专业的教材。
。。。
变点问题是当前统计学和计量经济学领域的研究热点之一。本书介绍了模型误差为相依过程的均值变点模型,该模型涵盖了长记忆和中期记忆两种情形。在时间序列模型的框架下,探讨了多变点的估计问题;在面板数据的分析中,分别对均值的单公共变点和多公共变点进行了估计。本书建立了相依数据的均值变点估计量的渐近理论,包含相合性、收敛速度和极限分布等。此外,本书还通过蒙特卡洛随机模拟实验和实际数据分析验证了估计量的有限样本性质和理论方法的实用性。本书可供高等院校统计学、计量经济学等相关专业的学生、教师及科研工作者阅读参考。
本书全面介绍了数据中心规划、建设和管理中的基础理论和相关技术,并将虚拟化技术的思想渗透到各个环节,阐述了云数据中心建设的主要内容和具体方法。全书共7章。第1章对数据中心做了概述;第2章介绍了数据中心的基础环境建设;第3~6章分别介绍了数据中心的网络子系统、计算子系统、存储子系统和安全子系统;第7章围绕数据中心的运维管理,从基础环境、网络、计算、存储、安全等方面介绍了相关技术及工具。 本书可作为工科院校相关专业本科生、研究生的教材或辅导材料,也可供企业、高校和科研院所的信息化管理部门以及各类数据中心的管理和技术人员参考使用。
来自Oracle ACE的 书籍《Oracle RAC12.2架构高可用数据库 指南:概念、管理、优化和故障排除》已全面 新,覆盖当下 的工具和相关特性。在本书中,可以找到如何准备硬件、部署Oracle RAC集群以及无缝集成故障转移的保护机制。另外,故障诊断、性能调优以及应用开发等相关内容,也可以在本书中找到。 安装并配置Oracle Database 12cR2 RAC,使用Oracle ASM配置并管理磁盘组,使用服务、表决盘和OCR,探究Oracle RAC中备份恢复的内部工作机制,使用OWI诊断性能问题,洞察缓存融合和GRD操作的内部机制,部署工作负载均衡与TAF,使用 诊断技术处理Oracle集群软件故障。
本书介绍数据分析的统计基础、种类划分,并列举大量实例以说明数据分析方法和算法。内容主要分为4部分,第1部分为第1章,介绍一些概念,简单描述数据分析方法和一些实例;第2部分包括第2~7章,介绍描述性分析和数据预处理的主要方法,包括描述统计、多元描述分析、聚类以及频繁模式挖掘等;第3部分包括第8~12章,介绍预测性分析的主要方法,其中包括多种回归算法、二元回归、分类的性能测量以及基于概率和距离测量的方法,以及决策树、人工神经网络和支持向量机等较为先进的方法;第4部分为第13章,利用描述和预测这两种方法,简单讨论文本、网页以及社交媒体的应用。
Oracle数据库是数据库领域使用最广泛、占有市场份额优选的数据库管理系统。本书以Oracle Database 12c 发行版1(版本号为12.1.0.2.0)为基础,全面细致地介绍了Oracle
严晖、周肆清主编的《数据库技术与应用实践教程(SQL Server2008计算机专业群第2版普通高等教育十三五规划教材)》是与《数据库技术与应用(SQL Server 2008)》(第二版)配套的教学参考书,以SOL SerVer 2008数据库管理系统为实验平台,介绍了SQL Server的主要功能和数据库的基本操作方法,其中sQL语法均用实例验证,大部分例题配有图片说明。系统开发平台使用Windows 7环境下的Visual Basic.NET 2010,书中全部例题均在该系统环境中运行通过,图片为SQL Server 2008系统运行界面和Visual Basic.NET 2010运行界面的截图,直观、清晰,方便读者对照学习。 全书分为两篇:实验指导和课程设计案例。实验指导篇共安排19个实验,内容选择恰当,具有启发性和实用性,与教材内容紧密结合,强调对学生动手能力的培养,达到即学即用的目的;课程设计案例篇共安排5个案例,分别从文学、法学
本书按照读者的认知过程编排内容,由浅入深,详细得当。概念、方法、步骤都用实例说明,易于理解。对于数据库各种对象的创建方法和步骤,仅在重要处详细介绍,其他地方从略。 本书系统、全面地介绍了MYSQL的实用技术,围绕“教务管理系统”的实施与管理展开,以理论联系实际的方式,从具体问题分析开始,在解决问题的过程中讲解知识,介绍操作技能。全书共12章,包含15个课堂实践,基本实践任务(数据库的创建和管理,表的创建与管理)侧重于数据库的应用,面向数据库管理员岗位; 主要实践任务(数据查询,存储过程和触发器等)侧重于数据 查询和编程,面向应用软件开发人员,全书的示例均使用SQL语句实施和管理。 本书可以作为高职高专计算机相关专业和非计算机专业数据库基础和数据库开发课程的教材,也适合计算机软件开发人员、从
本书通过大量实战案例和项目全面讲解如何利用Python进行自动化办公,帮助广大职场人士快速处理大批量或重复性的工作,将过去需要一天或几天时间完成的工作,在几分钟或者十几分钟内完成,大大提高工作效率。 本书主要内容包括Python安装及编程方法、Python语法基础实战、自动化分析处理数据实战、自动化操作Excel文档实战、自动化图表制作实战、自动化操作Word文档实战、自动化制作PPT幻灯片实战、自动化操作PDF文档实战、自动群发邮件及自动抓取网络数据实战和Python自动化办公实战项目。 本书将基础知识与实际工作场景案例相结合,图文并茂、由浅入深、易学易懂。 本书适合广大职场办公人士、财务人士、数据分析人士等用户阅读,也可作为中、高等职业技术院校程序设计课程的参考用书。
来自Oracle ACE的 书籍《Oracle RAC12.2架构高可用数据库 指南:概念、管理、优化和故障排除》已全面 新,覆盖当下 的工具和相关特性。在本书中,可以找到如何准备硬件、部署Oracle RAC集群以及无缝集成故障转移的保护机制。另外,故障诊断、性能调优以及应用开发等相关内容,也可以在本书中找到。 安装并配置Oracle Database 12cR2 RAC,使用Oracle ASM配置并管理磁盘组,使用服务、表决盘和OCR,探究Oracle RAC中备份恢复的内部工作机制,使用OWI诊断性能问题,洞察缓存融合和GRD操作的内部机制,部署工作负载均衡与TAF,使用 诊断技术处理Oracle集群软件故障。
来自Oracle ACE的 书籍《Oracle RAC12.2架构高可用数据库 指南:概念、管理、优化和故障排除》已全面 新,覆盖当下 的工具和相关特性。在本书中,可以找到如何准备硬件、部署Oracle RAC集群以及无缝集成故障转移的保护机制。另外,故障诊断、性能调优以及应用开发等相关内容,也可以在本书中找到。 安装并配置Oracle Database 12cR2 RAC,使用Oracle ASM配置并管理磁盘组,使用服务、表决盘和OCR,探究Oracle RAC中备份恢复的内部工作机制,使用OWI诊断性能问题,洞察缓存融合和GRD操作的内部机制,部署工作负载均衡与TAF,使用 诊断技术处理Oracle集群软件故障。