本书是一本基于 Python 实现全部例题计算的统计学教材,书中例题解答均给出了详细的实现代码和结果。全书共 11 章,第1章和第2章介绍数据、Python 的下载与安装、Python的数据类型和基本操作、Python 绘图基础等。第3章和第4章介绍数据的描述性分析方法,包括数据可视化和描述统计量。第5~7章介绍数据的推断性分析方法,包括概率分布、参数估计和假设检验。第8~11章介绍实际中常用的一些统计方法,包括类别变量分析、方差分析、回归分析、时间序列分析等。 本书可作为高等院校各专业开设统计学课程的教材,也可作为数据分析工作者、Python 数据分析和可视化爱好者的参考书。
本书介绍了柴油发电机组的分类、组成和工作原理,分析了柴油发电机组的功率标定和技术指标, 重点讨论了不同性质负载对柴油发电机组带载能力的影响,详细介绍了柴油发电机组供电方案的电源架 构和运行方式以及柴油发电机组的运维保养方法。此外,还介绍了机房安装的柴油发电机组和集装箱式 柴油发电机组的设计、安装的相关知识。 本书力求理论性和实践性相结合,书中所列的柴油发电机系统的供电方案及运维保养方法对当前主 流的数据中心柴油发电机系统普遍适用。本书是数据中心柴油发电机系统运维工作流程的指导性教材, 相信阅读本书一定会对数据中心柴油发电机系统运维管理从业人员大有裨益。
本书第1版于1983年出版,至今已修订至第6版。教材出版近40年来为全国数百所高校采用。本书三次荣获优秀教材奖(1988年、2002年、2021年)。相应课程先后入选北京市精品课程、精品课程、精品资源共享课程、精品在线开放课程和一流本科课程。 本书系统全面地阐述了数据库系统的基础理论、基本技术和基本方法。全书分为4篇18章。篇基础篇,包括绪论、关系数据模型、关系数据库标准语言SQL、数据库安全性和数据库完整性,共5章。第二篇设计与应用开发篇,包括关系数据理论、数据库设计和数据库编程,共3章。第三篇系统篇,包括关系数据库存储管理、关系查询处理和查询优化、数据库恢复技术、并发控制和数据库管理系统概述,共5章。第四篇新技术篇,包括数据库发展概述、大数据管理系统、数据仓库与联机分析处理、内存数据库系统、区块链与数据库,共
本书以提高轨道交通轴承故障诊断的准确性和高效性为目标,结合深度学习和大数据技术等领域**成果,系统地介绍了轨道交通轴承故障智能诊断模型构建的方法和技术。 本书共10章,主要内容包括: 轨道交通轴承故障诊断概述、轨道交通轴承结构及振动机理、轨道交通轴承故障诊断技术概述、基于卷积神经网络的轴承故障诊断方法、基于深度信念网络的轴承故障诊断方法、基于循环神经网络的轴承故障诊断方法、基于集成学习的轴承故障智能诊断方法、基于迁移学习的变工况轴承故障智能诊断方法、基于大数据平台的轴承故障智能诊断方法、轨道交通轴承故障智能诊断系统设计与实现。 本书可作为从事轨道交通故障诊断技术研究的科研人员和工程技术人员的参考用书,也可作为高等院校计算机科学与技术、软件工程、机械工程等相关专业 故障诊断智能技术 课程
本书从新时代商业环境出发,紧随市场热点,如分布式自治组织(distributed autonomous organization,DAO)、非同质化通证(non-fungible token,NFT)、元宇宙、Web 3.0 、资产 数字化、反垄断、要素市场化配置等,以企业数字化转型为核心,以区块链等数字化技术 为基本点,以场景为基本面,勾勒了数字化时代分布式商业演化的新趋势,以及其对企业 经营管理的影响,提出了数字化时代企业数字化转型的新策略和分布式经营管理的低成 本、高效率发展方案。 本书全面分析了分布式商业产生的背景及其本质内涵,认为分布式商业是未来商业演 化的必然趋势。分布式商业生态战略不但是未来企业生存的基本战略,而且是元宇宙商业 生态建设的底层逻辑,并将Web 3.0 、DAO、NFT、元宇宙等新兴事物融入分布式商业生 态体系中,深度解读了数字化时代的新商业逻辑和战略思维。同
本书系统讲述数据仓库的基本概念、基本原理以及建立数据仓库的方法和过程。主要内容包括:决策支持系统的发展、数据仓库环境结构、数据仓库设计、数据仓库粒度划分、数据仓库技术、分布式数据仓库、ElS系统和数据仓库的关系,外部和非结构化数据与数据仓库的关系、数据装载问题、数据仓库与Web、ERP与数据仓库以及数据仓库设计的复查要目。 本书是数据仓库之父撰写的关于数据仓库的 权威著作,既可作为相关专业的研究生教材,也是数据仓库的研究、开发和管理人员的指南。
本书描述了数据的混杂特性、当前关于首席数据官报告体系的分歧、自适应规划的需求、平衡的实现以及特定的新执行模型;介绍了首席数据官过程改进框架,通过数据管理知识体系和数据管理成熟度模型描述了数据领导者使用的核心概念、技术和策略以及集成;描述了在当前领导者之外维持数据和实践改进所需的关键角色,以及首席数据官在其组织中实施解决方案时可能会面临的问题;*后描述了在公共领域正在进行的工作及将对公共和私营部门产生的影响。通过这本书,有助于首席数据官为他们的组织创造以数据为中心的价值,适合从事大数据、数据管理的人士阅读。
教材系统地介绍文本数据挖掘的相关概念,利用Python作为工具进行相关试验,其内容主要包括:文本挖掘产生的背景及发展;文本挖掘的概念、文本模型表示、文本内容的预处理,包括分词、去停用词以及特征抽取;文本相似度的概念等。介绍文本分类的概念及常用方法,如KNN算法、SVM算法等,并对分类结果进行评价;在介绍文本聚类聚类的概念时是,同样介绍聚类常用算法,如K均值算法、层次聚类法、密度聚类法等,作为有文本分类、文本聚类的应用,*后给出了信息抽取、社会网络中的实体关系抽取和事件抽取。
本书主要阐述数据统计发布中的差分隐私保护模型及其关键算法。全书共8章,主要内容包括差分隐私基础知识、面向任意区间树结构及其扩展背景(考虑区间计数查询分布和异方差加噪)下的差分隐私直方图发布、面向流/连续数据发布的差分隐私保护、差分隐私数据发布方法的误差分析等。 本书主要面向高等学校计算机科学与技术、网络空间安全、管理科学与工程等学科相关专业高年级本科生、研究生以及数据安全隐私保护的研究者。
本书从作者团队当前正在开展的研究出发,介绍网络可靠传输研究领域中的关键技术和研究成果。从网络可靠传输协议主要研究和解决的问题及其在动态的网络环境中面临的挑战展开,重点针对带宽受限网络的拥塞问题、广域网中路由过度缓存问题、数据中心网络中的 Incast 问题、5G 毫米波通信中的高动态适应性问题以及可靠传输机制的自适应问题进行研究,给出高效的网络传输机制和方法,为广大读者进行系统学习和深入研究提供参考。 本书可作为高等院校计算机、网络工程、物联网工程等专业本科生和研究生的选修教材或参考书。互联网技术研究与开发人员也可通过本书进一步了解网络传输技术。
Power BI是微软推出的商业智能分析工具,它融合了数据准备、数据分析、数据可视化到报告协作分享的整个数据处理流程,帮助用户上手数据分析。 本书从实用的角度出发,结合作者本人的学习经验,从*基础的Power BI架构和操作界面开始,先通过一个小示例体验Power BI的强大和便捷,然后按照数据处理的流程和难易程度,分别介绍数据准备模块Power Query、数据建模以及Power BI数据分析语言DAX、可视化图表制作、丰富的交互方式和报表设计,*后用一个完整的分析示例带读者全面认识Power BI数据处理流程。 不论读者是学生、职场人士还是自由职业者,不论从事的领域是运营、财务、人力、管理还是电商,只要在平时的学习和工作中需要处理大量信息,分析各种数据,你就适合阅读本书学习Power BI,即使之前没有任何基础,它也可以帮你快速上手,提升自身竞争力。
在数据湖仓的所有新增要素中,排名的就是可以利于数据分析和机器学习所用的分析基础设施。分析基础设施包括一众大家广为熟悉的东西,当然也包括一些可能对大家还有些陌生或略带新鲜感的概念。比如包括:元数据、数据血缘、 数据体量的度量 、数据创建的历史记录、数据转换描述。 数据湖仓的第二个新增要素,是识别和使用通用连接器。通用连接器允许合并和比较所有不同来源的数据。如果没有通用连接器,就很难(实际上是几乎不可能)将数据湖仓中的不同数据关联起来。但有了这个中西,就可以关联任何类型的数据。 使用数据湖仓,就有可能实现以往任何其它方式都不可行或不可能实现的某种程度的数据分析和机器学习。 但与其它架构一样,我们需要理解数据湖仓的架构以及它的能力,以便于我们基于这种架构创建数据分析蓝图和开展数据分析规
本书详细介绍了意大利那不勒斯菲里德里克第二大学Massimo Aria和Corrado Cuccurullo基于R语言开发的BIBLIOMETRIX工具包。该R工具包基本上涵盖了进行科学计量和知识可视化的功能,可以满足爱好R软件,并试图使用R进行科学计量和知识图谱分析的读者。在此基础上,本书对于科学计量与知识图谱相关的一些R工具包,包括rAltmetric、wordcloud2、gender以及tidytext等工具包进行了简要介绍。
大数据审计已经成为目前审计领域研究与应用的热点。本书按照从常用电子数据审计方法到大数据审计方法的思路,不仅系统地分析了电子数据审计的理论知识(特别是大数据审计),还重点结合实际案例和具体操作,从审计数据采集、审计数据预处理和审计数据分析等电子数据审计的关键步骤出发,系统地分析了如何开展电子数据审计(特别是大数据审计)。附录中设计了9个实验模块(包括3个大数据审计实验模块),满足了开设实验课程的需要。 本书可作为高等院校审计、会计和信息管理等专业的教材,也可作为审计从业人员的专业培训教材和业务学习资料。
本书针对单工作位置环境下主动服务能力不足的问题,在国家自然科学基金项目的资助下,以山东大学曾广周教授提出的迁移工作流系统框架为基础,研究了一类面向目标的迁移工作流主动服务方法,包括面向目标的迁移工作流主动服务环境构建方法、部分可观测环境下迁移工作流服务导航方法、面向目标的迁移工作流资源服务推荐方法和迁移工作流多服务主体收益分配方法,并通过实验对研究成果进行了验证和分析。 本书可作为从事相关领域研究的硕士研究生、博士研究生及科研人员的参考书。
本书全面介绍了数据中心建设和管理过程中的各个环节,将虚拟化技术的应用渗透到各个部分,阐述了建设云数据中心的主要内容和具体方法。围绕数据中心职能的各组成部分,将全书分为7章。其中,第1章为数据中心概述;第2~6章,分别介绍了数据中心的基础环境建设、网络子系统、计算子系统、存储子系统和安全子系统;第7章围绕数据中心的运维管理,从基础设施、网络、计算、存储、安全等方面介绍了相关技术及工具。 本书可供企业、高校和科研院所信息化管理部门以及各类数据中心的管理和技术人员参考使用,也可作为工科院校相关专业本科生、研究生的教材或辅导材料。
本书第1版于1983年出版至今已经第5版。第5版是 十二五 普通高等教育本科国家级规划教材。相应课程于2004年被评为北京市精品课程,2005年被评为国家精品课程,2014年被批准为国家级精品资源共享课。本书系统全面地阐述数据库系统的基础理论、基本技术和基本方法。全书分为4篇16章。基础篇包括绪论、关系数据库、关系数据库标准语言SQL、数据库安全性和数据库完整性,共5章;设计与应用开发篇包括关系数据理论、数据库设计和数据库编程,共3章;系统篇包括关系查询处理和查询优化、数据库恢复技术、并发控制和数据库管理系统,共4章;新技术篇包括数据管理技术发展概述、大数据管理、内存数据库系统和数据仓库与联机分析处理技术,共4章。本书可以作为高等学校计算机专业、信息管理与信息系统等相关专业数据库课程的教材。也可供从事数据库系统研究
本书介绍了数据工程的基本概念和理论基础,围绕数据资源建设的规划和管理问题,介绍数据资源规划和管理的概念、特征、作用和功能,系统介绍了数据资源规划理论的发展过程、核心思想基础、主流方法体系和具体实施步骤,以及数据资源管理涉及的治理、质量、集成等理论知识、支撑平台、关键技术和主流工具。本书内容划分为数据工程基础篇、数据资源规划篇、数据资源管理篇三个部分,其中数据工程基础篇涵盖数据工程概述、数据标准、数据模型等内容,数据资源规划篇涵盖数据资源规划理论、规划方法、需求分析、模型构建、实践与工具等内容,数据资源管理篇涵盖数据治理、数据质量管理、数据集成、数据中台等内容。 本书既可以作为高等院校信息管理与信息系统、信息资源管理、大数据工程以及计算机信息管理等专业本科生的教材,还
随着大数据的蓬勃发展,不少机构开始将源源不断的数据流导入到一个叫 数据湖 的设备中去。数据湖架构 是 数据仓库 之父撰写的全新著作,是帮助读者认识数据湖架构,并把数据湖打造成公司资产的指导手册。数据湖架构 共15章,分别涉及数据湖简介、数据池据湖内部结构、数据池及其结构、各种类型的数据池等技术话题,目的在于讲解如何构建有用的数据湖,以便数据科学家和数据分析师能够解决商业挑战并找出新的商业机会。数据湖架构 适合数据管理者、学生、系统开发人员、架构师、程序员以及zui终用户阅读。
本书为 1 X 职业技能等级证书配套教材,按国家 1 X 大数据平台运维职业技能等级标准编写。本书属于大数据平台运维初级教材,从大数据平台运维工程师角度由浅入深、全方位地介绍大数据平台运维的相关基础知识和基本实操。本书共分6个部分18章,*部分为大数据平台安装,涉及平台操作系统的使用、Hadoop平台安装、平台基础环境配置;第二部分为大数据平台配置,涉及Hadoop文件参数配置、Hadoop集群运行;第三部分为大数据平台组件的安装与配置,涉及Hive、HBase、ZooKeeper、Sqoop和Flume组件的安装与配置;第四部分为大数据平台实施,涉及大数据平台实施方案、培训方案;第五部分为大数据平台监控,涉及基于大数据平台的监控命令、监控界面和报表、日志和告警信息监控;第六部分为大数据运维综合实战案例,以实际项目为例介绍从平台部署、数据业务采集、数据