本书是一本基于 Python 实现全部例题计算的统计学教材,书中例题解答均给出了详细的实现代码和结果。全书共 11 章,第1章和第2章介绍数据、Python 的下载与安装、Python的数据类型和基本操作、Python 绘图基础等。第3章和第4章介绍数据的描述性分析方法,包括数据可视化和描述统计量。第5~7章介绍数据的推断性分析方法,包括概率分布、参数估计和假设检验。第8~11章介绍实际中常用的一些统计方法,包括类别变量分析、方差分析、回归分析、时间序列分析等。 本书可作为高等院校各专业开设统计学课程的教材,也可作为数据分析工作者、Python 数据分析和可视化爱好者的参考书。
数据分析是现在不仅在互联网行业同时也在基础行业中必不可缺的运营手段,是业务提升效率、增强收益的有效方法。 本书的前8个章节精选提炼了多种数据分析中重要方法,包括ROI分析、数据标签和评分、用户生命周期、因果推断、可解释模型、PSM理论、ABtest、时序分析等,并通过更清晰、简单的方式向读者全方位的展示数据分析在以下诸多原理上的阐释,并且针对每种方法都提供了充足的生活和业务中的前沿案例作为辅助讲解,帮助读者更好的理解数据分析在传统行业、互联网行业及各类新兴行业的实际应用,同时也能更快的运用在实际工作和生活中,所以通过阅读前8个章节,读者可以系统的学习数据分析的理知识,拥有数据化思维,为读者能够在数据分析行业中不断深耕打下良好的理论基础并将数据分析能力逐步应用于实际的工作和生活中,成为一名合格的
本书介绍了柴油发电机组的分类、组成和工作原理,分析了柴油发电机组的功率标定和技术指标, 重点讨论了不同性质负载对柴油发电机组带载能力的影响,详细介绍了柴油发电机组供电方案的电源架 构和运行方式以及柴油发电机组的运维保养方法。此外,还介绍了机房安装的柴油发电机组和集装箱式 柴油发电机组的设计、安装的相关知识。 本书力求理论性和实践性相结合,书中所列的柴油发电机系统的供电方案及运维保养方法对当前主 流的数据中心柴油发电机系统普遍适用。本书是数据中心柴油发电机系统运维工作流程的指导性教材, 相信阅读本书一定会对数据中心柴油发电机系统运维管理从业人员大有裨益。
教材系统地介绍文本数据挖掘的相关概念,利用Python作为工具进行相关试验,其内容主要包括:文本挖掘产生的背景及发展;文本挖掘的概念、文本模型表示、文本内容的预处理,包括分词、去停用词以及特征抽取;文本相似度的概念等。介绍文本分类的概念及常用方法,如KNN算法、SVM算法等,并对分类结果进行评价;在介绍文本聚类聚类的概念时是,同样介绍聚类常用算法,如K均值算法、层次聚类法、密度聚类法等,作为有文本分类、文本聚类的应用,*后给出了信息抽取、社会网络中的实体关系抽取和事件抽取。
数据建模指的是对现实世界各类数据的抽象组织,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库。而数据模型是构建应用系统的核心,是尽可能精准地表示业务运转的概念性框架。本书通过平实的语言,对数据模型及建模过程进行了深入浅出的介绍。全书内容分为5个部分,对数据建模简介、数据模型要素,概念、逻辑和物理数据模型、数据模型质量以及数据建模的进阶内容等方面进行讲解,全面细致地为读者解答与数据建模相关的知识点和疑问。除此之外,本书的zui后还对各类专业术语进行了细致的解释,方便读者参考。本书是一本经典的数据建模指南,非常适合对数据建模感兴趣的读者以及从事数据科学等相关工作的专业人士参考阅读。
本书是普通高等教育 十一五 *规划教材。本书全面系统地介绍了数据挖掘和知识发现领域的基本原理、研究方法、部分产品和工业标准。全书共15章,其中,第1章介绍数据分析技术的发展历程,KDD与数据挖掘的概念、对象、过程、方法、相关领域和应用范围。第2章介绍关联规则基本模型和Apriori等经典算法。第3章在介绍距离概念的基础上,讨论包括划分、层次、密度等聚类方法。第4章介绍ID3、CART等决策树算法。第5章介绍图方法实现贝叶斯分类。第6章介绍VC维、支持向量机。第7章介绍人工神经网络。第8章介绍近期热点技术 深度学习。第9章介绍不平衡数据学习。第10章讨论过拟合、模型选择、模型评估等内容。第11、12章是不确定性、模糊性方法,分别介绍粗糙集和模糊集。第13章是Web挖掘,介绍Web链接分析、推荐系统和社交网络挖掘。第14章介绍数据预处理和可视
本书系统地介绍了大数据相关理论知识,重点阐述了大数据的基本原理、技术、平台和不同领域的应用案例。全书共分为8章:第1章为引论,介绍大数据背景、应用价值和基本概念;第2章到第7章为技术章节,分别介绍大数据获取、大数据管理、大数据处理、大数据分析与学习、大数据隐私保护和大数据治理等内容;第8章介绍大数据在行业中的典型应用案例,反映了大数据在社会经济生活中的重要价值。每个章节均设有习题。 本书既可作为高等学校大数据相关专业的教学用书,也可作为大数据领域相关技术人员的参考用书。
在云计算和互联网快速发展的驱动下,分布式技术领域产生了很多新的热点,分布式数据库就是其中之一。但是,目前对分布式数据库的理解和研究多停留在理论层面,本书以Greenplum分布式数据库为例,深入剖析分布式技术在工业级产品里的实现细节,为读者呈现从理论到实践的 全景图 。 本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。 本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现,实践性强。本书主要面向数据库领域的科研工作者
在数字化浪潮中,大数据技术无处不在,包括互联网、体育、工业、医疗、交通等在内的社会各行各业,都融入了大数据的印迹,大数据对人类的社会生产和生活产生了重大而深远的影响。一早醒来,多篇你感兴趣的推送文章早已占领手机屏幕;走在路上,智能手环实时监测着你的健康信息;想点外卖,小程序优先推荐最符合你口味的商家;骑车出行,导航系统会提供实时路况和最优路线避开拥堵;晚上回家,收到工厂根据你的身材比例剪裁制作的个性化服装。这些现象的背后,其实都和大数据息息相关。大数据技术正在不断与人类生产生活进行交汇与融合,并潜移默化地改变着世界的运作模式。本教材将从大数据的基本概念讲起,追溯大数据发展历程,并围绕大家身边的大数据应用,包含大数据在互联网、体育、工业、医疗、交通等方面的应用,以及大数据共享
本书以Oracle 19c for Windows10为实践平台,以学生-课程数据库和员工-部门数据库为实践案例,重点介绍数据库的基本原理、设计与实现方法,对传统的数据库理论进行精炼,保留核心与实用部分,采用案例教学的方式撰写,强调知识的层次性和技能培养的渐进性。全书共分为7章,分别介绍数据库系统绪论、关系运算理论、关系数据库标准语言SQL、数据库设计与规范化理论、数据库安全性与完整性、数据库备份与恢复、数据库并发控制等。本书提供PowerPoint电子教案、实验练习参考答案,课后习题参考答案、模拟试卷参考答案、核心知识点微视频讲解,方便教师教学和学生自学自测。本书可作为高等院校计算机及相关专业的教学用书,也可以作为从事相关专业的工程技术人员和科研人员的参考资料。
本书从新时代商业环境出发,紧随市场热点,如分布式自治组织(distributed autonomous organization,DAO)、非同质化通证(non-fungible token,NFT)、元宇宙、Web 3.0 、资产 数字化、反垄断、要素市场化配置等,以企业数字化转型为核心,以区块链等数字化技术 为基本点,以场景为基本面,勾勒了数字化时代分布式商业演化的新趋势,以及其对企业 经营管理的影响,提出了数字化时代企业数字化转型的新策略和分布式经营管理的低成 本、高效率发展方案。 本书全面分析了分布式商业产生的背景及其本质内涵,认为分布式商业是未来商业演 化的必然趋势。分布式商业生态战略不但是未来企业生存的基本战略,而且是元宇宙商业 生态建设的底层逻辑,并将Web 3.0 、DAO、NFT、元宇宙等新兴事物融入分布式商业生 态体系中,深度解读了数字化时代的新商业逻辑和战略思维。同
MySQL作为一款开源的关系型数据库管理系统,有着强大的功能和广泛的应用领域,对促进信息化建设、推动数字经济发展起着重要的作用。本书全面介绍了MySQL数据库的技术原理、应用场景和开发实践,帮助读者掌握MySQL数据库的基本概念和高级特性,提升数据库设计与开发的能力。全书共11章,从数据库基础知识讲起,包括数据库概述、关系型数据库设计原则、SQL语言基础等内容,逐步深入介绍MySQL数据库的高级特性和应用技巧,如查询优化、事务管理、索引优化,延伸学习在数字经济发展情境下,数据库的发展趋势和应用等内容。此外,本书最后一章还通过两个综合应用项目将理论知识与实际应用结合在一起。 《MySQL数据库管理与应用》内容深入浅出,理论结合实际,可作为高等院校计算机、信息技术及相关专业数据库课程的教材,也可作为数据库初学者、软件
Power BI是微软推出的商业智能分析工具,它融合了数据准备、数据分析、数据可视化到报告协作分享的整个数据处理流程,帮助用户上手数据分析。 本书从实用的角度出发,结合作者本人的学习经验,从*基础的Power BI架构和操作界面开始,先通过一个小示例体验Power BI的强大和便捷,然后按照数据处理的流程和难易程度,分别介绍数据准备模块Power Query、数据建模以及Power BI数据分析语言DAX、可视化图表制作、丰富的交互方式和报表设计,*后用一个完整的分析示例带读者全面认识Power BI数据处理流程。 不论读者是学生、职场人士还是自由职业者,不论从事的领域是运营、财务、人力、管理还是电商,只要在平时的学习和工作中需要处理大量信息,分析各种数据,你就适合阅读本书学习Power BI,即使之前没有任何基础,它也可以帮你快速上手,提升自身竞争力。
本书针对大数据、人工智能、信息管理、经济管理和其他相关专业学生的发展需求,系统、全面地介绍了大数据存储与管理的基本知识和技能,介绍了大数据存储基础、数据管理技术的发展、RDBMS与SQL、NoSQL数据模型、键值数据库、文档数据库、列族数据库、图数据库、数据库技术的发展(NewSQL),重点安排了熟悉MongoDB文档数据库和HBase列族数据库两个课程实践。全书具有较强的系统性、可读性和实用性。 本书是为高等院校相关专业 大数据存储 大数据存储与管理 大数据管理 等课程全新设计编写的具有丰富实践特色的主教材,也可供有一定实践经验的软件开发人员、管理人员参考,或作为继续教育的教材。
本教材的第1版于2007年被评为北京市精品教材。自出版以来得到广大读者的青睐,被数百所高校选为教材,两次再版。本书本着与时俱进的原则,根据数据库技术目前发展的前沿和教学需要,在多年教学、研究以及实际工程中积累的经验的基础上,借鉴了国外数据库课程的安排方法,采用了 应用、原理和提高的三段式 讲解法进行组织和编著的,书中内容由浅入深,便于学生对数据库学习的接受和理解。本教材以案例为线索,系统地介绍了数据库管理系统Access 2010的应用;数据库设计的理论和方法;以及以SQL Server 2008为背景,以T\|SQL为重点介绍了SQL语言的使用。本书还对数据库安全和数据库的发展进行了较为详细的阐述。本教材各章具有大量的习题,书后还提供了相应的上机实验和综合训练题,便于读者进一步理解和掌握各章所学到的知识,同时也便于组织教学。为
本书是MySQL数据库初学者的入门教材,书中以通俗易懂的语言、丰富实用的案例,详细讲解了MySQL的开发和管理技术。 本书是新型活页式教材,包含8个项目20个任务,以及1个附录。8个项目分别是MySQL实训环境配置,MySQL数据类型,创建与管理数据库及数据表,MySQL查询,创建与管理索引及视图,事务、存储过程与触发器,安全管理与维护数据库,综合案例开发。附录中给出了课证融通1 X大数据分析与应用考证的相关内容。 本书是双高建设项目支撑材料之一,配有丰富的教学资源(包括教学微课视频、教学课件、课时安排、教案、任务测试模拟试卷及答案),以帮助读者更方便地学习和使用本书,有需要的读者,可扫描书中二维码观看,或登录出版社网站下载。 本书可作为各类院校及计算机教育培训机构的专用教材,也可作为数据库开发爱好者的参考用书,还可以作
本书以提高轨道交通轴承故障诊断的准确性和高效性为目标,结合深度学习和大数据技术等领域**成果,系统地介绍了轨道交通轴承故障智能诊断模型构建的方法和技术。 本书共10章,主要内容包括: 轨道交通轴承故障诊断概述、轨道交通轴承结构及振动机理、轨道交通轴承故障诊断技术概述、基于卷积神经网络的轴承故障诊断方法、基于深度信念网络的轴承故障诊断方法、基于循环神经网络的轴承故障诊断方法、基于集成学习的轴承故障智能诊断方法、基于迁移学习的变工况轴承故障智能诊断方法、基于大数据平台的轴承故障智能诊断方法、轨道交通轴承故障智能诊断系统设计与实现。 本书可作为从事轨道交通故障诊断技术研究的科研人员和工程技术人员的参考用书,也可作为高等院校计算机科学与技术、软件工程、机械工程等相关专业 故障诊断智能技术 课程
本书主要阐述数据统计发布中的差分隐私保护模型及其关键算法。全书共8章,主要内容包括差分隐私基础知识、面向任意区间树结构及其扩展背景(考虑区间计数查询分布和异方差加噪)下的差分隐私直方图发布、面向流/连续数据发布的差分隐私保护、差分隐私数据发布方法的误差分析等。 本书主要面向高等学校计算机科学与技术、网络空间安全、管理科学与工程等学科相关专业高年级本科生、研究生以及数据安全隐私保护的研究者。
数据清洗是大数据预处理的关键环节。面对错综复杂的数据,传统的清洗 脏 数据工作单调且异常辛苦,如果能利用正确的工具和方法,可以让数据清洗工作变得事半功倍。 《数据清洗》讲解数据清洗的理论知识和实际应用,《数据清洗》共8章:第1章主要带领大家简单认识数据清洗;第2章主要讲解ETL技术相关的知识;第3章讲解Kettle工具的基本使用;第4章主要讲解数据清洗的一步 数据抽取;第5章主要讲解数据清洗与检验;第6章主要讲解数据转换相关的知识;第7章主要讲解数据加载相关的知识;第8章利用前面章节所学的知识构建一个DVD租赁商店数据仓库,目的是实现定期从源数据库sakila中抽取增量数据,转换成F合DVD租赁业务的数据,后加载到DVD租赁商店数据仓库中,便于后续在线DVD租赁商店的决策者对数据进行分析得出商业决策。 《数据清洗》附有
本书系统地介绍了图数据库的历史由来、建模方法、工作原理和一些真实的用户用例,详细地说明了图数据解决的是什么样的问题,并以Neo4j数据库和Cypher查询语言为例,阐述了图数据库的建模方法和领域用例,还介绍了图数据库的工作原理以及一些实用的图论算法。本书适合开发人员和数据库管理人员了解和学习图数据库时阅读,作为一门新的知识和独特的数据库领域来拓宽视野,也适合提供解决方案的负责人了解行业动向和新的解决问题的方式。通过阅读本书,读者可以对图数据库这一领域有一个透彻的了解。
随着信息化建设的推进,电子数据资源成为企事业单位的重要基础设施。云计算因能够实现计算和存储资源按需分配、快速部署等而迅猛发展。越来越多的团体或个人倾向于将数据迁移至云存储系统,基于云的存储和计算应用已经深入金融、工业、交通、医疗健康等传统行业。安全、高效地提供云服务对于相关技术人员来说既是机遇也是挑战。本书从云数据安全存储这一视角切入,重点解决云数据去重技术中面临的安全和效率问题,提出并系统地讲解了一系列适用于抗侧信道攻击的云数据隐私保护去重技术。本书共9章: 第1章介绍了云数据去重技术的基础知识和国内外研究现状;第2、3章介绍了一些基于上传流量混淆的去重技术;第4~7章介绍了基于响应值混淆的去重技术;第8、9章介绍了基于广义去重的云数据安全存储技术。 本书内容丰富,算法翔实,实用性强,
MongoDB是一种面向文档的分布式数据库,可扩展,表结构自由,并且支持丰富的查询语句和数据类型。时到**,MongoDB以其灵活的数据存储方式逐渐成为IT行业非常流行的一种非关系型数据库(NoSql)。 本书从学习与实践者的视角出发,本着通俗精简、注重实践、突出精髓的原则,剖析了MongoDB的诸多概念和要点。全书共分4个部分,分别从基础知识、深入理解MongoDB、监控与管理MongoDB和应用实践几个维度详细地介绍了MongoDB的特点及应用实例。 本书适合有海量数据存储需求的人员、数据库管理开发人员、数据挖掘与分析人员以及各类基于数据库的应用开发人员。读者将从书中获得诸多实用的知识和开发技巧。