SQL是使用*广泛的数据库语言,绝大多数重要的 DBMS 支持 SQL。本书由浅入深地讲解了SQL的基本概念和语法,涉及数据的排序、过滤和分组,以及表、视图、联结、子查询、游标、存储过程和触发器等内容,实例丰富,便于查阅。新版对书中的案例进行了全面的更新,并增加了章后挑战题,便于读者巩固所学知识。
本书是一本基于 Python 实现全部例题计算的统计学教材,书中例题解答均给出了详细的实现代码和结果。全书共 11 章,第1章和第2章介绍数据、Python 的下载与安装、Python的数据类型和基本操作、Python 绘图基础等。第3章和第4章介绍数据的描述性分析方法,包括数据可视化和描述统计量。第5~7章介绍数据的推断性分析方法,包括概率分布、参数估计和假设检验。第8~11章介绍实际中常用的一些统计方法,包括类别变量分析、方差分析、回归分析、时间序列分析等。 本书可作为高等院校各专业开设统计学课程的教材,也可作为数据分析工作者、Python 数据分析和可视化爱好者的参考书。
SQL是使用最广泛的数据库语言,绝大多数重要的DBMS支持SQL。本书由浅入深地讲解了SQL的基本概念和语法,涉及数据的排序、过滤和分组,以及表、视图、联结、子查询、游标、存储过程和触发器等内容,实例丰富,便于查阅。新版对书中的案例进行了全面的更新,并增加了章后挑战题,便于读者巩固所学知识。
教材系统地介绍文本数据挖掘的相关概念,利用Python作为工具进行相关试验,其内容主要包括:文本挖掘产生的背景及发展;文本挖掘的概念、文本模型表示、文本内容的预处理,包括分词、去停用词以及特征抽取;文本相似度的概念等。介绍文本分类的概念及常用方法,如KNN算法、SVM算法等,并对分类结果进行评价;在介绍文本聚类聚类的概念时是,同样介绍聚类常用算法,如K均值算法、层次聚类法、密度聚类法等,作为有文本分类、文本聚类的应用,*后给出了信息抽取、社会网络中的实体关系抽取和事件抽取。
本书介绍了数据链的基本概念、发展历程和趋势,重点分析了Link-4、Link-11、Link-16和Link-22数据链的系统组成、工作模式、技术特点等内容,并以Link-16数据链为重点,全面阐述了该数据链的信道共享机制、时间同步技术、传输消息类型、封装结构、信号波形等内容,给出了多网、导航、中继、距离扩展等功能实现方法;以数据链关键技术为主线,详细论述了数据链的消息格式、信息传输、网络协议、通信安全等方面相关知识,剖析了数据链的本质。
本书与以往统计学中的概率论略有不同,添加了一些复杂数据类型的概率基础知识和模拟计算中的相关概率知识。具体安排如下所述。本书共分6章。第1章为概率与计数,基本内容是随机事件、概率空间、计数方法、概率的确定方法。第2章为条件概率,基本内容是条件概率与乘法公式、事件的独立性、全概率公式与贝叶斯公式。第3章为随机变量,基本内容是随机变量及其分布函数、随机变量的分类、二维随机向量、随机变量的独立性、随机变量函数的分布。第4章为常用的概率分布,基本内容是常用的离散型随机变量、常用的连续型随机变量、随机数的产生。第5章为随机变量的数字特征,基本内容是数学期望、方差和协方差、矩和矩母函数、条件期望。第6章为不等式和极限定理,基本内容是概率不等式、大数定律及其应用、中心极限定理。
数据湖仓是一个现代化的开放式架构,拥有当今热门的开源数据技术的广度和灵活性。本书从初学者的角度出发,通过对数据湖仓重要概念的剖析,对数据湖仓的相关知识进行深入浅出的讲解。全书共18章,对数据湖仓的基础知识、数据工程、业务价值、数据集成等方面进行深入探讨,同时展望数据架构的演化趋势,使读者能够领会数据湖仓的精髓,最终轻松、全面地管理数据湖仓项目。 本书适合数据架构师、业务人员和系统开发人员,以及对数据管理、数据分析感兴趣的读者阅读。
在云计算和互联网快速发展的驱动下,分布式技术领域产生了很多新的热点,分布式数据库就是其中之一。但是,目前对分布式数据库的理解和研究多停留在理论层面,本书以Greenplum分布式数据库为例,深入剖析分布式技术在工业级产品里的实现细节,为读者呈现从理论到实践的 全景图 。 本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。 本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现,实践性强。本书主要面向数据库领域的科研工作者
Power BI是微软推出的商业智能分析工具,它融合了数据准备、数据分析、数据可视化到报告协作分享的整个数据处理流程,帮助用户上手数据分析。 本书从实用的角度出发,结合作者本人的学习经验,从*基础的Power BI架构和操作界面开始,先通过一个小示例体验Power BI的强大和便捷,然后按照数据处理的流程和难易程度,分别介绍数据准备模块Power Query、数据建模以及Power BI数据分析语言DAX、可视化图表制作、丰富的交互方式和报表设计,*后用一个完整的分析示例带读者全面认识Power BI数据处理流程。 不论读者是学生、职场人士还是自由职业者,不论从事的领域是运营、财务、人力、管理还是电商,只要在平时的学习和工作中需要处理大量信息,分析各种数据,你就适合阅读本书学习Power BI,即使之前没有任何基础,它也可以帮你快速上手,提升自身竞争力。
本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
大数据审计已经成为目前审计领域研究与应用的热点。本书按照从常用电子数据审计方法到大数据审计方法的思路,不仅系统地分析了电子数据审计的理论知识(特别是大数据审计),还重点结合实际案例和具体操作,从审计数据采集、审计数据预处理和审计数据分析等电子数据审计的关键步骤出发,系统地分析了如何开展电子数据审计(特别是大数据审计)。附录中设计了9个实验模块(包括3个大数据审计实验模块),满足了开设实验课程的需要。 本书可作为高等院校审计、会计和信息管理等专业的教材,也可作为审计从业人员的专业培训教材和业务学习资料。
本书通过选购笔记本电脑的案例引入数据包络分析(dataenvelopmentanalysis,DEA)的基本概念和模型,并运用简单的EXCEL模型让读者更易理解和运用DEA。本书着重阐述如何将DEA作为一种运营分析工具,进行绩效评估,找出基准标杆。探讨的主题包括:平衡的基准,昀佳实践,相对效率的概念及绩效提升。特别地,本书探讨的数据分析方法能够帮助一个组织重新审视它对生产效率高低的已有观点是否合理,并为组织不断改进提供指导。本书是市面上唯一本不要求读者具备线性规划和线性代数知识,就可以熟练应用DEA方法的DEA方法指导用书。
本书是为广大数据分析师量身定制的入门读物,它旨在帮助读者站在大数据时代的制高点。数据分析处于统计学、计算机信息科学、运筹学、数据库等多个领域的交叉地带,大数据时代的到来大大丰富了数据分析的内涵,数据分析师的职责与以往相比发生了巨大的改变。本书全面介绍了经典数据分析、模式识别、机器学习、深度学习、数据挖掘、商务智能等多个领域的数据分析算法,将大数据时代的数据分析热点技术一网打尽。本书为每个数据分析算法都搭配了一个经典案例,并按照由易到难的原则构建知识框架,充分照顾了不同水平读者的阅读习惯。通过阅读本书,读者将对大数据时代下的数据分析有一个全面的认识。无论是入门级的数据分析员还是有一定基础的数据分析师,都能通过本书完善、加深对数据分析的认识。
MySQL作为一款开源的关系型数据库管理系统,有着强大的功能和广泛的应用领域,对促进信息化建设、推动数字经济发展起着重要的作用。本书全面介绍了MySQL数据库的技术原理、应用场景和开发实践,帮助读者掌握MySQL数据库的基本概念和高级特性,提升数据库设计与开发的能力。全书共11章,从数据库基础知识讲起,包括数据库概述、关系型数据库设计原则、SQL语言基础等内容,逐步深入介绍MySQL数据库的高级特性和应用技巧,如查询优化、事务管理、索引优化,延伸学习在数字经济发展情境下,数据库的发展趋势和应用等内容。此外,本书最后一章还通过两个综合应用项目将理论知识与实际应用结合在一起。 《MySQL数据库管理与应用》内容深入浅出,理论结合实际,可作为高等院校计算机、信息技术及相关专业数据库课程的教材,也可作为数据库初学者、软件
如今,推荐算法已经普遍应用于在线各个领域和场景,越来越多的商品、服务、用户通过推荐算法高效地连接彼此,每个人都享受到更加个性化的内容和服务。推荐已深刻地改变了我们与世界连接的方式。 本书聚焦在产品运营的角色上,探讨产品运营人员应该如何理解推荐算法,如何在不同的功能场景下应用推荐算法,如何从平台业务的角度对算法结果进行干预和再平衡。此外,本书着重于阐述不同功能场景下推荐的应用,辅以内容、电商、社交等业务下的应用实例。在每个章节中,都会枚举市面上已有产品功能或作者本人经历过的业务实践,以期给读者提供可以实操落地的借鉴。
Oracle数据库系统是数据库领域的数据库之一,姚瑶、苏玉主编的《OracleDatabase12c应用与开发教程(高等学校计算机应用规划教材)》以Oracle新版本OracleDatabase12cRelease1(12.1.0.2.0)为蓝本,全面、翔实地介绍应用OracleDatabase12c数据库管理系统进行数据库管理的各种操作以及数据库程序开发所需的各种知识和技能。全书共分为16章,深入阐述了OracleDatabase12c系统的基本特点、安装和配置技术、OracleDatabase12c的体系结构、数据库操作、数据表操作、SQL语言查询、PL/SQL编程、索引、视图、序列和同义词、存储过程和触发器、事务和锁、表空间、控制文件和日志文件、OracleDatabase12c的安全管理、备份恢复、闪回操作等内容。 本教材内容丰富、结构合理、思路清晰、语言简练、示例翔实。全书以一个实际的学籍管理数据库为案例介绍OracleDatabase12c的管理和开发技术,适合