SQL是使用最广泛的数据库语言,绝大多数重要的DBMS支持SQL。本书由浅入深地讲解了SQL的基本概念和语法,涉及数据的排序、过滤和分组,以及表、视图、联结、子查询、游标、存储过程和触发器等内容,实例丰富,便于查阅。新版对书中的案例进行了全面的更新,并增加了章后挑战题,便于读者巩固所学知识。
《SQL即查即用》从实用角度出发,由浅入深地讲解了SQL的基本概念、常用语法和操作技术。全书共24章,包括数据的简单查询、条件查询、模糊查询、过滤数据以及数据排序、分组、统计等内容,还包括子查询、多表连接、数据的增删改查、视图、存储过程、游标、事务处理以及数据库和数据表的管理等高级技术。包括200多个SQL语法,200多个应用示例。有很强的实用性和可操作性,既适合作为SQL初学者的学习用书,又适合作为程序开发人员和数据库管理人员随时查阅的参考工具书。为便于读者对SQL语法的理解,书中所有知识点和语法都结合具体示例进行讲解,并以对比图方式鲜明直观地展示数据变化,帮助读者快速掌握实际操作技巧,学以致用。书中还设置了注意、说明、常见错误、多学两招等贴心栏目,及时指出注意事项并给出相应的解决方案,帮助读者避开学
本书与以往统计学中的概率论略有不同,添加了一些复杂数据类型的概率基础知识和模拟计算中的相关概率知识。具体安排如下所述。本书共分6章。第1章为概率与计数,基本内容是随机事件、概率空间、计数方法、概率的确定方法。第2章为条件概率,基本内容是条件概率与乘法公式、事件的独立性、全概率公式与贝叶斯公式。第3章为随机变量,基本内容是随机变量及其分布函数、随机变量的分类、二维随机向量、随机变量的独立性、随机变量函数的分布。第4章为常用的概率分布,基本内容是常用的离散型随机变量、常用的连续型随机变量、随机数的产生。第5章为随机变量的数字特征,基本内容是数学期望、方差和协方差、矩和矩母函数、条件期望。第6章为不等式和极限定理,基本内容是概率不等式、大数定律及其应用、中心极限定理。
数据建模指的是对现实世界各类数据的抽象组织,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库。而数据模型是构建应用系统的核心,是尽可能精准地表示业务运转的概念性框架。本书通过平实的语言,对数据模型及建模过程进行了深入浅出的介绍。全书内容分为5个部分,对数据建模简介、数据模型要素,概念、逻辑和物理数据模型、数据模型质量以及数据建模的进阶内容等方面进行讲解,全面细致地为读者解答与数据建模相关的知识点和疑问。除此之外,本书的zui后还对各类专业术语进行了细致的解释,方便读者参考。本书是一本经典的数据建模指南,非常适合对数据建模感兴趣的读者以及从事数据科学等相关工作的专业人士参考阅读。
在云计算和互联网快速发展的驱动下,分布式技术领域产生了很多新的热点,分布式数据库就是其中之一。但是,目前对分布式数据库的理解和研究多停留在理论层面,本书以Greenplum分布式数据库为例,深入剖析分布式技术在工业级产品里的实现细节,为读者呈现从理论到实践的 全景图 。 本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。 本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现,实践性强。本书主要面向数据库领域的科研工作者
本书以高等院校培养综合型交叉学科本科人才为发展目标而编写,介绍了空间数据库的原理与方法。全书共13章,主要内容包括:数据库系统概论、空间数据库、数据模型与空间信息模型、关系数据库模型、结构化查询语言、空间查询语言、关系模式的规范化理论、数据库设计与实施、空间数据存储和空间数据索引、数据查询优化、空间查询处理与优化、数据库技术新发展、空间数据库发展趋势。 本书内容丰富、结构合理、针对性强,理论叙述严谨、能力培养目标明确。读者学完本门课程后,应掌握空间数据库系统的基本知识、基本原理与方法。
本书作为《数据库基础教程(第2版)》的配套实验教材,共分为实验与模拟试题两个部分。*个部分为实验部分,有10个实验,其中前九个实验为基础实验,第十个实验为综合性设计实验,每个实验包括实验目的、实验内容和步骤、实验习题3个部分。模拟试题部分有选择题、填空题和操作题3种类型,后附参考答案。本书适合作为高校非计算机专业本科、专科学生学习的数据库相关课程的实验教材,也可作为Access的使用者、学习者与开发人员的上机实验参考书。作者开发有适合本教材的 实验自动批改管理系统 和 无纸化考试系统 ,使用本书的读者和教学单位可向出版社或作者(neuq@sina.com)索取。
数据湖仓是一个现代化的开放式架构,拥有当今热门的开源数据技术的广度和灵活性。本书从初学者的角度出发,通过对数据湖仓重要概念的剖析,对数据湖仓的相关知识进行深入浅出的讲解。全书共18章,对数据湖仓的基础知识、数据工程、业务价值、数据集成等方面进行深入探讨,同时展望数据架构的演化趋势,使读者能够领会数据湖仓的精髓,最终轻松、全面地管理数据湖仓项目。 本书适合数据架构师、业务人员和系统开发人员,以及对数据管理、数据分析感兴趣的读者阅读。
本书共分为5章,系统全面地介绍了MATLAB的基本知识和用法,包括:MATLAB基础简介、向量与矩阵运算、绘图、符号计算、程序设计。本书将MATLAB软件应用于数学、信息与计算科学专业的学习和研究中,解决相关课程中的科学计算、图形绘制、数值模拟与仿真等问题,提高科学计算与研究的效率,使读者具备利用MATLAB软件进行计算机处理、解决实际问题的能力。 本书读者对象为需要数学建模、学术研究分析、理论验证、图形仿真的各专业大学生、研究生,以及教师和科研人员。
本书展示了如何验证自己的设想、找到真正的客户、打造能赚钱的产品,以及提升企业知名度。30多个案例分析,全球100多位知名企业家的真知灼见,为你呈现来之不易、经过实践检验的创业心得和宝贵经验,值得每位创业家和企业家一读。 深入理解精益创业、数据分析基础,和数据驱动的思维模式 如何将六个典型的商业模式应用到各种规模的新企业 找到你的关键指标 确定底线,找到出发点 在大企业中应用精益分析,打造新产品
本书详细介绍了意大利那不勒斯菲里德里克第二大学Massimo Aria和Corrado Cuccurullo基于R语言开发的BIBLIOMETRIX工具包。该R工具包基本上涵盖了进行科学计量和知识可视化的功能,可以满足爱好R软件,并试图使用R进行科学计量和知识图谱分析的读者。在此基础上,本书对于科学计量与知识图谱相关的一些R工具包,包括rAltmetric、wordcloud2、gender以及tidytext等工具包进行了简要介绍。
如今,推荐算法已经普遍应用于在线各个领域和场景,越来越多的商品、服务、用户通过推荐算法高效地连接彼此,每个人都享受到更加个性化的内容和服务。推荐已深刻地改变了我们与世界连接的方式。 本书聚焦在产品运营的角色上,探讨产品运营人员应该如何理解推荐算法,如何在不同的功能场景下应用推荐算法,如何从平台业务的角度对算法结果进行干预和再平衡。此外,本书着重于阐述不同功能场景下推荐的应用,辅以内容、电商、社交等业务下的应用实例。在每个章节中,都会枚举市面上已有产品功能或作者本人经历过的业务实践,以期给读者提供可以实操落地的借鉴。
本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
当今社会,大数据技术已广泛应用于各行各业,大数据相关的存储和分布式计算等基本知识也成为了时下大学生尤其是计算机相关专业学生应具备的常识。本书在内容上去繁就简,重点介绍大数据的相关基本概念和原理,包括存储原理和分布式处理的原理。本书主要围绕Hadoop大数据处理平台(第2章),介绍其中涉及的HDFS(第3章)、HBase(第4章)等存储技术和Hadoop MapReduce分布式处理技术(第6章);介绍了大数据相关的存储技术NoSQL数据库(第5章)以及数据仓库技术Hive(第7章);并对新兴的大数据平台Spark(第8章)以及其他流行的大数据技术(第9章)进行了介绍。 本书适合计算机专业的低年级学生作为大数据入门课程的教材或者其他专业学生的大数据课程教材。
本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
数据库基础 是高校非计算机专业的必修课程。本书从数据库理论到应用到实例开发,以一个案例贯穿全书,共分为两大部分,*部分由前3章组成,主要介绍数据库技术的应用与发展、关系模型的基本概念、关系数据库的设计理论及数据库设计方法等内容;第二部分以Access 2013作为开发背景,主要介绍Access 2013数据库操作、表的创建和使用、查询设计、VBA基础、窗体设计、报表设计、使用宏和系统开发实例等知识。本书适合作为高校非计算机专业本科、专科学生学习数据库基础课程的教材,也可作为Access的使用者、学习者与开发人员的参考书。
本书主要介绍了数据可视化的基础知识、可视化工具的入门和应用、使用Python流行的库创建美观的数据可视化效果,并总结了了7大类40种不同的可视化图形,从基本信息、构成与视觉通道、适用数据、使用场景、注意事项、变体等多方面详细介绍了每种可视化图形的使用权方法,可作为常用可视化图形的使用手册。本书还提供了6个贴近大学生学习生活的可视化案例,为读者自由灵活应用可视化参考提供了有力的参考。 本书可作为高等院校数据科学与大数据技术、统计学及其相关专业的本科课程教材,也可供有一定实践经验的软件开发人员、管理人员作为自学和参考用书。
本书内容分为八章,基本涵盖了目前较为常用的数据科学建模方法,包括现在热门的深度学习。书中不仅介绍模型的理论基础,还以大量案例结合现实数据为读者展示了数据分析中常见任务的处理流程,如分类、回归、聚类、推荐、图片识别等,帮助读者应用这些模型和方法解决实际问题。 第1章首先对数据科学的任务和重要性进行了概述,接着介绍数据科学的建模流程以及Python语言开发环境与常用库; 第二章介绍了回归模型,包括线性回归和逻辑回归模型; 第三章介绍了聚类模型,包括k-means算法、DBSCAN算法和DIANA算法; 第四章介绍了关联规则分析,包括Apriori算法和FP-Growth算法; 第五章介绍了决策树模型,包括ID3、C4.5和CART算法及树的剪枝方法; 第六章介绍了支持向量机,包括线性和非线性支持向量机以及向量机的求解与多分类问题; 第七章介绍