SQL是使用最广泛的数据库语言,绝大多数重要的DBMS支持SQL。本书由浅入深地讲解了SQL的基本概念和语法,涉及数据的排序、过滤和分组,以及表、视图、联结、子查询、游标、存储过程和触发器等内容,实例丰富,便于查阅。新版对书中的案例进行了全面的更新,并增加了章后挑战题,便于读者巩固所学知识。
《SQL即查即用》从实用角度出发,由浅入深地讲解了SQL的基本概念、常用语法和操作技术。全书共24章,包括数据的简单查询、条件查询、模糊查询、过滤数据以及数据排序、分组、统计等内容,还包括子查询、多表连接、数据的增删改查、视图、存储过程、游标、事务处理以及数据库和数据表的管理等高级技术。包括200多个SQL语法,200多个应用示例。有很强的实用性和可操作性,既适合作为SQL初学者的学习用书,又适合作为程序开发人员和数据库管理人员随时查阅的参考工具书。为便于读者对SQL语法的理解,书中所有知识点和语法都结合具体示例进行讲解,并以对比图方式鲜明直观地展示数据变化,帮助读者快速掌握实际操作技巧,学以致用。书中还设置了注意、说明、常见错误、多学两招等贴心栏目,及时指出注意事项并给出相应的解决方案,帮助读者避开学
本书与以往统计学中的概率论略有不同,添加了一些复杂数据类型的概率基础知识和模拟计算中的相关概率知识。具体安排如下所述。本书共分6章。第1章为概率与计数,基本内容是随机事件、概率空间、计数方法、概率的确定方法。第2章为条件概率,基本内容是条件概率与乘法公式、事件的独立性、全概率公式与贝叶斯公式。第3章为随机变量,基本内容是随机变量及其分布函数、随机变量的分类、二维随机向量、随机变量的独立性、随机变量函数的分布。第4章为常用的概率分布,基本内容是常用的离散型随机变量、常用的连续型随机变量、随机数的产生。第5章为随机变量的数字特征,基本内容是数学期望、方差和协方差、矩和矩母函数、条件期望。第6章为不等式和极限定理,基本内容是概率不等式、大数定律及其应用、中心极限定理。
数据建模指的是对现实世界各类数据的抽象组织,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库。而数据模型是构建应用系统的核心,是尽可能精准地表示业务运转的概念性框架。本书通过平实的语言,对数据模型及建模过程进行了深入浅出的介绍。全书内容分为5个部分,对数据建模简介、数据模型要素,概念、逻辑和物理数据模型、数据模型质量以及数据建模的进阶内容等方面进行讲解,全面细致地为读者解答与数据建模相关的知识点和疑问。除此之外,本书的zui后还对各类专业术语进行了细致的解释,方便读者参考。本书是一本经典的数据建模指南,非常适合对数据建模感兴趣的读者以及从事数据科学等相关工作的专业人士参考阅读。
在云计算和互联网快速发展的驱动下,分布式技术领域产生了很多新的热点,分布式数据库就是其中之一。但是,目前对分布式数据库的理解和研究多停留在理论层面,本书以Greenplum分布式数据库为例,深入剖析分布式技术在工业级产品里的实现细节,为读者呈现从理论到实践的 全景图 。 本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。 本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现,实践性强。本书主要面向数据库领域的科研工作者
数据湖仓是一个现代化的开放式架构,拥有当今热门的开源数据技术的广度和灵活性。本书从初学者的角度出发,通过对数据湖仓重要概念的剖析,对数据湖仓的相关知识进行深入浅出的讲解。全书共18章,对数据湖仓的基础知识、数据工程、业务价值、数据集成等方面进行深入探讨,同时展望数据架构的演化趋势,使读者能够领会数据湖仓的精髓,最终轻松、全面地管理数据湖仓项目。 本书适合数据架构师、业务人员和系统开发人员,以及对数据管理、数据分析感兴趣的读者阅读。
本书展示了如何验证自己的设想、找到真正的客户、打造能赚钱的产品,以及提升企业知名度。30多个案例分析,全球100多位知名企业家的真知灼见,为你呈现来之不易、经过实践检验的创业心得和宝贵经验,值得每位创业家和企业家一读。 深入理解精益创业、数据分析基础,和数据驱动的思维模式 如何将六个典型的商业模式应用到各种规模的新企业 找到你的关键指标 确定底线,找到出发点 在大企业中应用精益分析,打造新产品
本书详细介绍了意大利那不勒斯菲里德里克第二大学Massimo Aria和Corrado Cuccurullo基于R语言开发的BIBLIOMETRIX工具包。该R工具包基本上涵盖了进行科学计量和知识可视化的功能,可以满足爱好R软件,并试图使用R进行科学计量和知识图谱分析的读者。在此基础上,本书对于科学计量与知识图谱相关的一些R工具包,包括rAltmetric、wordcloud2、gender以及tidytext等工具包进行了简要介绍。
如今,推荐算法已经普遍应用于在线各个领域和场景,越来越多的商品、服务、用户通过推荐算法高效地连接彼此,每个人都享受到更加个性化的内容和服务。推荐已深刻地改变了我们与世界连接的方式。 本书聚焦在产品运营的角色上,探讨产品运营人员应该如何理解推荐算法,如何在不同的功能场景下应用推荐算法,如何从平台业务的角度对算法结果进行干预和再平衡。此外,本书着重于阐述不同功能场景下推荐的应用,辅以内容、电商、社交等业务下的应用实例。在每个章节中,都会枚举市面上已有产品功能或作者本人经历过的业务实践,以期给读者提供可以实操落地的借鉴。
本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
本书主要介绍了数据可视化的基础知识、可视化工具的入门和应用、使用Python流行的库创建美观的数据可视化效果,并总结了了7大类40种不同的可视化图形,从基本信息、构成与视觉通道、适用数据、使用场景、注意事项、变体等多方面详细介绍了每种可视化图形的使用权方法,可作为常用可视化图形的使用手册。本书还提供了6个贴近大学生学习生活的可视化案例,为读者自由灵活应用可视化参考提供了有力的参考。 本书可作为高等院校数据科学与大数据技术、统计学及其相关专业的本科课程教材,也可供有一定实践经验的软件开发人员、管理人员作为自学和参考用书。