本书与以往统计学中的概率论略有不同,添加了一些复杂数据类型的概率基础知识和模拟计算中的相关概率知识。具体安排如下所述。本书共分6章。第1章为概率与计数,基本内容是随机事件、概率空间、计数方法、概率的确定方法。第2章为条件概率,基本内容是条件概率与乘法公式、事件的独立性、全概率公式与贝叶斯公式。第3章为随机变量,基本内容是随机变量及其分布函数、随机变量的分类、二维随机向量、随机变量的独立性、随机变量函数的分布。第4章为常用的概率分布,基本内容是常用的离散型随机变量、常用的连续型随机变量、随机数的产生。第5章为随机变量的数字特征,基本内容是数学期望、方差和协方差、矩和矩母函数、条件期望。第6章为不等式和极限定理,基本内容是概率不等式、大数定律及其应用、中心极限定理。
SQL是使用最广泛的数据库语言,绝大多数重要的DBMS支持SQL。本书由浅入深地讲解了SQL的基本概念和语法,涉及数据的排序、过滤和分组,以及表、视图、联结、子查询、游标、存储过程和触发器等内容,实例丰富,便于查阅。新版对书中的案例进行了全面的更新,并增加了章后挑战题,便于读者巩固所学知识。
数据建模指的是对现实世界各类数据的抽象组织,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库。而数据模型是构建应用系统的核心,是尽可能精准地表示业务运转的概念性框架。本书通过平实的语言,对数据模型及建模过程进行了深入浅出的介绍。全书内容分为5个部分,对数据建模简介、数据模型要素,概念、逻辑和物理数据模型、数据模型质量以及数据建模的进阶内容等方面进行讲解,全面细致地为读者解答与数据建模相关的知识点和疑问。除此之外,本书的zui后还对各类专业术语进行了细致的解释,方便读者参考。本书是一本经典的数据建模指南,非常适合对数据建模感兴趣的读者以及从事数据科学等相关工作的专业人士参考阅读。
在云计算和互联网快速发展的驱动下,分布式技术领域产生了很多新的热点,分布式数据库就是其中之一。但是,目前对分布式数据库的理解和研究多停留在理论层面,本书以Greenplum分布式数据库为例,深入剖析分布式技术在工业级产品里的实现细节,为读者呈现从理论到实践的 全景图 。 本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。 本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现,实践性强。本书主要面向数据库领域的科研工作者
数据湖仓是一个现代化的开放式架构,拥有当今热门的开源数据技术的广度和灵活性。本书从初学者的角度出发,通过对数据湖仓重要概念的剖析,对数据湖仓的相关知识进行深入浅出的讲解。全书共18章,对数据湖仓的基础知识、数据工程、业务价值、数据集成等方面进行深入探讨,同时展望数据架构的演化趋势,使读者能够领会数据湖仓的精髓,最终轻松、全面地管理数据湖仓项目。 本书适合数据架构师、业务人员和系统开发人员,以及对数据管理、数据分析感兴趣的读者阅读。
如今,推荐算法已经普遍应用于在线各个领域和场景,越来越多的商品、服务、用户通过推荐算法高效地连接彼此,每个人都享受到更加个性化的内容和服务。推荐已深刻地改变了我们与世界连接的方式。 本书聚焦在产品运营的角色上,探讨产品运营人员应该如何理解推荐算法,如何在不同的功能场景下应用推荐算法,如何从平台业务的角度对算法结果进行干预和再平衡。此外,本书着重于阐述不同功能场景下推荐的应用,辅以内容、电商、社交等业务下的应用实例。在每个章节中,都会枚举市面上已有产品功能或作者本人经历过的业务实践,以期给读者提供可以实操落地的借鉴。
本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
本书详细介绍了意大利那不勒斯菲里德里克第二大学Massimo Aria和Corrado Cuccurullo基于R语言开发的BIBLIOMETRIX工具包。该R工具包基本上涵盖了进行科学计量和知识可视化的功能,可以满足爱好R软件,并试图使用R进行科学计量和知识图谱分析的读者。在此基础上,本书对于科学计量与知识图谱相关的一些R工具包,包括rAltmetric、wordcloud2、gender以及tidytext等工具包进行了简要介绍。
本书主要介绍了数据可视化的基础知识、可视化工具的入门和应用、使用Python流行的库创建美观的数据可视化效果,并总结了了7大类40种不同的可视化图形,从基本信息、构成与视觉通道、适用数据、使用场景、注意事项、变体等多方面详细介绍了每种可视化图形的使用权方法,可作为常用可视化图形的使用手册。本书还提供了6个贴近大学生学习生活的可视化案例,为读者自由灵活应用可视化参考提供了有力的参考。 本书可作为高等院校数据科学与大数据技术、统计学及其相关专业的本科课程教材,也可供有一定实践经验的软件开发人员、管理人员作为自学和参考用书。
技术文档翻译关乎企业全球化进程,是我国语言服务行业重要但却长期被忽视的领域,其翻译质量受制于译员对专业领域知识的系统理解。为帮助译员高效习得领域知识,本书借助知识本体技术,模拟人类认知思维过程,以云计算领域为例,构建了面向技术文档翻译的知识服务平台,论述了其构建原理、模型、流程及应用前景等。本书的研究源于技术写作行业实践,诉求于翻译人才专业知识水平的提高,延伸于企业国际形象建设,落脚于知识服务体系探索,回归于技术文档翻译质量。此过程体现了应用翻译研究与其他学科交叉融合的发展本质,更体现了数字人文建设的旨归。
在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!
数据库技术是计算机信息系统与应用系统的核心技术和重要基础,也是计算机科学技术中发展快、应用广的技术之一。从20世纪60年代末产生到现在,已形成了比较完整的理沦体系和一大批有应用前景的商品化系统,已成为计算机软忭科学领域的.个重要分支。 本书较为详细地讲述了数据库系统的基本概念、原理、方法、SQL语句同时阐述了数据库没计、实现的基本过程.此外根据我国的实际情况,网状和层次数据库系统已经很少使用,应用主流足关系数据库,所以本书在介绍基本概念和原理的时候重点阐述关系数据库的相关理论。同时专门在第5章介绍了关系数据库管邢系统Access的具体使用方法。 全节共分为6章,具体内齐如下: 第1章介绍数据斥技术的基准概念、数据模型、数据库体系结构。 第2章介绍关系模型、关系代数和关系数据库管理系
《数据库项目教学实践教程(Access 2010)》首先介绍了数据库的基础理论,使读者具备基本的知识背景。在此基础之上,将建立一个教学管理数据库系统这个总任务的实现过程贯穿于各个章节之中,并将其分解为不同的子任务。每个子任务包括项目任务描述、项目预备知识、项目实施和项目延伸4个环节。学习完预备知识之后,读者即可具备完成本章子任务的技术能力,在项目实施环节,《数据库项目教学实践教程(Access 2010)》把子任务分解为更小的任务以便于实现。《数据库项目教学实践教程(Access 2010)》的设计试图让读者通过轻松完成一个项目活动而掌握和具备开发小型数据库管理系统的知识和能力。
本书是由斯普林格出版社2018年出版的介绍物联网雾计算前沿技术的书籍,全书详细介绍了物联网雾计算发展的背景及驱动因素,系统分析了雾计算的计算服务、存储服务和通信服务;从雾层管理方面,阐述了雾计算中物联网资源评估所面临的挑战及模型,分析了雾计算的分层处理在物联网超大规模系统中的作用;从雾层服务方面,阐述了雾计算隐私保护的现状和未来,描绘了隐私保护领域自感知雾计算的发展,探讨了城市物联网边缘计算;以信息物理能源系统、医疗保健领域为例分析了雾计算应用实践。
近年来,针对互联网数据滥用、平台垄断、隐私泄漏等问题,全球兴起了Web3.0探索热潮,力图通过区块链等技术重构新一代互联网。2021年,国家《 十四五 数字经济发展规划》中指出,要推动数字技术在数据流通中的应用,鼓励企业、研究机构等主体基于区块链等数字技术探索数据授权使用、数据溯源等应用,提升数据交易流通效率;2022年,国务院《关于数字经济发展情况的报告》中也指出,数字经济成为重组全球要素资源、重塑全球经济结构、改变全球竞争格局的关键力量,其发展离不开区块链等数字产业。区块链的分布式账本和智能合约实现了数据的确权、定价、交易和赋能,是Web3.0中数字经济的 新基建 ,也是元宇宙的创作者所有权经济的基础。本书以笔者团队负责的真实区块链应用案例为蓝本,深度剖析了区块链如何赋能金融科技、智慧能源、企业管理和
《大数据相似查询关键技术研究》由清华大学计算机科学与技术系博士、华为数据库专家孙佶撰写。全书首先介绍了相似查询问题的现实应用和价值,以及面临的技术挑战;然后提出一个相似查询系统,并且介绍了高效相似查询索引、相似查询代价估算及人在回路实体相似匹配的核心技术和创新思考。全书提供了丰富的实验数据和结果,分析了各种技术的优劣,也为实际产品的技术选型提供了重要参考。 《大数据相似查询关键技术研究》共五章: 第1章绪论,介绍了全书的研究背景、研究内容及主要贡献,并概述了全书的结构安排。 第2章分布式内存相似查询系统Dima,介绍了分布式内存相似查询系统Dima。 第3章基于学习的相似查询基数估计,提出了一种基于学习的相似查询技术估计技术,使用这种基数可以帮助相似查询系统进行查询执行计划优化。 第4章基于相似
《Access数据库应用(2010版)》由韩培友编著,在精述数据库技术的基本原理和基本技术的基础上,详细介绍了Access 2010 的使用方法和应用技术。主要内容包括:数据库的创建和维护、表结构及其记录数据的编辑、数据查询、窗体设计、报表制作、宏的创建和调用等。本书以Access 2010为开发工具,以应用系统的研发过程为主线,以“学籍管理” 为实例,详细介绍了应用系统的设计方法与实现技术,并提供详细操作和完整系统。 本书内容丰富、深人浅出、通俗易懂、注重实用,并提供大量实用的例题和习题,便于读者巩固所学知识。 《Access数据库应用(2010版)》既可以作为高等学校非计算机专业学生数据库技术及其应用课程的教材,也可以作为从事数据库应用的工程技术人员的参考书。
本书定位是HBase从入门到应用的简明教程,特色是以实战案例为主,内容系统全面,讲解深入浅出,操作步骤清晰明了。本书配套示例源码、PPT课件、开发环境、教学视频、习题及答案以及其他丰富的教学 资源。 本书共分为8章,内容包括NoSQL数据库、HBase体系架构、HBase的接口、MapReduce与HBase、HBase表设计、HBase和Hive、HBase深入剖析、论坛日志分析实战。 本书既适合HBase初学者、大数据分析与挖掘初学者阅读,也适合作为高等院校和培训机构人工智能、大数据等相关专业师生的教学参考书。
C#语言已经成为.NET平台中*流行的编程语言。本书以Visual Studio 2012和SQL Server 2008为开发平台,从实际应用的角度出发,重点介绍了使用C#开发Windows应用程序的方法和技术。全书共9章内容,第1章为C#概述,介绍了Microsoft.NET平台概述、C#语言简介、Visual Studio集成开发环境和C#程序结构介绍;第2~3章为C#程序设计基础,通过实例以循序渐进的方式介绍了C#语言的各种语法、知识点和面向对象的基本思想;第4~5章介绍了使用C#语言开发Windows窗体应用程序,包括Windows窗体常用控件、菜单编程、对话框和多文档编程;第6章介绍了各种文件操作;第7章介绍了进程,包括线程和多线程编程;第8章介绍了数据库编程;第9章通过开发一个图书馆管理系统,全面介绍了软件开发流程,阐述了使用Visual C# 2012开发Windows应用程序的基本知识。本书内容立足于课堂教学和实际应用,各章均配有