SQL是使用*广泛的数据库语言,绝大多数重要的 DBMS 支持 SQL。本书由浅入深地讲解了SQL的基本概念和语法,涉及数据的排序、过滤和分组,以及表、视图、联结、子查询、游标、存储过程和触发器等内容,实例丰富,便于查阅。新版对书中的案例进行了全面的更新,并增加了章后挑战题,便于读者巩固所学知识。
在数据湖仓的所有新增要素中,排名的就是可以利于数据分析和机器学习所用的分析基础设施。分析基础设施包括一众大家广为熟悉的东西,当然也包括一些可能对大家还有些陌生或略带新鲜感的概念。比如包括:元数据、数据血缘、 数据体量的度量 、数据创建的历史记录、数据转换描述。 数据湖仓的第二个新增要素,是识别和使用通用连接器。通用连接器允许合并和比较所有不同来源的数据。如果没有通用连接器,就很难(实际上是几乎不可能)将数据湖仓中的不同数据关联起来。但有了这个中西,就可以关联任何类型的数据。 使用数据湖仓,就有可能实现以往任何其它方式都不可行或不可能实现的某种程度的数据分析和机器学习。 但与其它架构一样,我们需要理解数据湖仓的架构以及它的能力,以便于我们基于这种架构创建数据分析蓝图和开展数据分析规
本书重点介绍Amos、Mplus 和SmartPLS 统计软件里的结构方程分析方法。包括结构方程模型路径图的构建与数据的收集,结构方程模型的识别、分析结果评价及修正,反映型指标、形成型指标与二阶段分析,调节效应分析、中介效应分析、多群体差异分析与潜在平均分析,以及结构方程模型高级的分析方法即贝叶斯检验、混合回归分析、潜在成长模型、MTMM 模型等内容。没有复杂的理论推导,而是结合作者自身的教学与科研实践,以数据为依托,深入浅出,使读者能在短时间内理解并掌握结构方程模型分析方法,进而应用到自己的研究实践中。
`
《战术数据链》全面系统地介绍了战术数据链的基本概念和工作原理,分类介绍了当前世界发达国家使用的各种典型的战术数据链,后对战术数据链在武器协同、航迹处理及数据链的规划和作战培训等方面的应用进行了探讨。 《战术数据链》图文并茂,讲解深人浅出,集理论与应用研究于一体,可供专业院校、国防工业科研装备部门、军事科研装备部门、军事指挥机关部门等方面的教学、科研、应用与管理人员阅读,对从事数据链装备研究的人员也具有重要的实用价值和参考价值。
数据结构教程(第3版) 第3版第2次印刷
本书的主要内容是作者及其合作者在复杂数据模型这一领域近些年的研究成果, 以及相关的最新进展. 全书共 6 章. 第 1 章简要介绍几类复杂数据模型和 bootstrap 等预备知识和相关研究问题. 第 2~6 章, 系统讨论各种复杂数据统计推断中的 bootstrap 基本理论、方法及其应用, 包括 Behrens-Fisher问题、异方差回归模型、异方差 ANOVA 和 MANOVA 模型、混合效应模型及高维数据分析中的 bootstrap 统计推断.
本书详细剖析LevelDB从使用到设计实现的方方面面,读后可了解谷歌Bigtable数据库的设计精髓,逻辑上可分为两部分。 第一部分着重讲解LevelDB的基础知识,主要内容如下。 1)基本数据结构,这是理解后续内容的基础,也可以加深对比较器、迭代器等常见数据结构的理解。 2)基本使用,如数据库打开、关闭以及基本的读写操作。 3)总体架构与设计思想,读后可掌握LevelDB的整体情况与设计思路。 4)公用基础类,读后可了解LevelDB中如何实现数值编码、内存管理以及文件读取等。 第二部分着重讲解LevelDB各模块的实现细节,主要内容如下。 1)Log模块的实现细节,以及如何通过Log进行崩溃恢复,并生成一个MemTable文件。 2)MemTable模块的实现细节,以及MemTable超过内存阈值时如何生成一个SSTable文件。 3)SSTable模块的实现细节。 4)Compaction原理与多版本管理。
本书主要围绕南京图书馆非物质文化遗产影像资源的采集、制作、加工、传播以及数据库建构这几个方面展开,对近十年来的工作加以总结和思考,对非遗影像的制作和收藏提出建设性的意见。本书共分为九章,层层递进。第一章主要介绍公共图书馆与非物质文化遗产的关系,阐述其中的渊源,引出公共图书馆的非遗影像制作工作的必要性和重要性。第二章主要介绍南京图书馆十年来非遗影像数据库的建构历程,介绍工作经验和基本情况。第三章从《何处忆江南》这个项目来分析非遗影像专题中对非遗项目的选择标准。第四章从技术层面介绍南京图书馆外拍团队的拍摄技术和后期剪辑技术。第五章以《何处忆江南》这个项目分析非遗影像中非遗传承人的选择和人物的形象架构。第六章从视听语言角度,分析非遗影像的声音和画面,如何做到声画的统一。第七章从精
数据作为新型生产要素,推动经济发展、提升生产力。本书从数据的基础认知、数据圈的诞生和发展以及数据蕴含的未来等角度开始谈起,进一步讨论了数据全生命周期管理的核心节点,以及企业数据应用和管理的难点与重点,最后从数据传统应用的不同领域进行解读分析,全面阐释了什么是数据、数据的应用以及数据的未来等内容。通过本书,读者可以感受到数据开启的美好新时代,也可以预期在各行各业中,数据拥有将不可能变为可能的超能力。全书共9章。第1章为基础章节,着重介绍了数据基本认知,包括数据起源、概念以及不断膨胀的数据圈;第2章对数据的不同类型、数据来源以及数据的创建位置等进行了深入介绍,让读者对数据有更全面的认知;第3章对于当前的数据以及数据的未来进行了分析和探讨; 第4~9章重点着墨于数据的应用,介绍了数据全生命
本书紧密围绕商业运作的需要来强调数据在经营活动中的实践应用,采用项目驱动方式,通过实训为指导来强化数据库相关知识点的深入学习。全书始终围绕网络书店销售管理系统为例子,通过共9章内容系统展示了从系统应用需求分析开始到数据库设计、数据库实现、网络数据库开发、数据库管理程序开发等一系列以满足商业需求为发端的、以数据库开发应用为线索的相关工作。这种一以贯之的学习方式提高了学习的成就感与目标性,有助于提高对于新管理实践和新技术发展的理解和掌握。
本书介绍了数据工程的基本概念和理论基础,围绕数据资源建设的规划和管理问题,介绍数据资源规划和管理的概念、特征、作用和功能,系统介绍了数据资源规划理论的发展过程、核心思想基础、主流方法体系和具体实施步骤,以及数据资源管理涉及的治理、质量、集成等理论知识、支撑平台、关键技术和主流工具。本书内容划分为数据工程基础篇、数据资源规划篇、数据资源管理篇三个部分,其中数据工程基础篇涵盖数据工程概述、数据标准、数据模型等内容,数据资源规划篇涵盖数据资源规划理论、规划方法、需求分析、模型构建、实践与工具等内容,数据资源管理篇涵盖数据治理、数据质量管理、数据集成、数据中台等内容。 本书既可以作为高等院校信息管理与信息系统、信息资源管理、大数据工程以及计算机信息管理等专业本科生的教材,还
本书是《数据结构》一书配套的实验教材,用于辅助实验教学。全书共分三篇。*篇为基础实验,介绍数据结构与算法基础知识的实验,包括线性表、栈和队列、串、数组,以及广义表、树和二叉树、图、查找、排序等内容,一共有12个实验。第二篇为综合实验,是数据结构知识的应用与提高,包括链表的应用,栈和队列的应用,树结构的应用,图结构的应用以及文本文件检索等综合性实验内容,共10个实验。第三篇为课程设计,详细介绍了7个课程设计的课题,综合性较强,另外还给出了一部分实训项目,内容涉及数据结构课程的多个应用领域,以引导学生进行开发实践。
数据清洗是大数据领域不可缺少的环节,用来发现并纠正数据中可能存在的错误,针对数据审查过程中发现的错误值、缺失值、异常值、可疑数据,选用适当方法进行 清理 ,使 脏 数据变为 干净 数据。本书共分为8章:第1章主要介绍数据清洗的概念、任务和流程,数据标准化概念及数据仓库技术等;第2章主要介绍Windows和类UNIX操作系统下的数据常规格式、数据编码及数据类型转换等;第3章介绍ETL概念、数据清洗的技术路线、ETL工具及ETL子系统等;第4章介绍Excel、Kettle、OpenRefine、DataWrangler和Hawk的安装及使用等;第5章介绍Kettle下文本文件抽取、Web数据抽取、数据库数据抽取及增量数据抽取等;第6章介绍数据清洗步骤、数据检验、数据错误处理、数据质量评估及数据加载;第7章介绍网页结构,利用网络爬虫技术进行数据采集,利用JavaScript技术进行行为日志数据采集
这是一本需要“动手实践”的图书,通过带领大家从零构建一款分布式向量数据库,让大家透彻理解向量数据库的技术原理和实现细节。 本书共分为三大部分,内容由浅入深、循序渐进。“第一部分 认识向量数据库”(第1~3章)是基础篇,介绍向量数据库的基础知识,涵盖向量及数据库的基本概念、向量数据库的发展历程和核心功能。“第二部分 构建向量数据库”(第4~6章)是核心篇,详细介绍如何从零开始构建并优化向量数据库,巨细靡遗地展示数据库内核的技术实现细节并辅以代码示例、技术架构图等,旨在让大家真正实现动手写向量数据库。“第三部分 向量数据库的实践与展望”(第7~8章)是结束篇,通过实践案例展示向量数据库在AI应用中的使用方法,并尝试勾勒向量数据库的未来。 本书面向数据库开发人员、数据库管理员、数据库架构师等数