这是一本需要 动手实践 的图书,通过带领大家从零构建一款分布式向量数据库,让大家透彻理解向量数据库的技术原理和实现细节。 本书共分为三大部分,内容由浅入深、循序渐进。 第一部分 认识向量数据库 (第1~3章)是基础篇,介绍向量数据库的基础知识,涵盖向量及数据库的基本概念、向量数据库的发展历程和核心功能。 第二部分 构建向量数据库 (第4~6章)是核心篇,详细介绍如何从零开始构建并优化向量数据库,巨细靡遗地展示数据库内核的技术实现细节并辅以代码示例、技术架构图等,旨在让大家真正实现动手写向量数据库。 第三部分 向量数据库的实践与展望 (第7~8章)是结束篇,通过实践案例展示向量数据库在AI应用中的使用方法,并尝试勾勒向量数据库的未来。 本书面向数据库开发人员、数据库管理员、数据库架构师等数据库从业人
《中文版 SPSS 28 统计分析从入门到精通(实战案例版)》详细介绍了 SPSS 28 在数据统计分析方面的使用方法 和应用技巧,它是一本 SPSS 基础教程,同时包含了大量的 SPSS 视频教程。 《中文版 SPSS 28 统计分析从入门到精通(实战案例版)》全书共 20 章,内容包括 SPSS 28 概述、初识 SPSS 28、SPSS 数据结构、数据管理、数据分类、数据清洗和数据加工、数据计算、数据分析图表、数据分布的特征分析、参数检验、非参数检验、均值分析、单因素方差分析、多因素方差分析、相关性分析、列联表相关性分析、回归分析、聚类分析、判别分析和电力中断数据分析实例等知识。通过丰富的实例,详细介绍了 SPSS 数据统计分析的全方位知识。本书在讲解过程中理论联系实际,并配有详细的操作步骤,图文对应,可以提高读者的动手能力,并加深对知识点的理解。 《中文版 SPSS 28
本书以案例的形式,介绍从思维模型分析到场景实践的数据分析方法。全书围绕 数据分析 与 运营增长 两大关键要素,在系统介绍数据分析思维、数据分析方法、数据采集技能、数据清洗技能等基础知识的同时,以问题为导向,解读运营与增长的关键性业务内容,在获客、激活、留存、变现、自传播循环等各个核心运营环节展开数据分析实战。 本书提供案例相关数据集与源码包,适合数据分析、产品运营、市场营销等行业有数据分析具体业务需求的人士阅读,也适合相关专业的师生阅读。
伴随人类社会数字化进程的深入,数据正不断渗透于日常的生活、生产、分配、流通、消费等各个环节,对人类社会的影响日益凸显。数据已成为继土地、劳动力、资本、技术之后的第五大生产要素,对其他生产要素的整合能力也使其成为既有要素中比较重要的和难以替代的关键要素,并成为值得重点讨论的时代性议题与理解数字时代的基本入手点。 对数据要素的理解涉及多学科、多视野,本书从与数据要素关系较为密切的信息、权属、价值、安全、交易等五个维度出发,汇聚不同学科背景的既有文献,整合现有观点,对数据要素的多维特性进行探讨,以丰富人们对数据要素的认知,凝聚共识,澄清数字时代的发展与治理迷思,为未来的相关创新提供起点。
本书以 实战、实用、实效 为原则,充分考虑智慧公安、智慧交通、智慧金融、智慧城市等用户的大数据应用痛点,紧贴大数据实践的业务场景,汇集数据分析模型全生命 周期的关键应用技术,包括数据准备、工作表管理、可视化图表创建、数据大屏制作、数据模型创建和自定义算子设计等内容。 本书内容通俗易懂,案例丰富,图文并茂,同时配有教学视频和建模平台,适合初级、中级数据分析师和广大数据分析爱好者参考学习。通过本书,读者无须具备计算机、 软件开发等专业知识背景,即可熟练掌握大数据分析建模的基本方法和技巧。
当应用于大型分布式数据集时,标准算法和数据结构可能会变慢或完全失效。选择专为大数据设计的算法可以节省时间、提高准确性并降低处理成本。《漫画算法与数据结构(大规模数据集)》将最前沿的研究论文提炼为实用的技术,用于绘制、流式传输并组织磁盘和云中的大规模数据集,十分独特。 大规模数据集的算法与数据结构为大型分布式数据引入了处理和分析技术。《漫画算法与数据结构(大规模数据集)》作为指南,包含了行业故事和有趣的插图,使复杂的概念也易于理解。在学习如何将强大的算法(如Bloom 过滤器、计数最小草图、HyperLogLog和LSM树)映射到你自己的用例时,将对真实世界的示例进行探索。 主要内容: ● 概率草图数据结构 ● 选择正确的数据库引擎 ● 设计高效的磁盘数据结构和算法 ● 大规模系统中的算法权衡 ● 有限空间资源下的百分
本书是热销书《SQL基础教程》的作者MICK为志在向中级进阶的数据库工程师编写的一本SQL技能提升指南。全书可分为两大部分。部分介绍了SQL语言不同寻常的使用技巧,带领读者重新认识CASE表达式、窗口函数、自连接、EXISTS谓词、HAVING子句、外连接、行间比较、集合运算、数列处理等SQL常用技术,发掘它们的新用法。这部分不仅穿插讲解了这些技巧背后的逻辑和相关知识,而且辅以丰富的示例程序,旨在帮助读者从面向过程的思维方式转换为面向集合的思维方式。第二部分介绍了关系数据库的发展史,并从集合论和逻辑学的角度讲述了SQL和关系模型的理论基础,旨在帮助读者加深对SQL语言和关系数据库的理解。此外,本书很多节的末尾设置有练习题,并在书末提供了解答,方便读者检验自己对书中知识点的掌握程度。
《轻松学 MySQL数据库从入门到实战(案例 视频 彩色版)》是基于编著者三十余年 数据库应用技 术 教学实践和教材编写经验编写的,结合数据库技术和MySQL数据库的发展趋势,从初学者容易上 手、快速学会的角度,采用Python MySQL开发环境,用通俗易懂的语言,深入浅出、循序渐进地讲解 MySQL数据库系统的特点及应用开发技术,实现手把手教你从零基础入门到快速学会开发MySQL数据 库系统应用项目。 《轻松学MySQL数据库从入门到实战(案例 视频 彩色版)》由 数据库基础知识 数据库操作技 术 数据库应用技能 基于Python的数据库应用系统开发 四篇组成,以一个分布式数据库的应用实例 为主线,讲述了数据库应用系统开发的知识。全书共18章,内容包括: MySQL数据库基础知识,数 据库设计和建模,数据库操作,以及索引、表、视图的创建及应用,SQL数据定义及操纵
本书系统讲述数据仓库的基本概念、基本原理以及建立数据仓库的方法和过程。主要内容包括:决策支持系统的发展、数据仓库环境结构、数据仓库设计、数据仓库粒度划分、数据仓库技术、分布式数据仓库、ElS系统和数据仓库的关系,外部和非结构化数据与数据仓库的关系、数据装载问题、数据仓库与Web、ERP与数据仓库以及数据仓库设计的复查要目。 本书是数据仓库之父撰写的关于数据仓库的 权威著作,既可作为相关专业的研究生教材,也是数据仓库的研究、开发和管理人员的指南。
Apache Flink项目的资深贡献者Fabian Hueske和Vasiliki Kalavri展示了如何使用Flink DataStream API实现可伸缩的流式应用,以及怎样在业务环境中持续运行和维护这些应用。流处理的理想应用场景有很多,包括低延迟ETL、流式分析、实时仪表盘以及欺诈检测、异常检测和报警。你可以在任意类型的持续数据(包括用户交互、金融交易和物联网等数据)生成后,立即对它们进行处理。本书主要内容包括: 了解有关分布式状态化流处理的概念和挑战。 探索Flink的系统架构,包括事件时间处理模式和容错模型。 理解DataStream API的基础知识和构成要素,包括基于时间和有状态的算子。 以精确一次的一致性读写外部系统。 部署和配置Flink集群。 对持续运行的流式应用进行运维。
互联网公司里面几乎很少有公司不用MySQL,国内互联网巨头都在大规模使用MySQL。如果把MySQL比喻成数据库界的一条巨龙,则性能优化和高可用架构设计实践就是点睛之笔。本书将详细讲解 MySQL 5.7高可用和性能优化技术,细致梳理思路,并与真实生产案例相结合,通过原理阐述到实战部署,帮助读者将所学知识点运用到实际工作中。 本书分为13章,详解MySQL 5.7数据库体系结构,InnoDB存储引擎,MySQL事务和锁,性能优化,服务器全面优化、性能监控,以及MySQL主从复制、PXC、MHA、MGR、Keepalived 双主复制等高可用集群架构的设计与实践过程,并介绍海量数据分库分表和Mycat中间件的实战操作。 本书既适合有一定基础的 MySQL数据库学习者、MySQL数据库开发人员和 MySQL数据库管理人员阅读,同时也能作为高等院校和培训学校相关专业师生的参考用书。
本书是一本系统介绍Clickhouse的指导型工具书,全书总共分为11章: 第1章 介绍ClickHouse的由来、发展历程、核心特点与核心特点。第2~6章 介绍了ClickHouse基础使用部分,包括整体架构、如何安装、数据定义、数据引擎、数据查询和函数的特性和使用方法。第7~9章介绍了ClickHouse高级特性部分,包括数据库管理操作,数据分片、数据副本和高可用的特性和使用方法。第10~11章介绍了如果自己手动实现ClickHouse中间件的思路和示例,同时也介绍了几款可视化工具与ClickHouse集成的方法。
本书将现代统计学的重要思想引入数理统计课程中,强调了数据分析、图形工具和计算机技术,并注重统计的实务和应用.本书内容丰富,几乎涵盖了所有经典和前沿的概率论与数理统计理论和方法,主要包括概率、*变量、联合分布、期望、极限定理、抽样调查、参数估计、假设检验、数据汇总、两样本比较、方差分析、分类数据分析和线性小二乘等. 本书用真实数据分析了实际问题,以此增强读者对理论的理解;作者将自助方法与传统的推论性过程结合起来,增加了蒙特卡罗方法.此外,为了使概念更清晰,书中提供了大量的示例,而且还有丰富的习题,以增强读者的计算能力. 本书适合作为统计学、数学、其他理工科专业以及社会科学和经济学专业高年级本科生和低年级研究生的教材,同时也可供相关领域技术人员参考.
数据建模指的是对现实世界各类数据的抽象组织,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库。而数据模型是构建应用系统的核心,是尽可能精准地表示业务运转的概念性框架。本书通过平实的语言,对数据模型及建模过程进行了深入浅出的介绍。全书内容分为5个部分,对数据建模简介、数据模型要素,概念、逻辑和物理数据模型、数据模型质量以及数据建模的进阶内容等方面进行讲解,全面细致地为读者解答与数据建模相关的知识点和疑问。除此之外,本书的zui后还对各类专业术语进行了细致的解释,方便读者参考。本书是一本经典的数据建模指南,非常适合对数据建模感兴趣的读者以及从事数据科学等相关工作的专业人士参考阅读。
《Oracle PL/SQL从入门到精通》是一本 覆盖 OCP 认证内容、带有视频讲解、浅显易懂、幽默风趣、实例丰富、 可操作性很强 的Oracle PL/SQL程序设计入门用书,适用于Oracle 12c、Oracle 11g、Oracle 10g、Oracle 9i等多个版本。 《Oracle PL/SQL从入门到精通》主要内容有:Oracle的安装及相关配置,PL/SQL程序设计语言概述,Oracle SQL Developer简介,常用的SQL*Plus命令,PL/SQL变量的声明与使用,编写PL/SQL语言的可执行语句,PL/SQL与Oracle服务器之间的交互,分支(条件)语句,PL/SQL语言的循环语句,PL/SQL中常用的组合数据类型,SQL游标(cursor),显式cursor的高级功能,PL/SQL程序中的异常处理,过程的创建、维护和删除,函数的创建、维护和删除,PL/SQL软件包,PL/SQL软件包的高级特性和功能,数据库触发器,批量绑定及高级触发器特性, PL/SQL程序代码设计上的考虑、Oracle自带软件包及数据库
本书共分9章:第1章为创建压力容器受压元件的几何模型;第2章为划分网格;第3章为炼油厂制氢装置PSA吸附器的低周疲劳分析;第4章为压力容器3D模型的应力分析;第5章为ANSYS Workbench软件的缺点;第6章为EN 13445-3:18疲劳寿命的详细评定;第7章为公式法计算许用循环次数;第8章为技术评论;第9章为ASMEⅧ-2-2015附录3-F设计疲劳曲线。 第8章仅对三本专书[5]、[14]、[20],一本译著即文献[6]和两篇论文即文献[8]、[16]进行了技术评轮,它们只占压力容器用书和用文的极少的一部分,但通过本书分析可知,这些书中或文中的错误却是不容忽视的。 第9章对于JB4732移植ASMEⅧ-2:5-1995的图5-110.1的C-1,原用到1E6,而现在用到1E11,规范对双对数插值公式也不再使用。 本书适合压力容器工程技术人员使用,也可供大专院校 过程装备与控制工程 专业及相近专业的师生
Oracle数据库管理从入门到精通》是一本 覆盖 OCP 认证内容、带有视频讲解、浅显易懂、幽默风趣、实例丰富、可操作性 很强的Oracle DBA(Oracle数据管理员)入门用书,适用于 Oracle 12c 、 Oracle 11g、 Oracle 10g、 Oracle 9i等多个版本。 《Oracle数据库管理从入门到精通》全书分为25章,内容有:Oracle的安装及相关配置,Oracle的体系结构,数据库管理工具,Oracle实例的管理,数据字典和控制文件,重做日志文件,表空间和数据文件的管理,存储结构和它们之间的关系,管理还原数据,创建数据库,表管理与维护,索引的管理与维护,管理和维护数据完整性,用户及系统资源和安全的管理,管理权限,管理角色,非归档模式下的冷备份和恢复,数据库的归档模式,数据库的联机备份及备份的自动化,归档模式下的数据库恢复,数据的移动,闪回技术、备份恢复与优化,设计
本书不是一本关于数据管理的 如何做 的书(如规范数据属性或是创建数据库),而是一本关于数据管理 如何思考 的书。本书将心理学和哲学与数据管理巧妙的融合在一起。将心理学和哲学学科与数据管理结合在一起,以创造有关我们如何感知和管理信息的知识。书中阐述了当今数据库系统通过数据来捕获现实世界的方式及缺陷,作者运用非常清晰的逻辑、仔细地描述了信息系统中所表示的现实世界的各个方面。对系统中所使用的数据模型、语言、语义和现实世界描述下的哲学问题进行了深刻的检视,对这些核心概念、其对信息系统的影响,是坊间遍寻不到的。这本书的价值在于批判性地探索解决现实世界的信息系统建模方法,这是一本令读者愉悦并具有启发性的佳作。适合从事数据建模、大数据、数据管理的人士阅读。