本书是国际数据管理协会(DAMA国际)组织众多国际专家对过去30多年数据管理领域知识和实践的总结,是市场上综合了数据管理方方面面的一部具有性的基础工具书。从数据治理、数据架构、数据质量、数据安全、主数据管理、参考数据管理、元数据管理、商务智能和数据参考管理、数据建模设计、数据存储和操作、数据集成和互操作、文档和内容管理、大数据、数据管理人员的道德要求等方面介绍了数据管理的知识体系。
本书讲述了数据库技术的发展史,从数据和数据库始,到区块链和大模型止,全面介绍了数据库技术的发展历程,包括数据库领域天才科学家、产品先行者的贡献,以及中国数据库的探索和发展格局,并试图对中国数据库的根社区发展、数据库架构演进方向做出推导和建议。 本书深入浅出地探讨了数据库发展过程中的关键技术、核心挑战,以及那些引人入胜的趣闻轶事。同时,书中还对数据库行业内的典型企业进行了细致的分析。通过阅读本书,读者不仅能领略到技术的魅力,还能从中汲取关于个人职业发展和企业产品研发的宝贵启示。此外,本书通过对数据库历史上成功与失败的企业案例剖析,还为读者提供了技术与商业融合的宝贵经验。 本书不仅适合对数据库技术感兴趣的读者,也非常适合作为本科生和研究生的教材,帮助他们深入了解数据库
本书以达梦数据库管理系统(DM8)为平台,全面、系统地介绍了达梦数据库常用操作和应用方法,包括达梦数据库安装与卸载、常用对象管理、数据查询、数据操作、高级对象管理、安全管理、备份还原、作业管理等。本书突出对操作实践的指导,为了使读者更容易理解书中所介绍的内容,列举了大量详细的例子,既介绍了SQL命令方式的管理方法,又介绍了可视化图形界面的管理方法,便于读者进行操作练习,使读者轻松入门、快速提高,并能在较短时间内基本掌握达梦数据库管理系统及其应用技术。 本书内容全面、举例丰富、操作性强、语言通俗、格式规范,可作为相关专业本科生的教材,也可作为如大专、高职学生,以及广大数据库应用开发人员的参考用书。
大智小技 系列图书由爱可生开源社区发起,将每年在社区发布的优质技术内容进行筛选分类整理编辑而成。 《大智小技V:数据库生产实战漫笔》为系列图书的第五期,精选近一年来社区发布的技术内容。与前几本相比,本书除继续收录MySQL新特性、故障案例等经典内容之外,还新增了OceanBase章节,该章节旨在对OceanBase官方学习资料进行实战场景补充。
本书循序渐进、深入讲解了R语言数据统计分析与应用的核心知识,并通过具体实例的实现过程演练了知识点的用法和流程。全书共16章,分别讲解了R语言基础、R语言数据统计语法基础、数据获取和处理、绘制可视化统计图、描述性统计分析、探索性数据分析、推论统计、回归分析、方差分析、非参数统计分析、主成分分析、聚类分析、生存分析、因子分析、基于机器学习的患者再入院预测分析系统和中概科技指数统计分析与投资系统。全书简洁而不失其技术深度,内容丰富全面,历史资料翔实齐全。同时,本书易于阅读,以极简的文字介绍了复杂的案例,同时涵盖了其他同类图书中很少涉及的历史参考资料,是学习R语言数据统计分析与应用的实用教程。
本书从需求规划、需求实现到可视化展示等,遵循项目开发的主要流程,全景介绍了电商行业Flink实时数据仓库的搭建过程。在整个项目的搭建过程中,介绍了主要组件的安装部署、需求实现的具体思路、问题的解决方案等,并穿插了大数据和数据仓库相关的理论知识,包括数据仓库的概念介绍、电商业务概述、数据仓库理论介绍和数据仓库建模等。最核心的内容是代码中对Flink的灵活应用,为读者展示了Flink处理数据的多种可能性。本书最后还详细讲解了项目的性能调优技巧和实战案例,帮助读者掌握更多的实战经验。 本书适合具有一定编程基础的读者学习或作为参考资料,通过本书,可以使你快速了解实时数据仓库,全面掌握实时数据仓库的相关技术。
大智小技 系列图书由爱可生开源社区发起,将每年在社区发布的优质技术内容进行筛选分类整理编辑而成。 《大智小技VI:数据库生产实战漫笔》作为系列图书的第六部,延续了MySQL故障案例以及技术分享等经典章节。国产数据库学习热情高涨,我们对OceanBase篇的内容进行了扩增。社区的经典专栏 一问一实验 全新归来,看看ChatDBA是如何解决数据库故障的。
本书基于Flink的稳定版本1.13,从Flink数据处理思想开始讲解,带领读者深入理解Flink的基本架构,进而由浅入深,结合具体案例,详细剖析了Flink中DataStream API的使用,并对Flink中的时间语义、状态、容错机制等重要概念进行了详尽的阐述。另外,本书还对实际开发中常用的Flink SQL、CEP等高层级API进行了细致的讲解,以电商网站中的实际应用为场景,提供了大量的代码实现。本书分为三大部分:第1~5章,带领读者初步认识Flink并编写基本的Flink程序;第6~10章,深入探讨了Flink内部的高级应用;第11~12章,讲解了Flink提供的扩展功能。本书广泛适用于大数据的学习者与从业人员,以及院校大数据相关专业的学生,也可作为大数据学习的参考书。
本书以DM8 为对象,系统地介绍了DM8 数据库的安装和维护,以及达梦数据库主流的两大解决方案:达梦DW数据守护和DMDSC 高可用集群方案。本书演示了基于中标麒麟Linux 平台的大量实战操作。通过本书的学习,读者可以掌握达梦数据库的安装和基础操作,如用户、表空间、普通标、分区表、索引、参数、统计信息的管理操作,也可以系统地掌握达梦数据库的备份和恢复技能,如逻辑备份与恢复、联机备份与恢复、脱机备份与恢复。另外,本书还介绍了达梦DW 数据守护和 DMDSC 高可用集群方案,完善了达梦数据库的运维体系。
nbsp nbsp《Power BI 商业数据分析完全自学教程》是一本系统地讲解利用 Power BI 软件进行商业数据智能分析的自学宝典。《Power BI商业数据分析完全自学教程》以 完全精通 Power BI 为出发点,以 用好 Power BI 为目标来安排内容,全书共 5 篇,分为 14 章,循序渐进地介绍了 Power BI 的基本操作、数据导入、数据整理、数据建模、数据可视化分析、数据发布等相关技能。 第 1 篇为基础入门篇(第 1 章 ~ 第 3 章),主要针对初学者,从零开始,系统且全面地讲解了 Power BI 的入门知识点、基本操作及数据的输入和连接操作。 第 2 篇为数据处理篇(第 4 章 ~ 第 6 章),介绍了 Power BI 数据的整理操作、表格中行 / 列数据的管理,以及 Power BI 数据的高级处理、M 函数的使用等。 第 3 篇为数据分析篇(第 7 章 ~ 第 9 章),介绍了 Power BI 数据的建模操作及 DAX 语言的入门和进阶操作等。
Access数据库是微软Office软件中的一个组件,和Word、Excel、PPT等一样,都是Office软件中的成员,Access数据库主要有三大用途:一是存储数据;二是处理数据;三是开发软件。 Access的特点:容易学会,从而开发出实用管理软件!学员一般都有Excel的应用经历,而Access数据库与Excel均为Office组件,有一定的相似性,上手很快。本书共分为7章,展示了终软件开发的效果并按功能模块由浅入深将知识点贯穿于其中,涉及的知识点有:快速开发平台、表设计、创建表操作、查询的各个类型、自动生成和手工创建窗体、VBA编程语言。本书有配套学习视频,详细讲解了具体开发过程,并提供了练习素材下载,方便读者学习。学好本教程,读者将能开发出和本案例展示效果一样的实用管理软件。
本书是一本以数据挖掘应用为主导,以SPSS Modeler为实践框架的应用指南,内容涵盖数据挖掘方法论、数据读取、数据处理、数据可视化、统计分析与检验、数据挖掘算法、自动建模、集成与扩展、模型部署以及性能优化等,力求帮助读者全面掌握数据挖掘项目的主要内容以及实践细节。 除了操作层面,本书也尽可能地把专业晦涩的数据挖掘知识及商业应用内容以通俗易懂的方式传递给读者,同时所有场景会结合IBM SPSS工具进行实现并提供样例学习,方便读者在学习的同时加深巩固和理解。 如果你是在校学生、刚刚从事数据分析的大学毕业生、数据分析爱好者、市场营销人员、产品运营人员或者数据分析师,如果你希望提升自己的数据挖掘技术,那么就适合阅读本书。
本书按照需求规划、需求实现、需求可视化的流程进行编排,遵循项目开发的实际流程,全面介绍了数据仓库的搭建过程。在整个数据仓库的搭建过程中,本书介绍了主要组件的安装部署过程、需求实现的具体思路、部分问题的解决方案等,并在其中穿插了许多与大数据和数据仓库相关的理论知识,包括大数据概论、数据仓库概论、电商业务概述、数据仓库理论准备、数据仓库建模等。 本书从逻辑上可以分为三部分:一是大数据与数据仓库概论及项目需求描述,主要介绍了数据仓库的概念、应用场景和搭建需求;二是项目部署的环境准备,介绍了如何从零开始搭建一个完整的数据仓库环境;三是需求模块实现,针对不同需求分模块进行实现,是本书的重点部分。 本书适合具有一定的编程基础并对大数据感兴趣的读者阅读。通过阅读本书,读者可以快速了解数据
《机器学习数学基础:概率论与数理统计》从基础的概率统计知识讲起,逐步深入到机器学习以及深度学习的分类算法,并在后配合深度学习的实战案例,介绍了softmax回归函数在手写体图像识别中的具体应用。通过手动编辑代码,让读者更深入地了解概率在人工智能领域的重大作用。全书分为16章,涵盖的内容主要有概率统计在人工智能发展过程中的重要影响;随机试验及概率的概念;随机变量的分布及多维随机变量的分布情况;贝叶斯算法;正态分布现象;随机变量的数字特征;机器学习中的损失函数;大数定律;样本及抽样分布的做法;参数估计的概念;马尔科夫链;过拟合与欠拟合问题及解决方法;Tensorflow概述及安装方法;卷积神经网络介绍;实验演练之手写体数字识别等。 《机器学习数学基础:概率论与数理统计》配有大量的插图,以身边的生活现象
本书是MySQL领域的经典之作,拥有广泛的影响力。第3版更新了大量的内容,不但涵盖了*MySQL 5.5版本的新特性,也讲述了关于固态盘、高可扩展性设计和云计算环境下的数据库相关的新内容,原有的基准测试和性能优化部分也做了大量的扩展和补充。全书共分为16章和6个附录,内容涵盖MySQL架构和历史,基准测试和性能剖析,数据库软硬件性能优化,复制、备份和恢复,高可用与高可扩展性,以及云端的MySQL和MySQL相关工具等方面的内容。每一章都是相对独立的主题,读者可以有选择性地单独阅读。 本书不但适合数据库管理员(DBA)阅读,也适合开发人员参考学习。不管是数据库新手还是专家,相信都能从本书有所收获。
达梦实时同步工具是数据库行业内数据实时同步的一个标杆。本书以达梦实时同步工具4.0为蓝本,介绍达梦数据库本地和异地容灾的解决方案,主要包括达梦实时同步工具的技术原理、特点、系统架构、配置和使用方法,以及日常运维和典型案例分析等。本书语言流畅、通俗易懂,并介绍了具体应用案例,是深入了解达梦数据中心解决方案的基础指南,具有较高的参考价值。本书可以作为计算机、数据库等专业的教材,也可以作为工程技术人员的参考用书。
本书旨在为包括研究生和工业从业者在内的研究人员提供有关为数据驱动的进化优化而开发的近期新方法的全面描述。本书共分12章。为了本书的自足性,第1~4章简要介绍了优化、进化计算和机器学习中精心挑选的重要主题和方法。第5章提供了数据驱动优化的基础知识,包括启发式算法和基于获取函数的代理模型管理。第6~8章介绍使用多个代理模型进行单目标优化的方法,其中第7章和第8章描述用于求解多目标和高维多目标优化算法的代表性进化算法以及代理模型辅助数据驱动的进化多目标和高维多目标优化。第9章详细阐述了高维数据驱动优化的方法,介绍了在半监督学习的帮助下,将知识从未标记数据转移到标记数据,从廉价目标迁移到昂贵目标、从廉价问题迁移到昂贵问题的大量技术,迁移学习和迁移优化在第10章中进行了描述。由于数据驱动优化是一个强
《Python数据分析与大数据处理从入门到精通》主要讲解数据分析与大数据处理所需的技术、基础设施、核心概念、实施流程。从编程语言准备、数据采集与清洗、数据分析与可视化,到大型数据的分布式存储与分布式计算,贯穿了整个大数据项目开发流程。本书轻理论、重实践,目的是让读者快速上手。1篇首先介绍了Python的基本语法、面向对象开发、模块化设计等,掌握Python的编程方式。然后介绍了多线程、多进程及其相互间的通信,让读者对分布式程序有个基本的认识。第2篇介绍了网络数据采集、数据清洗、数据存储等技术。第3篇介绍了Python常用的数据分析工具,扩展了更多的数据清洗、插值方法,为*终的数据可视化奠定基础。第4篇是大数据分析的重点。首先介绍了Hadoop的框架原理、调度原理,MapReduce原理与编程模型、环境搭建,接着介绍了Spark框架原
本书以达梦数据库DM8为蓝本,介绍达梦数据库的存储过程、存储函数、触发器等服务器端程序,以及Java、C、Python、PHP等高级语言基于达梦数据库的应用程序设计方法。本书主要包括:DM SQL程序结构、基本语法;存储过程、存储函数、触发器、包等高级对象的基本语法及应用方法;嵌入式SQL程序Pro *c组成、基本语法及应用方法;基于ODBC、JDBC、.NET Data Provider数据库访问接口标准的应用程序设计方法;PHP、Python、Go等高级语言访问达梦数据库的程序设计方法;达梦数据库数据装载及日志分析接口的程序设计方法。本书内容实用、示例丰富、语言通俗、格式规范,可作为相关专业的教材,也可作为工程技术人员的参考书。
本书致力于深入探讨和系统构建元宇宙这一新兴概念及其背后的理论与技术框架。全书内容详尽且前沿,不仅涵盖了元宇宙的基本定义、起源与发展脉络,更深度剖析了其关键技术支柱,包括但不限于扩展现实(XR)、人工智能、物联网、区块链、5G 通信、大数据和云计算等。本书针对元宇宙的生态系统建设进行了全方位解读,探讨了元宇宙如何打破现实与虚拟之间的界限,创建一个高度沉浸、实时互动并具有完整经济系统的新型网络空间。同时,前瞻性地描绘了元宇宙对未来生活方式、商业模式、社会治理乃至全球科技格局的影响与变革。本书适合的读者群体广泛,特别针对以下几类人群:对科技趋势保持敏感的行业决策者、科技从业者、教育工作者、科研工作者、对未来生活充满好奇的普通读者。整体而言,本书旨在用通俗易懂的语言,结合实例和专业见解,
《PHP MySQL开发实战》从初学者的角度讲述使用PHP语言结合MySQL数据库进行程序开发应该掌握的各项技术,内容突出 基础 、 全面 、 深入 的特点,同时强调 实战 效果。书中在介绍技术的同时提供实例,同时在各章的结尾安排有实战,通过实战来综合应用本章所讲解的知识,做到理论联系实际;每篇的*后一章有一个综合实例,通过一个模块综合讲解本篇所讲解的知识内容;在本书的*后两章中提供了两个完整的项目实例,讲述从前期规划、设计流程到项目*终实施的整个实现过程。 全书共分28章,主要内容包括初识PHP环境搭建、PHP语言基础、PHP流程控制语句、字符串操作与正则表达式、初探数组、日期和时间的管理、程序调试与异常处理、综合实例(一) 在线论坛、MySQL数据库、MySQL存储引擎与运算符、MySQL函数之选、MySQL基本操作、MySQL数据查询、综合实例
为什么花更少的钱买更偏远的房子不一定划算? 为什么得分最多的运动员不一定是好运动员? 为什么癌症发病率上升竟可能是一件好事? 泰勒主义、绩效管理、科学管理、关键绩效指标等理论都建立在同一个假设之上:如果你考核员工并提供激励,你就会得到理想的结果。但事实真的是这样吗? 我们使用衡量指标来了解世界上许多重要的事:教育和医疗系统是否高效,一个国家是否比另一个国家更富裕,哪个城市的生活质量更高……在这本书中,作者分享了许多选用错误的衡量指标,进而带来糟糕结果的案例,展示了衡量指标如何影响教育、医疗、商业,甚至城市发展。 为什么人们总是测量错误的数据,而忽视重要的指标设定?这本启发性的书提醒我们,并非所有重要的东西都计算得清楚,也并非所有计算得清楚的东西都重要。被各种量化指标裹挟的我们,要
本书以达梦数据库DM8 为蓝本,围绕DM8 性能为什么优化、谁来优化、优化什么、何时优化、优化到什么程度等问题进行详细介绍,从DM8 体系架构入手,分析了DM8 的运行机制,从DM8 的实例优化、I/O 优化、SQL 语句优化3 个方面详细地介绍了影响DM8 性能的核心问题。全书共6 章,内容包括DM8 性能优化概述、DM8体系架构、DM8 调优诊断工具、DM8 实例优化、DM8 I/O 优化和DM8 SQL 语句优化等。同时,本书还将DM8 参数配置文件相关参数、DM8 系统数据字典和DM8 常用动态性能视图作为附录,便于广大读者查阅。本书内容实用、示例丰富、语言通俗、格式规范,可以作为计算机、数据库等专业的教材,也可以作为工程技术人员的参考用书。
本书系统地介绍边缘计算及其资源管理技术,首先讲解边缘计算的基本知识,分别阐述边缘计算的网络架构、基础技术与服务模式,以及资源管理的各类使能技术与平台。随后,深入分析边缘计算资源管理的基本问题和优化方法,分别讨论边缘智能、多无线接入网中的边缘计算、车辆边缘计算、工业物联网中的边缘计算、卫星边缘计算共5个典型应用场景下的边缘计算资源管理技术。 本书内容对边缘计算及其资源管理领域的知识获取、科学研究、技术研发等工作具有重要的参考价值,适合高校和科研院所的科研人员和学生、企业研发人员,以及其他需要了解和掌握边缘计算的技术人员和管理人员阅读参考。