本书从大数据和人工智能的角度,系统、全面介绍海洋预测预报与挖掘分析技术。全书分为三个部分:第一部分(第1~3章)是数据部分,对海洋大数据的特征、资源分析、处理评估、平台架构、存储管理、分析处理等进行阐述;第二部分(第4~5章)是方法部分,介绍基于机器学习的海洋大数据典型挖掘分析方法,包括回归方法、聚类方法、关联方法、分类方法及可视分析方法,并给出典型的深度学习预测方法;第三部分(第6~10章)是应用部分,展示利用海洋大数据处理方法对各类海洋数据进行分析预报的成果,包括对海表温度、海面高度、海洋三维温盐、台风路径和赤潮发生概率的分析预报。
《Origin科技绘图与数据分析》内容简介 《Origin科技绘图与数据分析》以Origin 2023中文版为软件平台,结合编者多年的数据分析经验,通过大量应用实例详细介绍Origin在科研数据处理与数据作图中的使用方法与技巧。全书共13章:第1~6章主要讲解Origin的基础知识与科技绘图,包括Origin的操作界面、窗口类型、绘图基本设置、数据操作管理、二维及三维图的绘制、统计图形绘制等;第7~13章结合Origin数据处理与统计分析功能,分别讲解线性拟合、非线性拟合、数据操作与分析、基础统计分析、参数与非参数检验、数字信号处理等知识,最后介绍如何在Origin中进行版面设计与输出操作。通过阅读本书,可以帮助读者快速掌握Origin的应用,从而更好地处理和分析科研数据。 本书注重基础,内容翔实,突出示例讲解,既可以作为从事数据分析处理的科研工程技术人员的自学
Spark SQL 是 Spark 技术体系中较有影响力的应用(Killer application),也是 SQL-on-Hadoop 解决方案 中举足轻重的产品。《Spark SQL内核剖析》由 11 章构成,从源码层面深入介绍 Spark SQL 内部实现机制,以及在实际业务场 景中的开发实践,其中包括 SQL 编译实现、逻辑计划的生成与优化、物理计划的生成与优化、Aggregatio算子和 Joi算子的实现与执行、Tungste优化技术、生产环境中的一些改造优化经验等。
本书是首本专注于利用R语言进行科研数据清洗的书籍,全书主要分为两大块,首块以简洁的内容向读者介绍R语言的入门知识,让读者了解并认识R语言,为后面的内容打下基础。全书大部分篇幅主要集中在第二块内容,即数据清洗的知识。作者从实际问题出发,详细的介绍了如何利用R语言处理科研中的数据,比如缺失值的插补,异常值的查找,长宽型数据结构的转换,时间日期数据的处理,文本数据的处理等,此外,作者也将数据清洗的内容进行了适当扩展,比如书中加入了R语言与数据库的连接方法,让大数据的处理更加得心应手。
本书重点介绍数据质量管理与安全管理的理论及应用。首先通过数据管理现况和问题的分析,提出数据质量管理的步必须是将各种来源的数据标准化,具有统一的数据格式和规则。书稿中强调了提高数据质量不仅可提高信息系统的质量,还可提高经营活动的质量。需要制定质量管理计划或执行具体的质量管理活动。定义了数据质量的准确性、一致性、可用性、可达性、及时性、安全性这6个标准以及对应的管理流程,划分了5个能力成熟度的等级,界定了从管理者到执行者等各个质量管理活动和责任。提出多项数据质量管理主要技术和各国实用案例,还进一步在Orange数据库中实践了数据质量诊断流程。书稿后半部针对日益增长的数据库安全性的需求,提出了安全管理系统构建、访问控制,数据伪装等具体可行的技术手段,最后还将数据安全技术推广到大数据的应用场景
本书介绍了 PostgreSQL 内部的工作原理,包括数据库对象的逻辑组织与物理实现,进程与内存的架构。并依次剖析了几个重要的子系统:查询处理、外部数据包装器、并发控制、清理过程、缓冲 区管理、WAL、备份及流复制。本书为 DBA 与系统开发者提供了一幅全景概念地图,有助于读者形 成对数据库实现的整体认识,亦可作为深入学习 PostgreSQL 源代码的导读手册,对于理解数据库原 理与 PostgreSQL 内部实现大有裨益。 本书适合数据库开发人员及相关领域的研究人员、数据库 DBA 及高等院校相关专业的学生阅读。