本书从大数据和人工智能的角度,系统、全面介绍海洋预测预报与挖掘分析技术。全书分为三个部分:第一部分(第1~3章)是数据部分,对海洋大数据的特征、资源分析、处理评估、平台架构、存储管理、分析处理等进行阐述;第二部分(第4~5章)是方法部分,介绍基于机器学习的海洋大数据典型挖掘分析方法,包括回归方法、聚类方法、关联方法、分类方法及可视分析方法,并给出典型的深度学习预测方法;第三部分(第6~10章)是应用部分,展示利用海洋大数据处理方法对各类海洋数据进行分析预报的成果,包括对海表温度、海面高度、海洋三维温盐、台风路径和赤潮发生概率的分析预报。
《Origin科技绘图与数据分析》内容简介 《Origin科技绘图与数据分析》以Origin 2023中文版为软件平台,结合编者多年的数据分析经验,通过大量应用实例详细介绍Origin在科研数据处理与数据作图中的使用方法与技巧。全书共13章:第1~6章主要讲解Origin的基础知识与科技绘图,包括Origin的操作界面、窗口类型、绘图基本设置、数据操作管理、二维及三维图的绘制、统计图形绘制等;第7~13章结合Origin数据处理与统计分析功能,分别讲解线性拟合、非线性拟合、数据操作与分析、基础统计分析、参数与非参数检验、数字信号处理等知识,最后介绍如何在Origin中进行版面设计与输出操作。通过阅读本书,可以帮助读者快速掌握Origin的应用,从而更好地处理和分析科研数据。 本书注重基础,内容翔实,突出示例讲解,既可以作为从事数据分析处理的科研工程技术人员的自学
Spark SQL 是 Spark 技术体系中较有影响力的应用(Killer application),也是 SQL-on-Hadoop 解决方案 中举足轻重的产品。《Spark SQL内核剖析》由 11 章构成,从源码层面深入介绍 Spark SQL 内部实现机制,以及在实际业务场 景中的开发实践,其中包括 SQL 编译实现、逻辑计划的生成与优化、物理计划的生成与优化、Aggregatio算子和 Joi算子的实现与执行、Tungste优化技术、生产环境中的一些改造优化经验等。
本书是首本专注于利用R语言进行科研数据清洗的书籍,全书主要分为两大块,首块以简洁的内容向读者介绍R语言的入门知识,让读者了解并认识R语言,为后面的内容打下基础。全书大部分篇幅主要集中在第二块内容,即数据清洗的知识。作者从实际问题出发,详细的介绍了如何利用R语言处理科研中的数据,比如缺失值的插补,异常值的查找,长宽型数据结构的转换,时间日期数据的处理,文本数据的处理等,此外,作者也将数据清洗的内容进行了适当扩展,比如书中加入了R语言与数据库的连接方法,让大数据的处理更加得心应手。
本书重点介绍数据质量管理与安全管理的理论及应用。首先通过数据管理现况和问题的分析,提出数据质量管理的步必须是将各种来源的数据标准化,具有统一的数据格式和规则。书稿中强调了提高数据质量不仅可提高信息系统的质量,还可提高经营活动的质量。需要制定质量管理计划或执行具体的质量管理活动。定义了数据质量的准确性、一致性、可用性、可达性、及时性、安全性这6个标准以及对应的管理流程,划分了5个能力成熟度的等级,界定了从管理者到执行者等各个质量管理活动和责任。提出多项数据质量管理主要技术和各国实用案例,还进一步在Orange数据库中实践了数据质量诊断流程。书稿后半部针对日益增长的数据库安全性的需求,提出了安全管理系统构建、访问控制,数据伪装等具体可行的技术手段,最后还将数据安全技术推广到大数据的应用场景
《高校数据仓库系统建设与应用》共分6章。章主要介绍数据仓库的概念、背景及大数据研究展望。第2章介绍数据仓库相关的技术原理。第3章介绍数据仓库项目需求分析的流程、方法、原则,以及数据仓库需求分析应包含的内容。第4章结合高校业务特点,根据数据仓库系统建设过程介绍各环节,主要有建设流程、系统架构、主题规划、源数据分析、数据模型设计、ETL设计、ETL开发、ETL测试、系统运行监控和报表设计开发,重点阐述每个环节采用的技术方法、实现过程及注意事项。第5章介绍数据仓库元数据管理、数据质量管理和系统运维管理,其中重点介绍数据质量监控系统的设计及实现。第6章通过剖析高校的核心管理业务、数据分析指标和分析案例,来详细说明数据仓库在高校各业务管理中的应用。
R语言作为如今热门的编程语言之一,它由统计学家开发,在解决数据分析问题时具有先天优势。它是一门新兴的语言,掌握它,就是掌握了一门高校的数据分析软件。随着大数据的轰炸,R语言的功能越来越丰富,越来越多的人对R语言产生了兴趣。R语言的特点主要是开源性、全面性、操作简便性、可扩展性等。《基于R语言数据挖掘的统计与分析》的编写是为了让对R语言有兴趣的读者能更加了解R语言,了解大数据时代的数据挖掘等。
本书提供了全面、实用的建议,以保证在复杂的生产环境中,能可靠且高效地运行Oracle 数据库。七位主要的Oracle 专家对Oracle 12c、11g 和其他很近版本的Oracle 数据库汇集了一系列经过验证的解决方案、实践的例子以及循序渐进的技巧。每一个解决方案都是精心设计的,以帮助有经验的Oracle DBA和DMA 尽可能快地理解和修复严重的问题。本书不仅涵盖了LOB 段、undo 表空间、高GC 缓冲区等待事件、糟糕的查询响应时间、闩锁争用、索引、XA 分布式事务、RMAN 备份/ 恢复等内容,还深入地讲解了DDL 优化、VLDB 调优、数据库取证、自适应游标共享、数据泵、数据迁移、SSD、索引等内容,并介绍了如何解决Oracle RAC 问题。