本书详细介绍面向静态数据集、增量数据集和数据流的高效用模式挖掘的理论和方法。本书内容共6章,第1章和第2章介绍高效用模式挖掘的相关知识。第3章介绍面向静态数据集的包含正、负效用的两类精简高效用模式挖掘方法的研究与实现过程。第4章介绍针对增量数据集的挖掘高效用模式全集和精简集合的研究。第5章介绍面向数据流的精简高效用模式挖掘方法的研究与实现过程。第6章给出三个高效用模式挖掘的应用案例。第3~5章有方法的实验证明,供读者更好地了解本书内容。 本书可供大数据挖掘相关专业研究生参阅,也可以作为大数据挖掘研究和应用开发人员的参考书。
当前,数据驱动的理念已渗透到各个领域,数据科学和人工智能技术在制造业、金融、教育等多个行业中得到了广泛应用。Python作为一种编程语言,已成为数据科学和人工智能领域的事实标准,它丰富的生态系统进一步增强了它在这些领域中的重要性。然而,随着数据量的不断增长,如何利用Python加速数据科学处理,并将它扩展到集群上的并行计算,已成为数据科学家面临的重要挑战。本书详细介绍了4种数据科学工具:Dask、Ray、Xorbits和mpi4py,这些工具可以帮助数据工程师和科学家处理更大规模的数据集、训练更复杂的模型,并更高效地进行机器学习模型的迭代和部署。本书面向具备一定数据科学基础的数据工程师、数据科学家或领域专家,同时也适合大学生和研究生作为进入高性能数据科学领域的入门读物。
本书系统地介绍向量数据库的原理、技术实现及其应用,重点分析传统数据库在处理高维向量数据时的局限性,并提供相应的解决方案。本书分为4个部分,共13章,内容涵盖从理论基础到技术实践的多个方面,详细讨论高维向量表示中的信息丢失、嵌入空间误差和维度诅咒等问题,结合FAISS和Milvus等主流开源工具,深入剖析向量数据库的索引机制、搜索算法和优化策略。通过实际案例,展示向量数据库在推荐系统、行为分析、智能诊断、语义搜索等领域的应用,并特别强调企业级语义搜索系统的开发与部署经验。 本书不仅提供深度的理论指导,还通过丰富的案例帮助读者掌握如何构建高效的向量搜索引擎,适合从事搜索引擎与推荐系统开发的工程师,数据科学、人工智能及相关领域的从业者、研究人员,以及对向量数据库与相似性搜索感兴趣的读者,也可作为培训
ChatGPT能够辅助用户完成从数据收集、预处理、分析到报告撰写的全过程,大大降低了数据分析的门槛。本书共分为 12 章,内容包括ChatGPT 的注册与登录、提示词的设计、GPTs、数据的收集与预处理、特征工程、各类数据分析方法(包括对比分析、分组分析、回归分析、分类分析和聚类分析等)、数据可视化,以及如何利用 ChatGPT 撰写数据分析报告等。每章都提供了丰富的示例和实用技巧,旨在帮助读者掌握利用ChatGPT 进行数据分析的方法,提高数据处理和分析的效率。本书适合数据分析师、市场研究人员、高校师生、科研人员以及任何对数据分析感兴趣的读者。通过阅读本书,读者不仅能学习到如何使用 ChatGPT 进行数据分析,还能深刻理解数据分析的核心概念和应用场景,从而在实践中更加游刃有余。
《MySQL是怎样运行的:从根儿上理解MySQL》采用诙谐幽默的表达方式,对MySQL的底层运行原理进行了介绍,内容涵盖了使用MySQL的同学在求职面试和工作中常见的一些核心概念。 《MySQL是怎样运行的:从根儿上理解MySQL》总计22章,划分为4个部分。第1部分介绍了MySQL入门的一些知识,比如MySQL的服务器程序和客户端程序有哪些、MySQL的启动选项和系统变量,以及使用的字符集等。第2部分是本书后续章节的基础,介绍了MySQL的一些基础知识,比如记录、页面、索引、表空间的结构和用法等。第3部分则与大家在工作中经常遇到的查询优化问题紧密相关,介绍了单表查询、连接查询的执行原理,MySQL基于成本和规则的优化具体指什么,并详细分析了Explain语句的执行结果。第4部分则是与MySQL中的事务和锁相关,介绍了事务概念的来源,MySQL是如何实现事务的,包括redo日志、undo日
本书在前四版畅销书的基础上,根据SPSS 26.0软件升级的市场应用需求进行第5次升级修订。 本书结合具体的SPSS统计分析实例,图文并茂地介绍了近期新版本SPSS 26.0的各种统计分析方法,包括基本统计分析、参数与非参数检验、方美分析、相关分析、同归分析、名重响应分析、聚类分析、判别分析、因子分析、主成分分析、对应分析、时间序列模型、信度分析、生存分析和缺失值分析的原理和使用方法。全书注重内容的实用性,在译细介绍SPSS常用的提作功能基础上,通过一些综合应用案例(在医学、经济管理、自然科学和社会科学中的应用)来演示实际统计分析中SPSS的使用。 本书适用于SPSS软件17.0~26.0版本,作者录制了96个视频教学文件,读者可通过扫描各章节二维码阅读学习。本书可作为高校经济学、管理学、统计学、公共管理、社会学和卫生统计等专业学生学
近年来,Python语言凭借其在数据分析领域的优势得以快速发展,众多软件厂商也相继推出了支持Python的量化交易平台。本书是介绍Python编程及其在量化交易领域的实践技巧的图书,旨在帮助读者掌握基本的Python编程技能,并顺利应用于期货量化交易实践。 本书内容分为两篇。第一篇是Python基础,通过13章内容介绍了Python编程的基础知识,如语法规则、数据类型、函数、类、装饰器、异常处理、进程和线程等;第二篇是期货量化交易,通过8章内容介绍了Python在期货量化交易中的应用,并基于天勤量化交易平台讲解开发实践,涉及pandas模块、TqSdk的接口、函数、量化策略的框架、图形化编程及时间序列相关的知识等。 本书适合对期货量化交易感兴趣的普通投资者和投资机构专业人员阅读,读者可以具备一定的?Python基础,也可以通过本书从头学习Python基础知识,再进一
本书全面系统地介绍了数据编织的核心概念、设计原则、关键技术、面临的挑战及未来发展趋势,并结合实际案例,探讨了数据编织在行业领域的应用,为读者提供全面的数据管理和知识发现的全新解决方案。 本书可供数据管理和工程师、数据科学家、T和业务领导者,以及对数据编织感兴趣的专业人员阅读参考。
Spark数据处理引擎是一个惊人的分析工厂:输入原始数据,输出洞察。PySpark用基于Python的API封装了Spark的核心引擎。它有助于简化Spark陡峭的学习曲线,并使这个强大的工具可供任何在Python数据生态系统中工作的人使用。本书帮助你使用PySpark解决数据科学的日常挑战。你将学习如何跨多台机器扩展处理能力,同时从任何来源(无论是Hadoop集群、云数据存储还是本地数据文件)获取数据。一旦掌握了基础知识,就可以通过构建机器学习管道,并配合Python、pandas和PySpark代码,探索PySpark的全面多功能特性。
本书从零基础读者的角度出发,通过通俗易懂的语言、丰富多彩的实例,循序渐进地让读者在实践中学习Oracle编程知识,并提升自己的实际开发能力。 全书共分为5篇18章,内容包括Oracle 19c概述、Oracle管理工具、SQL*Plus命令、数据表操作、SQL查询基础、SQL查询进阶、子查询、常用系统函数、PL/SQL语言编程、游标、过程与函数、触发器、索引和视图、完整性约束、管理表空间和数据文件、事务、数据导入与导出和企业人事管理系统等。书中知识点讲解细致,侧重介绍每个知识点的使用场景,涉及的代码给出了详细的注释,可以使读者轻松领会Oracle的精髓,快速提高开发与运维技能。同时,本书配套了大量教学视频,扫码即可观看,还提供所有程序源文件,方便读者实践。 本书适合Oracle初学者、数据库技术入门者自学使用,也可用作高等院校相关专业的教材及参
Oracle数据库是一种高效率、高可靠性、适应高吞吐量的数据库解决方案;在本书的讲解过程中,系统地描述了Oracle体系结构,并在此基础上展开阐述了SQL语言,用户权限和对象管理以及实践编译开发, 是Oracle数据库导入导出和闪回技术。本书内容实用,结构合理,实例丰富,可以帮助Oracle初学者系统地了解Oracle体系架构以及开发实践,除此之外,书中嵌入大量来自作者的实战经验,可以帮助有着一定资历的Oracle数据库开发者在面对具体问题时找到打开思路的方法。
程传慧主编的《数据库原理与技术(计算机专业群第3版普通高等教育十三五规划教材)》较系统、全面地叙述了数据库系统的基本概念、基本原理和基本方法。内容包括数据库概念、数据模型、存储结构、关系数据理论和关系数据库的基本概念、SQL语言、数据库应用系统设计、SQL Server 2014数据库的基础知识与基本开发方法。还介绍了C/S与B/S模式、数据库保护、数据仓库、数据挖掘、分布式数据库等知识。本教材强调理论联系实际, 一章介绍了管理信息系统软部件库和软件生产线,无需掌握编程语言,只需建模并在建模过程中设定参数就能完成一般管理信息系统的设计与建设。 本书可作为高等院校本、专科及在职职工学习数据库理论与技术的教材,也可供研究生和从事计算机工作的科技工作者参考。
本书通过实例引导,深入浅出地介绍了Oracle程序设计的相关知识和实战技能。本书 ~9章主要包括Oracle学习指南、Oracle安装与配置、初识SQL、 SQL限定查询、Oracle的单行函数、多表查询、分组统计查询、子查询以及Oracle数据的基本操作等; 0~17章主要讲解Oracle的表创建与管理、Oracle的数据完整性、Oracle的数据库对象、PL/SQL编程、游标、存储过程与函数、触发器和程序包以及Oracle的表空间等; 8~20章主要讲解控制文件及日志文件的管理、Oracle的安全管理以及数据库备份与恢复等。本书适合任何想学习Oracle的读者阅读,无论您是否从事计算机相关工作,是否接触过Oracle,均可通过阅读本书快速掌握Oracle的开发方法和技巧。
。。。
数据科学和机器学习领域经常使用Python。如果读者对这两个领域特别感兴趣,却又不太清楚如何有针对性地学习Python,那么本书可以提供一些帮助。本书作者经验丰富,能够量体裁衣,为读者提供指导。 本书首先介绍Python和Jupyter笔记本的基础知识,然后逐一介绍丰富的、与数据科学相关的Python库,并举例说明如何在实际工作中运用Python。本书将Python和数据科学融合起来,帮助读者快速入门Python并使用Python完成数据分析相关任务,是实用的快速上手教程。书中代码使用与Jupyter笔记本兼容的Colab创建,方便读者配置和使用。
DolphinDB不仅支持海量数据的高效存储与查询,更开创性地提供了功能完备的编程语言以支持复杂分析,以及高吞吐、低延时、开发便捷的流数据分析框架,是计算能力不错的数据库系统之一。本书不仅介绍了如何使用DolphinDB这一兼有存储和高性能计算功能的数据库系统进行数据分析实践,还提供了大量金融和物联网等场景的实践案例,使读者通过借鉴和修改案例中的解决方案,将它们应用于自己的数据分析系统之中。本书从入门概念到实践应用分析均讲解得深入浅出、易于理解,是一本具有实践意义的数据分析工具书。即使是零基础的读者,也能通过学习本书,快速上手实践。