大模型在众多领域得到了广泛应用,促进了AI技术的整合和创新。然而,在实际应用过程中,直接将大模型应用于特定行业常常难以达到预期效果。本书详细阐述如何在游戏经营分析场景中利用大模型实现数据体系的建设。 本书分为6个部分,共16章。第1部分主要介绍大模型技术的发展与应用,从大模型的发展现状展开,重点介绍大模型与数据体系的相关知识。第2部分主要介绍大模型下的关键基础设施,涵盖湖仓一体引擎、湖仓的关键技术、实时数据写入和高效数据分析等内容。第3部分主要介绍大模型下的数据资产,围绕数据资产重塑、数据资产标准、数据资产建设、数据资产运营展开。第4部分主要介绍自研领域大模型的技术原理,涵盖领域大模型的基础、需求理解算法、需求匹配算法、需求转译算法等内容。第5部分主要介绍大模型的工程化原理,涉及工程化的
暂无内容简介。。。。。。
《SQL学习指南(第3版)》介绍了SQL语言的基础知识以及 特性,包括SQL基本查询、过滤、多数据表查询、集合、数据操作、分组和聚合、子查询、连接、条件逻辑、事务、索引和约束、视图等内容。同时,为了适应近年来数据库领域的发展变化,本书针对大数据、SQL跨平台数据库服务和数据分析等领域的需求,增加了处理大型数据库的实现策略和扩展技术,以及报表和分析工具等内容。 《SQL学习指南(第3版)》内容循序渐进,每章的主题相对独立,并提供了丰富、可扩展的示例,同时还配备精选练习,有利于读者有效学习和快速掌握SQL语言。本书适合作为数据库应用开发者和数据库管理员的 入门书,也可供SQL相关从业者查阅和参考。
本书系统讲授数据挖掘的原理、主要方法及其Python实现,共分三部分:第一部分包含第1~2章,介绍数据挖掘的基本概念、流程和数据预处理;第二部分包含第3~11章,介绍经典的分类算法(包括朴素贝叶斯分类器、决策树、k-近邻、支持向量机等)、经典的聚类分析、关联分析、人工神经网络和Web挖掘等方法;第三部包含第12~14章,共有3个综合案例,包括泰坦尼克号生存数据分析、心脏病预测分析和旅游评论倾向性分析。
本书详细介绍面向静态数据集、增量数据集和数据流的高效用模式挖掘的理论和方法。本书内容共6章,第1章和第2章介绍高效用模式挖掘的相关知识。第3章介绍面向静态数据集的包含正、负效用的两类精简高效用模式挖掘方法的研究与实现过程。第4章介绍针对增量数据集的挖掘高效用模式全集和精简集合的研究。第5章介绍面向数据流的精简高效用模式挖掘方法的研究与实现过程。第6章给出三个高效用模式挖掘的应用案例。第3~5章有方法的实验证明,供读者更好地了解本书内容。 本书可供大数据挖掘相关专业研究生参阅,也可以作为大数据挖掘研究和应用开发人员的参考书。
当前,数据驱动的理念已渗透到各个领域,数据科学和人工智能技术在制造业、金融、教育等多个行业中得到了广泛应用。Python作为一种编程语言,已成为数据科学和人工智能领域的事实标准,它丰富的生态系统进一步增强了它在这些领域中的重要性。然而,随着数据量的不断增长,如何利用Python加速数据科学处理,并将它扩展到集群上的并行计算,已成为数据科学家面临的重要挑战。本书详细介绍了4种数据科学工具:Dask、Ray、Xorbits和mpi4py,这些工具可以帮助数据工程师和科学家处理更大规模的数据集、训练更复杂的模型,并更高效地进行机器学习模型的迭代和部署。本书面向具备一定数据科学基础的数据工程师、数据科学家或领域专家,同时也适合大学生和研究生作为进入高性能数据科学领域的入门读物。
本书针对微软公司数据库软件Access ,从数据库使用的实际需要出发,将基础知识与基本技能相结合,按照“以服务为宗旨,以就业为导向”的指导思想,采用“行动导向,任务驱动”的方法,将知识点穿插在学生信息管理系统实例制作的操作过程中。本书共6个项目,主要包括数据库应用系统、系统初始化、信息查询、打印数据信息、管理数据信息、应用系统实现等内容。围绕“罗斯文”数据库系统实例建设展开,按照系统开发的一般步骤,详细讲解“罗斯文”数据库系统的开发过程,坚持“在做中学,在学中做”学用结合,在不断的实践中,通过实现系统掌握数据库基础知识。每个项目有若干任务,每个任务由“任务描述”、“做一做”、“学一学”、“试一试”、“小本子”5个模块组成介绍数据库应用软件开发的实际流程与制作技巧。本书适合计算机爱好者入
本书系统地介绍向量数据库的原理、技术实现及其应用,重点分析传统数据库在处理高维向量数据时的局限性,并提供相应的解决方案。本书分为4个部分,共13章,内容涵盖从理论基础到技术实践的多个方面,详细讨论高维向量表示中的信息丢失、嵌入空间误差和维度诅咒等问题,结合FAISS和Milvus等主流开源工具,深入剖析向量数据库的索引机制、搜索算法和优化策略。通过实际案例,展示向量数据库在推荐系统、行为分析、智能诊断、语义搜索等领域的应用,并特别强调企业级语义搜索系统的开发与部署经验。 本书不仅提供深度的理论指导,还通过丰富的案例帮助读者掌握如何构建高效的向量搜索引擎,适合从事搜索引擎与推荐系统开发的工程师,数据科学、人工智能及相关领域的从业者、研究人员,以及对向量数据库与相似性搜索感兴趣的读者,也可作为培训
本书全面记载了21世纪初20年国家气象中心(中央气象台)的事业发展历程。系统总结了天气预报、数值预报、气象服务、气象信息化等业务和相关技术的进步与成就,以及科技与人才、国际交流、精神文明建设等方面的发展变化,展望了在全面建设社会主义现代化强国的新征程上,国家气象中心(中央气象台)事业高质量发展的主要方向与基本途径。本书是非常有价值的珍贵史料。本书内容全面、客观,图文并茂、通俗易懂,适合气象部门各级领导和专业技术人员、气象行业和交叉领域专业人士以及相关大专院校师生阅读和参考,也可作为各级 了解新世纪以来气象预报事业发展进步的参考书籍。
本书的主要内容包括网络数据的定义及相关指标、大规模网络中的链路预测、网络聚类分析、网络数据中的空间自回归模型、大规模网络数据中的模型估计方法、网络数据中的空间自回归模型的拓展及应用、网络中的空间自回归模型的其他研究方向等。本书关注大规模网络数据分析中的模型方法。除模型方法本身的理论拓展之外,在估计方法等方面会涉及大规模数据中的快速计算方法。由于网络分析本身的范围非常广泛,故本书涉及的内容仅局限于作者及团队研究工作中使用到的一部分。在本书的后,为了启发读者思路,对于部分已有网络研究进行了梳理。
本书是《数据结构》一书配套的实验教材,用于辅助实验教学。全书共分三篇。*篇为基础实验,介绍数据结构与算法基础知识的实验,包括线性表、栈和队列、串、数组,以及广义表、树和二叉树、图、查找、排序等内容,一共有12个实验。第二篇为综合实验,是数据结构知识的应用与提高,包括链表的应用,栈和队列的应用,树结构的应用,图结构的应用以及文本文件检索等综合性实验内容,共10个实验。第三篇为课程设计,详细介绍了7个课程设计的课题,综合性较强,另外还给出了一部分实训项目,内容涉及数据结构课程的多个应用领域,以引导学生进行开发实践。
大数据时代,各行各业积累的数据不断增多,海量数据经过清洗、整理以后,基于分析与挖掘工作,才能获取到有用的数据信息,挖掘到数据背后的价值,掌握大数据的规律。而数据分析与挖掘的核心工作即是数据建模。数据建模,通俗地说,就是通过建立数据科学模型的手段解决现实问题的过程。 本书共分为五章,内容包括数据建模概述、数据建模常用数据计算软件MATLAB和SPSS入门介绍、数据建模方法、实战案例分析等。本书注重理论与实践相结合,不仅有详细的数据建模理论方法,还有赛题案例,以及非常详细的程序代码,让读者既能具备数据建模理论的基础,又能掌握解决数据建模问题的技巧与方法,还能轻松应对大数据问题的编程计算。