SQL是使用*广泛的数据库语言,绝大多数重要的 DBMS 支持 SQL。本书由浅入深地讲解了SQL的基本概念和语法,涉及数据的排序、过滤和分组,以及表、视图、联结、子查询、游标、存储过程和触发器等内容,实例丰富,便于查阅。新版对书中的案例进行了全面的更新,并增加了章后挑战题,便于读者巩固所学知识。
本书第1版于1983年出版,至今已修订至第6版。教材出版近40年来为全国数百所高校采用。本书三次荣获优秀教材奖(1988年、2002年、2021年)。相应课程先后入选北京市精品课程、精品课程、精品资源共享课程、精品在线开放课程和一流本科课程。 本书系统全面地阐述了数据库系统的基础理论、基本技术和基本方法。全书分为4篇18章。篇基础篇,包括绪论、关系数据模型、关系数据库标准语言SQL、数据库安全性和数据库完整性,共5章。第二篇设计与应用开发篇,包括关系数据理论、数据库设计和数据库编程,共3章。第三篇系统篇,包括关系数据库存储管理、关系查询处理和查询优化、数据库恢复技术、并发控制和数据库管理系统概述,共5章。第四篇新技术篇,包括数据库发展概述、大数据管理系统、数据仓库与联机分析处理、内存数据库系统、区块链与数据库,共
本书是一本基于 Python 实现全部例题计算的统计学教材,书中例题解答均给出了详细的实现代码和结果。全书共 11 章,第1章和第2章介绍数据、Python 的下载与安装、Python的数据类型和基本操作、Python 绘图基础等。第3章和第4章介绍数据的描述性分析方法,包括数据可视化和描述统计量。第5~7章介绍数据的推断性分析方法,包括概率分布、参数估计和假设检验。第8~11章介绍实际中常用的一些统计方法,包括类别变量分析、方差分析、回归分析、时间序列分析等。 本书可作为高等院校各专业开设统计学课程的教材,也可作为数据分析工作者、Python 数据分析和可视化爱好者的参考书。
本书分12章重点阐述了数据管理的重要性,数据管理面临的挑战,DAMA的数据管理原则,数据伦理,数据治理,数据生命周期管理的规划及设计,数据赋能和数据维护,使用和增强数据,数据保护、隐私、安全和风险管理,元数据管理,数据质量管理,以及现在应该怎么办,能够帮助企业管理层在了解和执行数据管理的过程中不致迷失在技术术语的迷宫之中。本书可供非数据专业人士、企业管理者、数据行业研究者等读者学习和参考。
本书描述了数据的混杂特性、当前关于首席数据官报告体系的分歧、自适应规划的需求、平衡的实现以及特定的新执行模型;介绍了首席数据官过程改进框架,通过数据管理知识体系和数据管理成熟度模型描述了数据领导者使用的核心概念、技术和策略以及集成;描述了在当前领导者之外维持数据和实践改进所需的关键角色,以及首席数据官在其组织中实施解决方案时可能会面临的问题;*后描述了在公共领域正在进行的工作及将对公共和私营部门产生的影响。通过这本书,有助于首席数据官为他们的组织创造以数据为中心的价值,适合从事大数据、数据管理的人士阅读。
教材系统地介绍文本数据挖掘的相关概念,利用Python作为工具进行相关试验,其内容主要包括:文本挖掘产生的背景及发展;文本挖掘的概念、文本模型表示、文本内容的预处理,包括分词、去停用词以及特征抽取;文本相似度的概念等。介绍文本分类的概念及常用方法,如KNN算法、SVM算法等,并对分类结果进行评价;在介绍文本聚类聚类的概念时是,同样介绍聚类常用算法,如K均值算法、层次聚类法、密度聚类法等,作为有文本分类、文本聚类的应用,*后给出了信息抽取、社会网络中的实体关系抽取和事件抽取。
本书系统讲述数据仓库的基本概念、基本原理以及建立数据仓库的方法和过程。主要内容包括:决策支持系统的发展、数据仓库环境结构、数据仓库设计、数据仓库粒度划分、数据仓库技术、分布式数据仓库、ElS系统和数据仓库的关系,外部和非结构化数据与数据仓库的关系、数据装载问题、数据仓库与Web、ERP与数据仓库以及数据仓库设计的复查要目。 本书是数据仓库之父撰写的关于数据仓库的 权威著作,既可作为相关专业的研究生教材,也是数据仓库的研究、开发和管理人员的指南。
本书是普通高等教育 十一五 *规划教材。本书全面系统地介绍了数据挖掘和知识发现领域的基本原理、研究方法、部分产品和工业标准。全书共15章,其中,第1章介绍数据分析技术的发展历程,KDD与数据挖掘的概念、对象、过程、方法、相关领域和应用范围。第2章介绍关联规则基本模型和Apriori等经典算法。第3章在介绍距离概念的基础上,讨论包括划分、层次、密度等聚类方法。第4章介绍ID3、CART等决策树算法。第5章介绍图方法实现贝叶斯分类。第6章介绍VC维、支持向量机。第7章介绍人工神经网络。第8章介绍近期热点技术 深度学习。第9章介绍不平衡数据学习。第10章讨论过拟合、模型选择、模型评估等内容。第11、12章是不确定性、模糊性方法,分别介绍粗糙集和模糊集。第13章是Web挖掘,介绍Web链接分析、推荐系统和社交网络挖掘。第14章介绍数据预处理和可视
本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
内容介绍 本书从业务、数据、运营3个维度为电商的经营和决策提供了科学的方法论,是一部电商运营真经,真正做到了“业务中有数据,数据中有运营”。作者是资深的电商行业专家,从事电商数据分析与数据化运营10余年,本书是他在多个知名电商品牌操盘多个千万级项目的经验总结。 为了增强本书的趣味性和读者的角色代入感,本书采用了纪实和叙事的写作手法,书中虚拟了3个核心人物: ?Alex:临危受命、勇挑重担、运筹帷幄的BI部门经理(资深数据分析师)。 ?叶子:有电商行业从业经验但是不懂数据分析的业务员。 ?大白:从其他行业转型到电商行业的数据分析师。 全书有两条主线: ?暗线:叶子和大白在Alex的指导和帮助下成长为“精业务、精数据、精运营”的“三精”数据分析师的经历,这对数据分析师的职业规划和成长有重要借鉴意义。 ?明线:Alex将
本书主要介绍大数据可视化的基本概念和相应的技术应用。全书内容共10章,分别为大数据可视化概述、大数据可视化原理、大数据可视化方法、数据可视化工具、Excel数据可视化、Tableau数据可视化、ECharts与pyecharts数据可视化、Python数据可视化、大数据可视化行业分析以及大数据可视化综合实训。 本书将理论与实践操作相结合,通过大量的案例帮助读者快速了解和应用大数据分析的相关技术,并且对于书中重要的、核心的知识点加大练习的比例,以使读者达到熟练应用的目的。 本书可作为大数据、云计算、软件技术、信息管理、计算机网络等专业的教材,可也作为大数据爱好者的自学参考书。
Power BI是微软推出的商业智能分析工具,它融合了数据准备、数据分析、数据可视化到报告协作分享的整个数据处理流程,帮助用户上手数据分析。 本书从实用的角度出发,结合作者本人的学习经验,从*基础的Power BI架构和操作界面开始,先通过一个小示例体验Power BI的强大和便捷,然后按照数据处理的流程和难易程度,分别介绍数据准备模块Power Query、数据建模以及Power BI数据分析语言DAX、可视化图表制作、丰富的交互方式和报表设计,*后用一个完整的分析示例带读者全面认识Power BI数据处理流程。 不论读者是学生、职场人士还是自由职业者,不论从事的领域是运营、财务、人力、管理还是电商,只要在平时的学习和工作中需要处理大量信息,分析各种数据,你就适合阅读本书学习Power BI,即使之前没有任何基础,它也可以帮你快速上手,提升自身竞争力。
MySQL数据库是以 客户端/服务器 模式实现的,是一个多用户、多线程的小型数据库。MySQL因其稳定、可靠、快速、管理方便以及支持众多系统平台的特点,成为世界范围内流行的开源数据库之一。 《MySQL数据库入门/国家信息技术紧缺人才培养工程指定教材》就是面向数据库初学者特地推出的一本进阶学习的入门教材,《MySQL数据库入门/国家信息技术紧缺人才培养工程指定教材》站在初学者的角度,以形象的比喻、丰富的图解、实用的案例、通俗易懂的语言详细讲解了MySQL的开发和管理技术。全书共8章,第1~5章主要讲解了MySQL中的基础操作,包括数据库基础知识、MySQL的安装配置及使用、数据库和表的基本操作、单表中数据的增删改查操作以及多表中数据的增删改查操作。第6~8章则围绕数据库开发的一些知识展开讲解,包括事务与存储过程、视图、数据的
本书入选软件工程专业教学指导委员会 软件工程专业系列教材 。全书从基础的统计分析方法到基于机器学习的预测模型,全面系统地介绍了各种常用的数据分析方法及其典型应用,并结合大量的实际应用案例介绍了各种分析方法的使用步骤及其应用效果,让读者能够更好地了解各种分析方法的应用场景和价值。 全书共10章,主要包括:绪论、概论率基础、描述性分析、探索性数据分析、参数估计、假设检验、方差分析、相关分析与回归分析、机器学习、时间序列分析。 本书可作为高等学校软件工程、数据科学与大数据技术、人工智能等专业教材,供高年级本科生和研究生 数据分析 数学建模 数据挖掘 相关课程使用;也可作为需要利用定量分析和数学建模进行业务分析和管理决策的相关工作人员的参考书。
本书通过选购笔记本电脑的案例引入数据包络分析(dataenvelopmentanalysis,DEA)的基本概念和模型,并运用简单的EXCEL模型让读者更易理解和运用DEA。本书着重阐述如何将DEA作为一种运营分析工具,进行绩效评估,找出基准标杆。探讨的主题包括:平衡的基准,昀佳实践,相对效率的概念及绩效提升。特别地,本书探讨的数据分析方法能够帮助一个组织重新审视它对生产效率高低的已有观点是否合理,并为组织不断改进提供指导。本书是市面上**本不要求读者具备线性规划和线性代数知识,就可以熟练应用DEA方法的DEA方法指导用书。
本书第2版于2021年首届全国教材建设奖评选中荣获全国优秀教材二等奖。第3版在其基础上对内容进行增删和优化重组,形成4部分共16章的立体知识结构,主要包括:第0章基础知识;部分表结构(第1 4章),介绍线性表、栈和队、散列表、矩阵和字符串等内容;第二部分树结构(第5 8章),介绍普通树和二叉树、检索树和检索树、平衡树模式、哈夫曼树和判定树等内容;第三部分图结构(第9 11章),介绍图的基本概念和遍历、小生成树和短路径、有向无回路图等内容;第四部分排序和算法设计初步(第12章 15章),介绍内排序、外排序、集合运算的数据结构和算法设计的一般方法、问题的固有难度和三大问题类等内容。为便于读者学习,全书还配有知识点讲解视频、PPT课件、中英文术语对照、各章部分习题参考答案、抽象数据类型的C 类实现示例等教学资源。本书可
《数据挖掘(概念与技术原书第3版)》完整全面地讲述数据挖掘的概念、方法、技术和 研究进展。本书对前两版做了全面修订,加强和重新组织了全书的技术内容,重点论述了数据预处理、频繁模式挖掘、分类和聚类等的内容,还全面讲述了OLAP和离群点检测,并研讨了挖掘网络、复杂数据类型以及重要应用领域。 《数据挖掘(概念与技术原书第3版)》是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都 的参考书,是一本适用于数据分析、数据挖掘和知识发现课程的 教材,可以用做高年级本科生或者一年级研究生的数据挖掘导论教材。本书由韩家炜等著。
本书主要介绍了数据可视化的基础知识、可视化工具的入门和应用、使用Python流行的库创建美观的数据可视化效果,并总结了了7大类40种不同的可视化图形,从基本信息、构成与视觉通道、适用数据、使用场景、注意事项、变体等多方面详细介绍了每种可视化图形的使用权方法,可作为常用可视化图形的使用手册。本书还提供了6个贴近大学生学习生活的可视化案例,为读者自由灵活应用可视化参考提供了有力的参考。 本书可作为高等院校数据科学与大数据技术、统计学及其相关专业的本科课程教材,也可供有一定实践经验的软件开发人员、管理人员作为自学和参考用书。
生态学数据分析:方法生态学研究需要从原始数据出发,通过系列计算分析,最后作出具有生态意义的解释?本书主要介绍PCORDfor Windows?CanocoforWindows?CurveExpert?SPSS和PAST 等软件在生态学数据转换?标准化?函数拟合?遗传多样性?物种多样性?生态位?空间分布格局?聚类?排序和实验数据统计检验上的应用方法?应用QBASIC和R 语言对书中的部分方法编制程序?书中的每一种方法均提供模拟数据,介绍具体的操作步骤??程序与软件
大数据审计已经成为目前审计领域研究与应用的热点。本书按照从常用电子数据审计方法到大数据审计方法的思路,不仅系统地分析了电子数据审计的理论知识(特别是大数据审计),还重点结合实际案例和具体操作,从审计数据采集、审计数据预处理和审计数据分析等电子数据审计的关键步骤出发,系统地分析了如何开展电子数据审计(特别是大数据审计)。附录中设计了9个实验模块(包括3个大数据审计实验模块),满足了开设实验课程的需要。 本书可作为高等院校审计、会计和信息管理等专业的教材,也可作为审计从业人员的专业培训教材和业务学习资料。
本书详细介绍了意大利那不勒斯菲里德里克第二大学Massimo Aria和Corrado Cuccurullo基于R语言开发的BIBLIOMETRIX工具包。该R工具包基本上涵盖了进行科学计量和知识可视化的功能,可以满足爱好R软件,并试图使用R进行科学计量和知识图谱分析的读者。在此基础上,本书对于科学计量与知识图谱相关的一些R工具包,包括rAltmetric、wordcloud2、gender以及tidytext等工具包进行了简要介绍。