《数据库系统概念》是数据库系统方面的经典教材之一,其内容由浅入深,既包含数据库系统基本概念,又反映数据库技术新进展。本书基于该书第7版进行改编,保留其中的基本内容,压缩或删除了一些高级内容,更加适合作为国内高校计算机及相关专业本科生数据库课程教材。
本书从Power BI的基础功能讲起,逐步深入到Power BI进阶实战,以系统化的实操步骤和丰富的实际案例让读者快速入门Power BI数据分析,掌握Power BI在多个业务领域的实际应用。全书共8章:商业智能与数据分析概述;Power BI简介;数据分析与可视化制作全过程;Power BI数据预处理;Power BI数据建模;Power BI数据可视化;Power BI在线服务;Power BI数据分析实战案例。 本书通俗易懂、循序渐进、内容全面、讲解详细,配备全套数据集、教学课件和学习视频,既适合读者自学Power BI数据分析与可视化,也适合大专院校作为教材,更适合从事销售、产品、电商运营、仓储物流、财务管理、人力资源等岗位的职场人士提升技能。
本书与以往统计学中的概率论略有不同,添加了一些复杂数据类型的概率基础知识和模拟计算中的相关概率知识。具体安排如下所述。本书共分6章。第1章为概率与计数,基本内容是随机事件、概率空间、计数方法、概率的确定方法。第2章为条件概率,基本内容是条件概率与乘法公式、事件的独立性、全概率公式与贝叶斯公式。第3章为随机变量,基本内容是随机变量及其分布函数、随机变量的分类、二维随机向量、随机变量的独立性、随机变量函数的分布。第4章为常用的概率分布,基本内容是常用的离散型随机变量、常用的连续型随机变量、随机数的产生。第5章为随机变量的数字特征,基本内容是数学期望、方差和协方差、矩和矩母函数、条件期望。第6章为不等式和极限定理,基本内容是概率不等式、大数定律及其应用、中心极限定理。
本书是一本系统介绍Clickhouse的指导型工具书,全书总共分为11章: 第1章 介绍ClickHouse的由来、发展历程、核心特点与核心特点。第2~6章 介绍了ClickHouse基础使用部分,包括整体架构、如何安装、数据定义、数据引擎、数据查询和函数的特性和使用方法。第7~9章介绍了ClickHouse高级特性部分,包括数据库管理操作,数据分片、数据副本和高可用的特性和使用方法。第10~11章介绍了如果自己手动实现ClickHouse中间件的思路和示例,同时也介绍了几款可视化工具与ClickHouse集成的方法。
教材系统地介绍文本数据挖掘的相关概念,利用Python作为工具进行相关试验,其内容主要包括:文本挖掘产生的背景及发展;文本挖掘的概念、文本模型表示、文本内容的预处理,包括分词、去停用词以及特征抽取;文本相似度的概念等。介绍文本分类的概念及常用方法,如KNN算法、SVM算法等,并对分类结果进行评价;在介绍文本聚类聚类的概念时是,同样介绍聚类常用算法,如K均值算法、层次聚类法、密度聚类法等,作为有文本分类、文本聚类的应用,*后给出了信息抽取、社会网络中的实体关系抽取和事件抽取。
本书全面介绍了预测性分析相关方法,不仅直观地阐述了相关概念,还给出了现实的示例问题和真实的案例研究 包括从失败项目获得的经验教训。 本书理论和实践内容相对平衡,便于读者加深理解。 全书共9章,外加一个附录。 第1章为分析导论, 第2章为预测性分析和数据挖掘导论, 第3章介绍预测性分析的标准流程, 第4章介绍预测性分析的数据和方法, 第5章介绍预测性分析算法, 第6章探讨预测性建模中的高阶主题, 第7章介绍文本分析、主题建模和情感分析, 第8章介绍预测性分析使用的大数据, 第9章介绍深度学习和认知计算, 附录展望了商业分析和数据科学工具的前景。 本书适合计算机科学、数据科学和商业分析领域的相关从业人员阅读。
大数据审计已经成为目前审计领域研究与应用的热点。本书按照从常用电子数据审计方法到大数据审计方法的思路,不仅系统地分析了电子数据审计的理论知识(特别是大数据审计),还重点结合实际案例和具体操作,从审计数据采集、审计数据预处理和审计数据分析等电子数据审计的关键步骤出发,系统地分析了如何开展电子数据审计(特别是大数据审计)。附录中设计了9个实验模块(包括3个大数据审计实验模块),满足了开设实验课程的需要。 本书可作为高等院校审计、会计和信息管理等专业的教材,也可作为审计从业人员的专业培训教材和业务学习资料。
Oracle数据库存储管理与性能优化 这本书以Oracle 11g为蓝本,在某些实践应用中也讲到了12c版本,全面系统地介绍了大型对象关系型数据库服务器Oracle性能优化方面的大部分内容,包括看懂SQL执行计划、Oracle存储管理、Oracle内存管理、Oracle性能指标及追踪、Oracle性能报告、Oracle实战案例等内容
本书是作者在近十年进行空间数据库研究、教学的基础上撰写而成的,系统地论述和分析了空间数据库的查询设计优化、若干新的查询、空间数据推理等新的技术和理论。 本书共13章,主要介绍空间数据库的基本索引结构、查询优化、方向方位和连接查询、最近邻查询、反向最近邻查询、核心变体查询、一般变体查询,线段的最近邻查询和反向最近邻查询,空间填充曲线的空间查询,基于主存Δ-tree的高维数据查询,空间网络间的空间关系及推理和空间方向关系的关系推理基础等。 本书可作为计算机科学与技术、地理信息系统、机器人技术、人工智能、卫星遥感、气象分析、地质灾害分析等领域数据库相关专业高年级本科生和研究生的教材,也可供上述领域的科研人员和工程技术人员等参考。
制定多种匿名化解决方案,覆盖多种应用场景,满足对可识别性的不同要求。 解决方案跟所用数据、数据接收方和分析目标相匹配。 为数据采集模式量身定制匿名化流水线,覆盖不同业务需求。 为原始数据生成匿名化版本或用分析平台生成匿名化输出。 检查匿名数据使用的伦理问题。
大数据让我们以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,*终形成变革之力。本书围绕Hadoop和Spark这两个主流技术进行讲解,主要内容包括Hadoop环境配置、分布式文件系统HDFS、分布式计算框架MapReduce、资源调度框架YARN与Hadoop新特性、大数据数据仓库Hive、离线处理辅助系统、Spark Core、 Spark SQL、Spark Streaming等知识。 为保证*学习效果,本书紧密结合实际应用,利用大量案例说明和实践,提炼含金量十足的开发经验。本书使用Hadoop和Spark进行大数据开发,并配以完善的学习资源和支持服务,包括视频教程、案例素材下载、学习交流社区、讨论组等终身学习内容,为开发者带来全方位的学习体验,更多技术支持请访问课工场官网:www.kgc.cn。
本书部分是基础篇(第1~7章)主要讲解数据库的基础知识。第二部分是设计篇(第8~10章)主要内容包括关系数据库规范化理论、实体联系模型以及数据库设计。第三部分是“系统篇(第11~14章)内容包括安全管理、查询处理与查询优化技术等。第四部分是“发展篇”(第15章和16章)主要讲解数据库前沿技术的概念及应用。
本课程的教学内容主要包括聚类、关联、降维、变量选择、分类与预测、集成算法、图模型与推荐系统等。每一部分都是本课程授课的主要内容,都力求深入浅出,精讲细讲,不光讲解各种方法的过程与原理,还要加强学生对各种方法的深入理解。
《数据分析思维与可视化》以实用为设计理念,并结合数据分析相关理论,系统地介绍了数据分析的相关内容,包括电商数据分析概述、数据分析业务指标、数据准备与处理、数据分析常用方法、常用数据分析工具、数据可视化、数据图表专业化、撰写数据分析报告等,能够帮助读者掌握数据分析的整个流程。 《数据分析思维与可视化》附有配套的教学PPT、题库、教学视频、教学设计等相关资源。同时,为了帮助初学者及时地解决学习过程中遇到的问题,还提供了专业的在线答疑平台。 《数据分析思维与可视化》可作为高等院校本、专科相关专业的数据分析课程的教材,也可作为企业数据分析岗位培训教材。
《数据结构实验指导教程(C语言版)》中预备知识,介绍项目中实验环境、程序组织方式和管理方法,讲解程序及算法的效率估算方法和分析技巧,描述一般测试技术和调试方法,以及测试数据与测试用例的设计安排技巧;基础实验,首先安排重要的验证性实验,然后设计基于基本数据结构的简单应用实验;综合实验(即课程设计),介绍在一个项目中选择和使用多种基本数据结构的依据和方法,讲解如何有效地将它们融合在一起解决实际的复杂应用问题。 本教程在内容选取及编排顺序上,与《数据结构(C语言版)》(978-7-302-14751-0,清华大学出版社出版)保持一致,可作为高等院校计算机及相关专业数据结构课程的实验教材。
如今企业数字化转型和“互联网+”已成为热门话题。那么,如何开展转型工作,让具体工作可以落到实处呢?由于数字化转型工作的复杂性,很多企业管理者感觉无从下手,市面上也十分缺乏相关的指引和资料。本书介绍的企业架构方法以及多个领先企业和行业数字化案例,可以使读者系统地掌握数字化转型的理论和落地方法,帮助企业完成生死攸关的转型变革。本书回答了“什么是数字经济,什么是数字化转型,什么是数字化转型的关键要素”等问题,并在转型方法方面介绍了数字化企业架构的业务架构、流程、组织、IT架构,详细阐述了金融、零售、医疗、物联网、AI、智能制造等方面*的商业模式和技术发展。本书打开了一扇新的数字化转型方法之门,是企业管理者、信息化从业者以及管理咨询服务机构、IT服务公司从业人员、大专院校师生很好的参考资料。
《Hive编程指南》是一本Apache Hive的编程指南,旨在介绍如何使用Hive的SQL方法——HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合。全书通过大量的实例,首先介绍如何在用户环境下安装和配置Hive,并对Hadoop和MapReduce进行详尽阐述,最终演示Hive如何在Hadoop生态系统进行工作。 《Hive编程指南》适合对大数据感兴趣的爱好者以及正在使用Hadoop系统的数据库管理员阅读使用。
本书以数据库为核心,以PowerBuilder 11.5和Dreamweaver CS4为开发环境,以 按照数据库功能模块进行案例教学 为编写新思路,将数据库基本理论、数据库开发技术、网站开发环境以及多个简明完整的实验案例有机地结合在一起。本书共分为4篇,篇介绍数据库系统概论、关系数据库基础知识、标准SQL以及网络数据库系统的工作模式。第二篇介绍利用PowerBuilder 11.5开发(基于C/S结构数据库应用系统)、创建数据库、窗口和控件、数据窗口、菜单、PowerScript语言、函数及结构、数据管道、程序调试以及PBL库管理等内容。第三篇介绍利用Dreamweaver CS4开发(基于B/S结构网站系统)、ASP动态网页技术的基础、动态站点的建立及Access数据库的连接等。第四篇为两种开发环境开发的案例。数据库应用系统的个案例和网站开发的两个案例都有详细的设计步骤,特别适合初学者自学。本书可作
《普通高等教育“十二五”重点规划教材·计算机系列:数据结构、算法及应用》以全国计算机专业研究生入学考试大纲为骨架,系统讲述数组、链表、栈、队列、表、二义树、优先队列、堆、集合、映射、散列表、树和图等基本数据结构,以及插入、删除、遍历、查找、归并和排序等基本算法。全书对核心内容进行了深入的讲解,对扩展内容进行了系统、全面的介绍。 《普通高等教育“十二五”重点规划教材·计算机系列:数据结构、算法及应用》可作为高等院校计算机专业和相近专业本科生“数据结构”课程的教材或参考书,也可供计算机应用领域的工程技术人员参考。
本书内容覆盖数字化转型的理论和实践两大板块,既有理论层面的数字化转型内涵和机理研究,也有实践层面的数字化转型经验总结。理论篇对中国产业数字化转型的战略和政策进行了整体梳理,涵盖产业数字化转型的内涵外延、理论机理、战略理念、贡献测算、指数评价;实践篇选取汽车、物流和医疗三大产业领域进行了产业路径和模式研究,涵盖产业数字化转型的全球经验、国内现状、发展思路、主要任务、政策建议,是对中国产业数字化转型2.0的深入全面研究。
这是一个大数据爆发的时代。面对信息的激流、多元化数据的涌现,大数据为个人生活、企业经营,甚至国家与社会的发展带来了机遇和挑战,大数据已经成为IT信息产业中具潜力的蓝海。“大数据导论”是一门理论性和实践性都很强的课程。本书是为高等职业院校相关专业“大数据导论”课程全新设计编写的,具有丰富的实践特色。针对高等职业院校学生的发展需求,本书分8个项目,系统、全面地介绍了关于大数据技术与应用的基本知识和技能,详细介绍了大数据与大数据时代、大数据时代思维变革、大数据促进行业发展、大数据方法的驱动力、大数据存储技术、大数据处理技术、大数据分析技术、大数据在云端等内容,具有较强的系统性、可读性和实用性。
本书以关系数据库管理系统SQL Server 2014作为平台,以商店销售数据库作为主线,全面系统地介绍了数据库原理、数据库系统和数据管理新技术。数据库原理部分包括数据库概述、关系数据库、关系数据库规范化理论和数据库设计;数据库系统部分包括SQL Server数据库基础、创建数据库和创建表、数据定义语言和数据操纵语言、数据查询语言、索引和视图、数据完整性、数据库程序设计、数据库编程技术、事务和锁、系统安全管理、备份和恢复、基于Visual C#和SQL Server数据库的学生管理系统的开发;数据管理新技术部分包括大数据和云计算。本书可作为高等院校计算机及相关专业的教学用书,为读者提供习题答案、教学课件、所有实例的源代码。