SQL是使用最广泛的数据库语言,绝大多数重要的DBMS支持SQL。本书由浅入深地讲解了SQL的基本概念和语法,涉及数据的排序、过滤和分组,以及表、视图、联结、子查询、游标、存储过程和触发器等内容,实例丰富,便于查阅。新版对书中的案例进行了全面的更新,并增加了章后挑战题,便于读者巩固所学知识。
教材系统地介绍文本数据挖掘的相关概念,利用Python作为工具进行相关试验,其内容主要包括:文本挖掘产生的背景及发展;文本挖掘的概念、文本模型表示、文本内容的预处理,包括分词、去停用词以及特征抽取;文本相似度的概念等。介绍文本分类的概念及常用方法,如KNN算法、SVM算法等,并对分类结果进行评价;在介绍文本聚类聚类的概念时是,同样介绍聚类常用算法,如K均值算法、层次聚类法、密度聚类法等,作为有文本分类、文本聚类的应用,*后给出了信息抽取、社会网络中的实体关系抽取和事件抽取。
本书与以往统计学中的概率论略有不同,添加了一些复杂数据类型的概率基础知识和模拟计算中的相关概率知识。具体安排如下所述。本书共分6章。第1章为概率与计数,基本内容是随机事件、概率空间、计数方法、概率的确定方法。第2章为条件概率,基本内容是条件概率与乘法公式、事件的独立性、全概率公式与贝叶斯公式。第3章为随机变量,基本内容是随机变量及其分布函数、随机变量的分类、二维随机向量、随机变量的独立性、随机变量函数的分布。第4章为常用的概率分布,基本内容是常用的离散型随机变量、常用的连续型随机变量、随机数的产生。第5章为随机变量的数字特征,基本内容是数学期望、方差和协方差、矩和矩母函数、条件期望。第6章为不等式和极限定理,基本内容是概率不等式、大数定律及其应用、中心极限定理。
在云计算和互联网快速发展的驱动下,分布式技术领域产生了很多新的热点,分布式数据库就是其中之一。但是,目前对分布式数据库的理解和研究多停留在理论层面,本书以Greenplum分布式数据库为例,深入剖析分布式技术在工业级产品里的实现细节,为读者呈现从理论到实践的 全景图 。 本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。 本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现,实践性强。本书主要面向数据库领域的科研工作者
本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
大数据审计已经成为目前审计领域研究与应用的热点。本书按照从常用电子数据审计方法到大数据审计方法的思路,不仅系统地分析了电子数据审计的理论知识(特别是大数据审计),还重点结合实际案例和具体操作,从审计数据采集、审计数据预处理和审计数据分析等电子数据审计的关键步骤出发,系统地分析了如何开展电子数据审计(特别是大数据审计)。附录中设计了9个实验模块(包括3个大数据审计实验模块),满足了开设实验课程的需要。 本书可作为高等院校审计、会计和信息管理等专业的教材,也可作为审计从业人员的专业培训教材和业务学习资料。
本书通过选购笔记本电脑的案例引入数据包络分析(dataenvelopmentanalysis,DEA)的基本概念和模型,并运用简单的EXCEL模型让读者更易理解和运用DEA。本书着重阐述如何将DEA作为一种运营分析工具,进行绩效评估,找出基准标杆。探讨的主题包括:平衡的基准,昀佳实践,相对效率的概念及绩效提升。特别地,本书探讨的数据分析方法能够帮助一个组织重新审视它对生产效率高低的已有观点是否合理,并为组织不断改进提供指导。本书是市面上唯一本不要求读者具备线性规划和线性代数知识,就可以熟练应用DEA方法的DEA方法指导用书。
如今,推荐算法已经普遍应用于在线各个领域和场景,越来越多的商品、服务、用户通过推荐算法高效地连接彼此,每个人都享受到更加个性化的内容和服务。推荐已深刻地改变了我们与世界连接的方式。 本书聚焦在产品运营的角色上,探讨产品运营人员应该如何理解推荐算法,如何在不同的功能场景下应用推荐算法,如何从平台业务的角度对算法结果进行干预和再平衡。此外,本书着重于阐述不同功能场景下推荐的应用,辅以内容、电商、社交等业务下的应用实例。在每个章节中,都会枚举市面上已有产品功能或作者本人经历过的业务实践,以期给读者提供可以实操落地的借鉴。
本书理论部分主要介绍与数据处理和数据库应用密切相关的基础、核心的概念、原理和方法,主要内容包括:数据处理与数据库概述、实体-联系数据模型、关系数据库系统基础、SQL、关系数据库设计;应用部分以Access2010为具体的DBMS,详细介绍其主要功能和使用方法,主要内容包括:Acces2010的初级使用(包括创建数据表、查询、窗体、报表、宏、模块与VAB编程等内容)、Acces2010的高级应用。
本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!
C#语言已经成为.NET平台中*流行的编程语言。本书以Visual Studio 2012和SQL Server 2008为开发平台,从实际应用的角度出发,重点介绍了使用C#开发Windows应用程序的方法和技术。全书共9章内容,第1章为C#概述,介绍了Microsoft.NET平台概述、C#语言简介、Visual Studio集成开发环境和C#程序结构介绍;第2~3章为C#程序设计基础,通过实例以循序渐进的方式介绍了C#语言的各种语法、知识点和面向对象的基本思想;第4~5章介绍了使用C#语言开发Windows窗体应用程序,包括Windows窗体常用控件、菜单编程、对话框和多文档编程;第6章介绍了各种文件操作;第7章介绍了进程,包括线程和多线程编程;第8章介绍了数据库编程;第9章通过开发一个图书馆管理系统,全面介绍了软件开发流程,阐述了使用Visual C# 2012开发Windows应用程序的基本知识。本书内容立足于课堂教学和实际应用,各章均配有
本书是由斯普林格出版社2018年出版的介绍物联网雾计算前沿技术的书籍,全书详细介绍了物联网雾计算发展的背景及驱动因素,系统分析了雾计算的计算服务、存储服务和通信服务;从雾层管理方面,阐述了雾计算中物联网资源评估所面临的挑战及模型,分析了雾计算的分层处理在物联网超大规模系统中的作用;从雾层服务方面,阐述了雾计算隐私保护的现状和未来,描绘了隐私保护领域自感知雾计算的发展,探讨了城市物联网边缘计算;以信息物理能源系统、医疗保健领域为例分析了雾计算应用实践。
技术是把双刃剑,当我们在积极拥抱新技术的同时,也不能忽视其所带来的风险,比如当今大数据时代个人隐私和安全问题。本书是两位作者结合各自出色的专业知识和丰富的从业经验为大众倾力奉献的一本大数据时代隐私问题的普及读物。书中展示了我们在家庭和工作中的日常活动是如何成为大数据收集的一部分的。同时,列举大量的大数据应用以及安全和隐私相关案例,包括企业如何利用大数据进行营销、执法机构如何利用大数据执法等,也包括不法分子如何利用非法或合法的手段获取数据,如何利用社交网络进行犯罪。针对上述问题,本书也列出了一些工具、技巧用来检查和防范,这在当前很有现实意义。
技术文档翻译关乎企业全球化进程,是我国语言服务行业重要但却长期被忽视的领域,其翻译质量受制于译员对专业领域知识的系统理解。为帮助译员高效习得领域知识,本书借助知识本体技术,模拟人类认知思维过程,以云计算领域为例,构建了面向技术文档翻译的知识服务平台,论述了其构建原理、模型、流程及应用前景等。本书的研究源于技术写作行业实践,诉求于翻译人才专业知识水平的提高,延伸于企业国际形象建设,落脚于知识服务体系探索,回归于技术文档翻译质量。此过程体现了应用翻译研究与其他学科交叉融合的发展本质,更体现了数字人文建设的旨归。
本书深入浅出地介绍了Oracle 10g数据库系统管理与开发的基础知识,包括4篇,共14章,内容涉及Oracle 10g数据库服务器的安装与配置、Oracle数据库管理与开发工具的使用、Oracle数据库体系结构管理、Oracle数据库对象应用与管理、Oracle数据库安全性管理、Oracle数据库备份与恢复管理、SQL语言应用、PL/SQL程序设计、Oracle应用系统开发实例等,包含数据泵技术、闪回技术等Oracle 10g的*技术。全书理论与实践相结合,包含大量应用实例,强调实际操作技能的培训。为适合教学需要,附录A提供了8个实验,各章末均配有习题,并配有电子课件。 本书面向Oracle数据库的初学者和入门级用户,可以使读者从Oracle知识零起点开始逐渐全面地了解Oracle数据库的基本原理和相关应用开发,为将来深入学习Oracle数据库奠定基础。 本书适合作为高等院校计算机相关专业的教材,也适合作为Or
本书系统讲授数据挖掘的原理、主要方法及其Python实现,共分三部分:第一部分包含第1~2章,介绍数据挖掘的基本概念、流程和数据预处理;第二部分包含第3~11章,介绍经典的分类算法(包括朴素贝叶斯分类器、决策树、k-近邻、支持向量机等)、经典的聚类分析、关联分析、人工神经网络和Web挖掘等方法;第三部包含第12~14章,共有3个综合案例,包括泰坦尼克号生存数据分析、心脏病预测分析和旅游评论倾向性分析。
本书是 十三五 国家重点图书 大数据科学 丛书著作。本书运用辩证发展科研创新法,通过对话、分析、游戏原创性地阐述和研究计算理论和大数据图灵机。全书共7章,主要内容包括:计算模型、可计算性、计算复杂性、图灵机的大数据应用和大数据图灵机等。本书内容深入浅出、通俗易懂,是一本对话式的著作,并将游戏穿插其中,妙趣横生,适合高等院校 计算理论 课程教学使用,也可作为研究院所的科研参考用书。 大数据科学 丛书涉及大数据理论、技术、产业和管理的方方面面,旨在帮助相关领域的学者,特别是产业界了解世界大数据研究和应用的前沿,也可以作为教学之用。
本书较为全面地介绍工业数据采集与边缘服务的相关知识技能,涵盖工业数据采集与边缘服务(中级)的职业技能要求。本书分上、下两篇,共8 章,包括工业数据采集与边缘服务简介、工业数据采集与边缘服务平台介绍、工业数据采集、工业通信协议、边缘侧数据采集、边缘服务通信服务开发部署、边缘服务数据存储服务开发部署、边缘服务接口服务部署应用等。书中还提供10 个实训,读者通过练习和 作实践,可以巩固所学的内容。 本书是“1+X”职业技能等级证书——工业数据采集与边缘服务(中级)的培训认证配套用书,也可以作为工业互联网相关专业实训教材,适合工业互联网从业人员自学使用。