本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
技术是把双刃剑,当我们在积极拥抱新技术的同时,也不能忽视其所带来的风险,比如当今大数据时代个人隐私和安全问题。本书是两位作者结合各自出色的专业知识和丰富的从业经验为大众倾力奉献的一本大数据时代隐私问题的普及读物。书中展示了我们在家庭和工作中的日常活动是如何成为大数据收集的一部分的。同时,列举大量的大数据应用以及安全和隐私相关案例,包括企业如何利用大数据进行营销、执法机构如何利用大数据执法等,也包括不法分子如何利用非法或合法的手段获取数据,如何利用社交网络进行犯罪。针对上述问题,本书也列出了一些工具、技巧用来检查和防范,这在当前很有现实意义。
本书以大数据为研究背景,系统分析了传统数据技术当前存在的问题以及面临的挑战,并对比了当前主流的面向大数据的数据库解决方案,在此基础上阐述了笔者的研究工作:基于MapReduce平台高处处理大数据的OLAP研究。书中反应了当前大规模数据仓库研究的热点和成果,值得大数据研究的人员参考和应用。
本书基于作者近几年来的研究开发成果及应用实践,对物联网大数据技术体系进行了系统归纳,阐述了物联网环境下感知数据的特性、数据模型、事务模型以及调度处理方法等核心概念及关键技术,并对物联网大数据存储、管理、计算与分析的基本概念和关键技术进行了剖析。本书还介绍了自行研发的面向物联网的ChinDB实时感知数据库系统以及针对云计算环境下物联网大数据管理与应用的DeCloud云平台,介绍了它们在智能交通、智能电厂、教育、安全监控等多个行业的应用。书中所有实例,均来自作者所在团队的实际应用,大部分在物联网项目中得到了实践应用。本书对物联网应用的开发以及两化融合、工业4.0环境下的大数据处理分析具有重要参考价值。
部分(第1~4章)为基础和背景部分,主要介绍数据分析挖掘和数据化运营的相关背景、数据化运营中“协调配合”的本质,以及实践中常见分析项目类型的介绍。第二部分(第6~13章)是数据分析挖掘中的具体技巧和案例分享部分,主要介绍实践中常见的分析挖掘技术的实用技巧,并对大量的实践案例进行了全程分享展示。第三部分(第5章,第14~19章)是有关数据分析师的责任、意识、思维的培养和提升的总结和探索,以及一些有效的项目质控制度和经典的方法论介绍。
本书按照处理数据的逻辑顺序和习惯,从数据的整理开始入手。从数据的抽样开始,介绍了传统统计的抽样理论,并进一步探讨大数据样本的代表性问题。并且通过具体案例向读者介绍整个数据探索性分析的主要步骤。然后是数据的展示技术,也就是常说的数据可视化,从数据的类型以及展示的内容不同,分别介绍了单变量和多变量数据的多种图示方法,数据的分布形态、高维数据、空间数据的展示,并且介绍了统计制图的一些基本原则和图形美化的操作。 本书主要面向的应用统计专业硕士、有统计学本科基础的各专业硕士研究生,我们也希望对这方面感兴趣的统计专业高年级的本科生以及其他各个领域的有数据分析需求的学生和从业人员可以阅读参考。
数据湖仓是一个现代化的开放式架构,拥有当今热门的开源数据技术的广度和灵活性。本书从初学者的角度出发,通过对数据湖仓重要概念的剖析,对数据湖仓的相关知识进行深入浅出的讲解。全书共18章,对数据湖仓的基础知识、数据工程、业务价值、数据集成等方面进行深入探讨,同时展望数据架构的演化趋势,使读者能够领会数据湖仓的精髓,*终轻松、*地管理数据湖仓项目。 本书适合数据架构师、业务人员和系统开发人员,以及对数据管理、数据分析感兴趣的读者阅读。
本课程为数据库进阶课程,讲述数据库企业级应用技术。教材共8章内容,另加两个附录。 ~7章为基础部分,第8章为扩展部分;凡标有*号的部分均为扩展内容,可根据实际情况选读、选讲;每章均有完整的学习案例贯穿其中。第1章为关系数据库设计范式,讲述关系数据库中表设计时的三大范式原则;第2章为关系数据库事务,讲述关系数据中进行数据维护、操作时如何使用事务来保证数据的安全性、一致性和完整性;第3章为存储过程开发,讲述存储过程的作用、种类以及开发语法;第4章为触发器应用,讲述触发器的概念、作用、种类、应用以及相关的基本语法;第5章为关系数据库管理,讲述如何实现数据权限控制、数据备份、恢复等;第6章为查询检索 应用,讲述查询检索的 技巧,以及特定关键字的功能用法;第7章为PowerDesigner设计工具,讲述如何运用此工具进行
本书将以导论形式介绍与数据科学相关的各方面知识。全书由“数”开篇,“说”古道今,推陈出“新”,结“语”收章。将会首先从数据的涵义开始谈起,引出对于大数据和数据科学的定义和相关介绍。书中将纵论数据的前世今生,与当前国际国内对数据科学的运用和研究情况。以丰富详实的案例为牵引,结合思想理念和技术手段,介绍随着数据科学的发展而涌现出来的新的科学技术手段,新的研究策略和方法,新的生活方式改变。最后通过一些深刻的对于数据科学未来发展的讨论来引出全书的结语。
本书分为上篇(基础篇)、中篇(编程篇)和下篇(应用篇)三篇,共13章。书中主要内容包括大数据技术概述、大数据处理平台Hadoop、分布式文件系统HDFS、分布式计算框架MapReduce、内存型计算框
本书系统地介绍了AutoCAD 2018中文版绘图软件二维绘图的操作方法。全书主要内容包括AutoCAD 2018中文版的软件安装和软件操作界面及AutoCAD文件的保存方法,基本绘图环境的设置方法及样板图形文件的创建,简单二维图形的绘制方法, 绘图工具的使用方法,二维图形的编辑方法,复杂二维图形的绘制技巧,块、组和设计中心的使用,图形输出方法和图形的信息查询方法等。 本书按照工程中AutoCAD绘图的操作流程加以编排,内容简洁易懂,条理清晰,每章内容后均配置针对性很强的训练图形,本书 还提供了机械零件的整套图纸供训练提高。 本书既可作为高职高专工程类相关专业的教材,又可作为计算机图形处理人员的参考书。
......