本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
技术是把双刃剑,当我们在积极拥抱新技术的同时,也不能忽视其所带来的风险,比如当今大数据时代个人隐私和安全问题。本书是两位作者结合各自出色的专业知识和丰富的从业经验为大众倾力奉献的一本大数据时代隐私问题的普及读物。书中展示了我们在家庭和工作中的日常活动是如何成为大数据收集的一部分的。同时,列举大量的大数据应用以及安全和隐私相关案例,包括企业如何利用大数据进行营销、执法机构如何利用大数据执法等,也包括不法分子如何利用非法或合法的手段获取数据,如何利用社交网络进行犯罪。针对上述问题,本书也列出了一些工具、技巧用来检查和防范,这在当前很有现实意义。
本书基于作者近几年来的研究开发成果及应用实践,对物联网大数据技术体系进行了系统归纳,阐述了物联网环境下感知数据的特性、数据模型、事务模型以及调度处理方法等核心概念及关键技术,并对物联网大数据存储、管理、计算与分析的基本概念和关键技术进行了剖析。本书还介绍了自行研发的面向物联网的ChinDB实时感知数据库系统以及针对云计算环境下物联网大数据管理与应用的DeCloud云平台,介绍了它们在智能交通、智能电厂、教育、安全监控等多个行业的应用。书中所有实例,均来自作者所在团队的实际应用,大部分在物联网项目中得到了实践应用。本书对物联网应用的开发以及两化融合、工业4.0环境下的大数据处理分析具有重要参考价值。
部分(第1~4章)为基础和背景部分,主要介绍数据分析挖掘和数据化运营的相关背景、数据化运营中“协调配合”的本质,以及实践中常见分析项目类型的介绍。第二部分(第6~13章)是数据分析挖掘中的具体技巧和案例分享部分,主要介绍实践中常见的分析挖掘技术的实用技巧,并对大量的实践案例进行了全程分享展示。第三部分(第5章,第14~19章)是有关数据分析师的责任、意识、思维的培养和提升的总结和探索,以及一些有效的项目质控制度和经典的方法论介绍。
该书基于通用的Excel、 SPSS工具, 加上必知必会的数据分析概念, 以图文并茂、 理论与实操相结合的方式, 按照CDA人才培养考核要求进行编写。全书分为6章, 分别为数据分析概述、 数据收集与导入、 数据的清洗与预处理、 数据可视化呈现、 基础数据分析、 综合分析。本书适合数据分析零基础群体读者阅读, 也可供大学生、 初入数据分析职场人员、 参与CDA考试的人员学习使用。
天津滨海迅腾科技集团有限公司编著的《大数据高可用环境搭建与运维(企业级 人才培养解决方案十三五规划教材)》主要涉及11个项目,即大数据分布式集群、分布式集群基础配置、ZooKeeper分布式协调系统、Hadoop高可用、Hive分布式数据仓库工具、HBase分布式数据库、大数据协作框架、Linux自动化部署、Ambari大数据环境搭建利器、企业级Hadoop调优方案、企业级Hadoop安全方案,严格按照生产环境中的操作流程对知识体系进行编排。书中介绍的环境搭建并不限于虚拟机,对于有条件的公司和学校,参照书中介绍的搭建过程,同样可以将大数据平台搭建在多台实体计算机上,以便 加接近于大数据真实的运行环境。与此同时,为了方便读者学习,本书还配有教材中所用到的全部软件以及安装包和工具,可以节省读者查找下载相关工具的时间。
任昱衡、姜斌、李倩星、米晓飞著的《数据挖掘(你必须知道的32个经典案例第2版)》是为广大数据分析师量身 的入门读物,它旨在帮助读者站在大数据时代的制高点。数据分析处于统计学、计算机信息科学、运筹学、数据库等多个领域的交叉地带,大数据时代的到来大大丰富了数据分析的内涵,数据分析师的职责与以往相比发生了巨大的改变。 本书全面介绍了经典数据分析、模式识别、机器学习、深度学习、数据挖掘、商务智能等多个领域的数据分析算法,将大数据时代的数据分析热点技术一网打尽。本书为每个数据分析算法都搭配了一个经典案例,并按照由易到难的原则构建知识框架,充分照顾了不同水平读者的阅读习惯。 通过阅读本书,读者将对大数据时代下的数据分析有一个全面的认识。无论是入门级的数据分析员还是有一定基础的数据分
刘鹏主编的《大数据》是 大多数高校采用的知名教材《云计算》(1~3版)的姊妹篇,是中国大数据专家委员会刘鹏教授联合 多位专家历时两年的心血之作。大数据领域一直缺乏一本 教材,希望本书能够填补空白。本书系统地介绍了大数据的理论知识和实战应用,包括大数据采集与预处理、数据挖掘算法与工具、深度学习以及大数据可视化等,并深度剖析了大数据在互联网、商业和典型行业的应用。刘鹏教授创办的网站中国大数据(thebigdata.cn)、中国云计算(chinacloud.cn)和微信公众号刘鹏看未来(lpoutlook)将免费提供本书配套PPT和其他资料。本书配套的大数据实验体系已经在郑州大学等高校成功应用。 “让学习变得轻松”是本书的初衷。本书适合作为相关专业本科和研究生教材。高职高专学校也可以选用部分内容开展教学。本书也很适合作为大数据研发人
本书系统介绍大数据技术的原理、数据挖掘与应用,主要内容包括基本概念、数据收集、数据存储、数据处理、大数据可视化、信息检索、数据挖掘和效能评估。本书以简单易懂的语言、生动有趣的实例和图形展示知识点,将概念、原理与应用融会贯通,并对大数据工具软件进行了细致的梳理。
集Python、Excel、数据分析为一体是本书的一大特色。本书围绕整个数据分析的常规流程:工具熟悉-获取数据-数据熟悉-数据处理-数据分析-分析结果进行Excel 和Python 对比实现,告诉你每一个过程中都会用到什么?过程与过程之间有什么联系。这样一本书既可以作为系统学习数据分析流程操作的说明书,也可以作为一本数据分析师案头 的实操工具书,随时备查。本书通过对比Excel 功能操作去学习Python 的实现代码,而不是直接上来就学习Python代码,大大降低了学习门槛,消除了读者对代码的恐惧心理。适合刚入行的数据分析师,也适合对Excel 比较熟练的数据分析师,或从事其他岗位想提高工作效率的职场人。
本书为SAGE“掌握商科研究方法系列丛书”之一,旨在为研究人员使用所选数据进行收集或分析提供深入和实用的方法指导。本书提供了一种数字数据收集方法,该方法由跟踪和拖网组成,可用于收集商业、管理和组织研究领域的质性数据。本书对如何在自己的研究中使用这种方法给出了实用的指导和见解,为那些在完成论文时选择使用二手数据的商业和管理研究者提供了宝贵的支持。本书内容专业实用、行文简洁流畅,具有一定的学术价值和可读性,补充了商科领域数字方法论的主题研究,为商科学生和研究者提供了宝贵的方法指导。与同类书相比,具有独特的学术侧重点和出版价值。
天津滨海迅腾科技集团有限公司编著的《大数据高可用环境搭建与运维(企业级 人才培养解决方案十三五规划教材)》主要涉及11个项目,即大数据分布式集群、分布式集群基础配置、ZooKeeper分布式协调系统、Hadoop高可用、Hive分布式数据仓库工具、HBase分布式数据库、大数据协作框架、Linux自动化部署、Ambari大数据环境搭建利器、企业级Hadoop调优方案、企业级Hadoop安全方案,严格按照生产环境中的操作流程对知识体系进行编排。书中介绍的环境搭建并不限于虚拟机,对于有条件的公司和学校,参照书中介绍的搭建过程,同样可以将大数据平台搭建在多台实体计算机上,以便 加接近于大数据真实的运行环境。与此同时,为了方便读者学习,本书还配有教材中所用到的全部软件以及安装包和工具,可以节省读者查找下载相关工具的时间。
本书按照数据库应用(VFP)课程标准组织编写内容,每一个模块包含教学目标、目标双向细目表、典型题解及每一个任务的相应练习。题型有填空、选择、判断、连线、填表、填图和简答。附有5套综合练习,部分题目选自近年来的高职高考题,有较强的代表性。既可作为《数据库基础及应用》教材的同步练习,也可以作为强化数据库学习的好帮手。