本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!
技术是把双刃剑,当我们在积极拥抱新技术的同时,也不能忽视其所带来的风险,比如当今大数据时代个人隐私和安全问题。本书是两位作者结合各自出色的专业知识和丰富的从业经验为大众倾力奉献的一本大数据时代隐私问题的普及读物。书中展示了我们在家庭和工作中的日常活动是如何成为大数据收集的一部分的。同时,列举大量的大数据应用以及安全和隐私相关案例,包括企业如何利用大数据进行营销、执法机构如何利用大数据执法等,也包括不法分子如何利用非法或合法的手段获取数据,如何利用社交网络进行犯罪。针对上述问题,本书也列出了一些工具、技巧用来检查和防范,这在当前很有现实意义。
基于国家973和863相关项目成果,采用汤森路透德温特世界专利创新索引数据库作为统计数据来源,对信息存储领域的专利文献进行检索分析,从存储器件、设备、系统等层面,选取了目前信息存储领域中的多项重要技术,利用专利统计分析的方法对其发展态势进行了研究,特别是对信息存储领域相关专利进行宏观统计分析以及核心专利的具体分析,可以全方位了解信息存储技术的发展历程、专利的国家或地区分布、重要专利权人的竞争态势,为制定相关战略提供决策参考。同时结合华为、中兴、联想、浪潮、IBM、EMC、三星、美光等国内外知名企业的实际案例,从中国本土和全球的布局两个角度分别分析了专利产出、主要竞争者、热点技术和研发重点以及竞争态势,力求找到信息存储技术专利申请对技术产业化与企业发展的作用,供信息存储研发人员、专利工作者和
本书基于作者近几年来的研究开发成果及应用实践,对物联网大数据技术体系进行了系统归纳,阐述了物联网环境下感知数据的特性、数据模型、事务模型以及调度处理方法等核心概念及关键技术,并对物联网大数据存储、管理、计算与分析的基本概念和关键技术进行了剖析。本书还介绍了自行研发的面向物联网的ChinDB实时感知数据库系统以及针对云计算环境下物联网大数据管理与应用的DeCloud云平台,介绍了它们在智能交通、智能电厂、教育、安全监控等多个行业的应用。书中所有实例,均来自作者所在团队的实际应用,大部分在物联网项目中得到了实践应用。本书对物联网应用的开发以及两化融合、工业4.0环境下的大数据处理分析具有重要参考价值。
《数据密集型计算和模型》一书涵盖了数据密集型计算的体系结构、计算模型和编程方法,内容系统全面,着重介绍原理和方法。并配以图片,便于读者理解。 《数据密集型计算和模型》一书前半部分,重点介绍了数据密集型计算的概况,及其与高性能计算和云计算的异同、应用领域以及面临的挑战问题;巨量数据时代的计算机组织体系和技术;内存计算组织体系和技术;等等。后半部分重点介绍了几个常见的计算模型,如MapReduce模型、BSP模型和Dryad模型,并综合介绍了一些专门领域的计算模型,如All-Pairs模型等。 数据密集型计算是大数据时代的标志。《数据密集型计算和模型》一书借鉴了近年来在该领域的研究成果,有一定的创新,其出版较好地弥补了市场空白。
本书以SQL Server分析服务为环境介绍数据仓库和数据挖掘应用技术,包括数据仓库和数据挖掘概述、OLAP和多维数据模型、数据仓库设计和SQL Server数据仓库开发实例、关联分析算法、决策树分类算法、贝叶斯分类算法、神经网络算法、回归分析算法、时间序列分析和聚类算法。本书内容翔实,循序渐进地介绍各个知识点,并提供全面而丰富的教学资源,可作为各类高等院校计算机及相关专业 数据仓库和数据挖掘应用技术 和 SQL Server高级应用 课程的教学用书,也适合计算机应用人员和计算机爱好者参考。
本书结合高职高专的教学特点,较系统地介绍了*基础、*必需掌握的数据库原理相关理论知识,在此基础上,通过大量实例着重讲解SQL Server 2014所提供的各种工具对数据库实施的操作与管理,并辅以某公司人事系统后台数据库设计项目作为实训练习贯穿全书,使得数据库原理的阐述与SQL Server 2014的实际应用融为一体,读者可以通过必要的基本理论指导其对数据库操作的实践,同时也能在实践中加深对数据库原理的理解。为方便读者更好掌握SQL Server 2014的使用,书中采用通俗易懂的方式介绍了有关操作步骤和原理,并辅以大量实例和插图。每章均配有相关内容的项目设计,便于读者进行实际操作和练习。本书共计三大部分,其中*部分(*章至第四章),主要介绍数据库基本概念和理论,第二部分(第五章至第七章),主要介绍SQL Server 2014的安装、管理和数据操作等,第
本书系统地讲述了数据库技术的基本原理和应用。全书共七章,主要内容包括:数据库系统概述、关系模型、SQL语言、关系数据库理论、数据库安全与保护、数据库设计和SQL Server 2000数据库管理系统。本书除介绍数据库技术的基本原理外,还以SQL Server 2000为背景介绍了数据库技术的实现,包括数据库和数据表的维护、查询与统计、视图管理、存储过程和触发器的管理、用户管理、约束和默认管理、数据库的备份和还原、Transact-SQL程序设计等内容,使读者可以充分利用SQL Server 2000平台深刻理解数据库技术的原理,达到理论和实践的紧密结合。 本书内容循序渐进、深入浅出,每一章节都给出了大量的实例。同时,每章后面都附有相应的习题,便于读者巩固所学知识。 本书可作为大学计算机及相关专业的本、专科教材,也可供从事计算机软件工作的科技人员、
《大数据测评》一书介绍了大数据的概念和特征,各国大数据发展的战略、发展趋势及其标准化情况,以及对于软件测试带来的挑战。 在此基础上,《大数据测评》在面向大数据处理框架、大数据基础算法、应用系统、系统安全和隐私泄露的测评技术 等方面展开了分析和讨论。以Hadoop为主线开展大数据测试的探讨。在底层支撑框架层聚焦于单元测试和框架基准测试;在基本算法中涵盖了聚类、分类及其个性化推荐;在应用层,介绍了其性能测试中若干问题,重点阐述数据集的设计与分析。 后,《大数据测评》讨论了大数据的安全和隐私问题,突出介绍由于大数据所引发的新安全问题及其对策。 本书的读者对象是从事大数据或者软件测评的学者、软件工程研究人员、高校研究生、大数据产业人员。
本书全面、系统地介绍了数据仓库的原理、开发和应用技术。主要内容包含数据仓库、联机分析处理和数据挖掘的基本概念、体系结构、开发模型、项目规划、创建过程和应用管理,涵盖了数据仓库的完整生命周期。本书力求从务实的角度出发,揭开笼罩在数据仓库、联机分析处理和数据挖掘上面的神秘面纱,使读者能对数据仓库、联机分析处理和数据挖掘有一个正确认识,以推动数据仓库在我国的健康发展。 本书为授课教师免费提供电子教案,此教案用PowerPoint制作,可以任意修改。需要者可以从中国水利水电出版社网站www.waterpub.com.cn下载,也可与北京万水电子信息有限公司联系,联系电话:(010)82564395。
本书是《实用数据结构基础(第四版)》(陈元春、王中华、张亮、王勇编著,中国铁道出版社出版) 的配套学习指导书。全书内容分为5部分:教学内容指导(包括对主教材第1~10章的知识点分析、典型 习题分析和各章习题解答);自主设计实验指导(对10个自主设计实验的设计思想、算法分析进行了详细 指导);模拟试卷;模拟试卷参考答案;数据结构课程设计报告样例。 本书对数据结构的概念和原理的阐述通俗易懂,例子翔实;习题难易适中,题型丰富;对数据结构 基本运算的分析注重实现的过程。本书以C/C++语言作为算法的描述语言,对于书中的实验和一些重要 的算法均给出了完整的C/C++语言源程序,并全部在Visual C++ 6.0环境下运行通过。 本书适合作为普通高等院校计算机类专业数据结构课程的教学辅导书,也可作为成
本书为普通高等教育“十一五”规划教材,是电力企业信息化系列教材之一。 本书全面深入介绍了数据仓库、联机分析处理(OLAP)和数据挖掘的基本概念、工具及实际应用。全书分成三篇,数据仓库与数据挖掘原理篇的主要内容包括数据仓库的基本概念和结构、创建过程、联机分析处理、数据挖掘的基本概念和方法等;数据仓库与数据挖掘工具篇介绍几个现在市场上主流的数据仓库和数据挖掘工具,包括ETL工具Data Stage、商务智能工具 Congos和数据挖掘工具SAS;数据仓库与数据挖掘应用篇以某电力公司为例介绍一个数据仓库应用系统的建设过程,包括系统需求分析、系统架构设计、数据模型设计、数据库规划、ETL开发等。 本书可作为计算机、信息管理与信息系统等相关专业的学生学习数据仓库、OLAP及数据挖掘技术的实用教程,也可供从事数据仓库、数据挖
本书在介绍大数据发展背景、特点及主要技术层面的基础上,对大数据的数据采集、数据存储、常见计算模式和典型系统工具进行了分析介绍。本书同时对各种典型系统工具进行了讲解,包括大数据查询分析计算及典型工具(HBase、Hive)、批处理计算及典型工具(MapReduce、Spark)、流式计算及典型工具(Storm、Apex、Flink)、事件流及典型工具(Druid)等。本书提供了大量的实例和源代码供读者参考,指导读者快速、无障碍地了解和掌握常见大数据分析工具的使用。本书适合作为计算机及相关专业的教学用书,也可以作为大数据初学者的自学教材和参考手册。
《城市发展的数据逻辑》通过对城市空间数据和非空间数据(如地形数据、建筑物数据、城市环境数据等)反映城市发展现状和历史的数据进行分析、挖掘,论述城市发展的规律和内在逻辑,为城市发展提供了重要的分析工具和科学依据。 《城市发展的数据逻辑》系统、全面地介绍了与城市发展有关的各种空间数据。在此基础上介绍了国内外对城市生产的研究现状,总结了目前国内外城市大数据研究的形成和发展、城市生长模型及其新方法,并借助一些典型案例,介绍应用城市生长技术的流程与方法。《城市发展的数据逻辑》还介绍了GIS、RS、GPS等新技术在城市发展及城市规划中的应用,以及如何使用新的信息技术方法揭示城市发展过程中诸如道路交通、城市建筑、公共设施等城市因子与城市发展的内生联系。 《城市发展的数据逻辑》的读者对象是城市发展领域
大数据为何如此聪明?它是否会chao越人类理性的控制?本书选取人机关系这一切入点作为分析视角,综合以往哲学界做出的相关论述,阐释了新的概念与理论体系下大数据如何在人机交互中构建和涌现智能。 本书以大数据时代作为总的分析背景,进行了 人机关系的内涵分析 人机关系与心物关系问题的关联 大数据的构建与其意向性的负载 大数据的可建构性研究 人机关系视域下的大数据的伦理问题 等方面的论述,在跟随时代热点的同时也对 心物关系 和 他心知 等经典的哲学问题做出了视角较为新颖的回应。本书知识性、系统性较强,可作为科技哲学领域研究的专家学者进一步从事人工智能哲学和技术哲学等领域研究的参考用书。
李琳琳主编的《数据链技术及应用(高等学校十二五规划教材)》是一本全面介绍数据链系统概念、原理、组成、功能、集成及作战应用的教科书。全书共分7章,围绕数据链系统这一核心概念,主要介绍了数据链系统的基本概念、组成及工作原理,详细阐述了数据链系统的信息传输、信息安全、网络管理以及数据链与平台的集成,*后介绍了数据链在作战中的应用。 本书可作为军队院校通信工程和指挥信息系统工程等相关专业的本科生教材,也可作为地方高等院校国防生相关专业教材和各类军队干部培训(轮训)教材,还可以作为国防科技人员和军事爱好者的参考资料。