本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
本书是为广大数据分析师量身定制的入门读物,它旨在帮助读者站在大数据时代的制高点。数据分析处于统计学、计算机信息科学、运筹学、数据库等多个领域的交叉地带,大数据时代的到来大大丰富了数据分析的内涵,数据分析师的职责与以往相比发生了巨大的改变。本书全面介绍了经典数据分析、模式识别、机器学习、深度学习、数据挖掘、商务智能等多个领域的数据分析算法,将大数据时代的数据分析热点技术一网打尽。本书为每个数据分析算法都搭配了一个经典案例,并按照由易到难的原则构建知识框架,充分照顾了不同水平读者的阅读习惯。通过阅读本书,读者将对大数据时代下的数据分析有一个全面的认识。无论是入门级的数据分析员还是有一定基础的数据分析师,都能通过本书完善、加深对数据分析的认识。
本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
本书通过选购笔记本电脑的案例引入数据包络分析(dataenvelopmentanalysis,DEA)的基本概念和模型,并运用简单的EXCEL模型让读者更易理解和运用DEA。本书着重阐述如何将DEA作为一种运营分析工具,进行绩效评估,找出基准标杆。探讨的主题包括:平衡的基准,昀佳实践,相对效率的概念及绩效提升。特别地,本书探讨的数据分析方法能够帮助一个组织重新审视它对生产效率高低的已有观点是否合理,并为组织不断改进提供指导。本书是市面上唯一本不要求读者具备线性规划和线性代数知识,就可以熟练应用DEA方法的DEA方法指导用书。
在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!
本书基于作者近几年来的研究开发成果及应用实践,对物联网大数据技术体系进行了系统归纳,阐述了物联网环境下感知数据的特性、数据模型、事务模型以及调度处理方法等核心概念及关键技术,并对物联网大数据存储、管理、计算与分析的基本概念和关键技术进行了剖析。本书还介绍了自行研发的面向物联网的ChinDB实时感知数据库系统以及针对云计算环境下物联网大数据管理与应用的DeCloud云平台,介绍了它们在智能交通、智能电厂、教育、安全监控等多个行业的应用。书中所有实例,均来自作者所在团队的实际应用,大部分在物联网项目中得到了实践应用。本书对物联网应用的开发以及两化融合、工业4.0环境下的大数据处理分析具有重要参考价值。
基于国家973和863相关项目成果,采用汤森路透德温特世界专利创新索引数据库作为统计数据来源,对信息存储领域的专利文献进行检索分析,从存储器件、设备、系统等层面,选取了目前信息存储领域中的多项重要技术,利用专利统计分析的方法对其发展态势进行了研究,特别是对信息存储领域相关专利进行宏观统计分析以及核心专利的具体分析,可以全方位了解信息存储技术的发展历程、专利的国家或地区分布、重要专利权人的竞争态势,为制定相关战略提供决策参考。同时结合华为、中兴、联想、浪潮、IBM、EMC、三星、美光等国内外知名企业的实际案例,从中国本土和全球的布局两个角度分别分析了专利产出、主要竞争者、热点技术和研发重点以及竞争态势,力求找到信息存储技术专利申请对技术产业化与企业发展的作用,供信息存储研发人员、专利工作者和
本书是《实用数据结构基础(第四版)》(陈元春、王中华、张亮、王勇编著,中国铁道出版社出版) 的配套学习指导书。全书内容分为5部分:教学内容指导(包括对主教材第1~10章的知识点分析、典型 习题分析和各章习题解答);自主设计实验指导(对10个自主设计实验的设计思想、算法分析进行了详细 指导);模拟试卷;模拟试卷参考答案;数据结构课程设计报告样例。 本书对数据结构的概念和原理的阐述通俗易懂,例子翔实;习题难易适中,题型丰富;对数据结构 基本运算的分析注重实现的过程。本书以C/C++语言作为算法的描述语言,对于书中的实验和一些重要 的算法均给出了完整的C/C++语言源程序,并全部在Visual C++ 6.0环境下运行通过。 本书适合作为普通高等院校计算机类专业数据结构课程的教学辅导书,也可作为成
本书共12章,以信息的采集 、传输和处理为主线,主要包括计算机数据采集与 分析技术概述、数据采集信号分析基础、传感器技术、模/数转换器、数/模 转换器、数据采集系统常用电路、数据采集系统抗干扰技术、总线接口技术 、输入/输出接口技术、数据分析与处理、使用LabVIEW进行数据采集与分析 等内容。同时,《数据采集与分析技术(第二版)》在后以数字式血压仪为 例详细介绍了数据采集设备的软、硬件开发。《数据采集与分析技术(第二 版)》的例子均来源于工程实践, 简明实用,为读者提高动手实践能力提供 了良好的范例。 《数据采集与分析技术(第二版)》主要面向从事计算机数据采集与分析 的工程人员和希望学习相关技术的大专院校学生。
20世纪90年代兴起的数据仓库和数据挖掘代表着信息序化和信息分析技术的重大进展。两者的结合,已成为人类处理和分析海量信息的有力武器。 本书在论述数据仓库和数据挖掘技术基本概念的基础上,系统和深入地剖析了数据仓库的模型,以数据仓库为应用平台的联机分析处理(OLAP)技术,以证券行业为对象的数据仓库的开发实例,数据库挖掘、文本挖掘、Web挖掘、数据挖掘软件,以及数据挖掘的应用,尤其在竞争情报系统和客户关系管理中的应用,从而为了解和掌握数据仓库和数据挖掘技术提供了一个知识门户。 本书可供我国企业界、情报界、咨询界、教育界的信息分析、竞争情报、信息管理、知识管理、战略管理和软科学研究从业者的专业进修,以及高等院校师生教学和参考之用。
本书是普通高等教育“十一五”国家规划教材。全书共分10章 ,内容包括:数据结构的概念,几种基本的线性结构(如线性表),栈和队列,串,几种非线性结构(如多维数组和广义表),树,图,常用的数据处理枝术(如排序),查找,文件的存储结构和组织方法等。在每一章中都收集了难度各异的习题和例题,全书采用C语言作为算法描述语言,并有详细的注释,书中全部程序均上机在TURBOC2.0环境下进行验证并调试通过,同时给发出部分程序的运行结果。各章中的“简单应用举例”,既是本章算法的综合应用,也可作为本章实训内容和课程设计的综合练习,全书有很强的实用性和可操作性。 本书可作为全日制高等院校计算机应用专业、微电子和信息工程专业、计算机信息管理和经济信息管理类专业普通本科学生的专业基础课教材,也可以作为上述专业高职高
从数据中心机房监控系统的自定制技术、监控系统可信方法等方面,综述国内外研究进展,确定研究内容。第1章,主要讲述智能绿色数据中心机房监控系统的内涵;第2章,主要讲述基于大批量定制的绿色数据中心机房的自定制机理与方法;第3章,主要讲述绿色数据中心机房的用户身份认证、完整性等可信方法;第4章,给出了绿色数据中心机房智能监控技术应用,研制绿色智能机房监控系统,在该绿色智能机房监控系统架构上实施用户自定制技术、可信增强技术模块功能,并测试各项技术及整个系统的应用效果。 本书是作者长期从事数据中心机房监控系统,特别是数据中心机房监控系统自定制、可信性研究工作的方法和应用成果的总结,本书所研究技术应用到实际数据中心机房运行,这些实践工作对本书的形成具有十分重要的意义。
科技的进步,特别是信息产业的发展,把整个社会带入一个崭新的信息时代。随着计算机应用的普及和数据库技术的不断发展,数据仓库与数据挖掘技术的应用领域越来越广泛。 《数据仓库与数据挖掘》第1章介绍数据仓库、数据挖掘的一般知识和应用领域。第2~8章介绍数据仓库和数据挖掘的理论和技术,其中第2、3章侧重数据仓库,重点阐述了数据仓库的架构、olap等内容,第4~8章侧重数据挖掘,重点阐述了关联规则、粗糙集、决策树、聚类分析和兴趣度量等内容。第9章给出了数据仓库与数据挖掘方面的应用案例。 《数据仓库与数据挖掘》是为软件工程硕士量身定做的教材,也可作为计算机专业、信息类专业、管理类专业相关课程的教材和教学参考书。
由周跃南、蔡学军主编的《云计算技术实训教程 (云计算技术与应用课程群高等职业教育十三五规划教材)》根据职业教育的教学特点和培养目标,依托长城云教室和云实训平台,采用 实训任务驱动式教程 方式编写,介绍了云计算基础技能,也补充了一些相关的云计算知识,做到以技能训练为主,理论与实践相结合。全书共分八大任务,包括资源管理、虚拟机管理、网络管理、存储管理、安全管理、用户管理等方面的内容。 本书是中职云计算技术与应用专业及相关专业的云计算技术技能训练教材,也适合高职云计算技术与应用专业使用,还可以作为相关技术人员的培训教材。
全书共分为六章:*章为绪论,介绍了大数据时代隐私内涵的构成要素以及发展变迁历史,并从技术层面、社会层面、个人层面列举了大数据环境下隐私安全的表现形式,总结了当前个人隐私被侵害的类型以及呈现的特征;第二章为隐私泄露风险评估与度量方法,针对常用的隐私保护方法,详细介绍了当前隐私量化模型与度量标准的相关研究,并分析了主流的隐私度量方法的性能优劣以及评价指标;第三章为位置服务中隐私保护技术,并介绍了P2P结构与独立架构两种模式下位置隐私保护技术方案。第四章为深度学习训练数据集隐私保护技术,提出了两种差分?
本书在介绍了数据挖掘原理的基础上,从实用的角度出发,详细地介绍了数据挖掘的经典算法。本书是国内本对数据挖掘技术基础算法进行详细描述的实用性教材。 第1章从不同的角度对数据挖掘进行了介绍,第2章介绍了数据仓库技术的概念并给出了数据立方体的理论基础。第3章讲述了数据挖掘的数据预处理所涉及到的概念及算法。第4章-第8章详细介绍了数据挖掘的经典领域的算法,其中第6章简单介绍了数据可视化的内容。第9章介绍了开放的数据挖掘平台。 本书的使用对象是在校高年级的本科生、研究生及各个领域的高级软件开发人员。
这是一本讨论时下热门话题 大数据的书,生动活泼地阐释了晦涩艰深的统计学原理,条理清晰地告诉读者如何从数据中获取智慧。 全书分为8章,第1章概述了大数据时代统计学面临的机遇和挑战。第2、3章讲述了统计学在思想方法及数据表述上和大数据处理方法的异同;第4章介绍了对统计学影响深远的正态分布;第5章探讨了大数据时代统计推断是否失效;第6章重点从统计学视角讲述了大数据时代*热门的变量间的 相关性 问题;第7章以一种比较开放的态度讨论统计学中一些有意思又实用的话题;第8章探讨大数据能够给企业、用户及整个产业和社会带来什么价值。 拥有本书,不仅可以使读者感受数字的美感和哲学的智慧,还能够使读者掌握思辨的洞察力。更重要的是,拥有本书就相当于拥有了一种武器,数据驱动的思维模式将会使读者在生活、工作中受益匪浅。
本书详细介绍了数据库原理、方法及其应用开发技术。全书共分8章,分别介绍了关系数据库标准语言——SQL,数据模型,数据库系统的模式结构,关系模型与关系代数运算,关系模式的规范化设计理论,数据库的安全与保护,RAID技术,数据库设计的步骤和数据库实施,数据库应用系统的体系结构,Microsoft SQL Server 2000的安全管理、完整性策略、恢复技术、并发控制方法、触发器和存储过程,一个基于Ddphi 6.0/SQL Server 2000的C/S结构的简单数据库应用系统开发过程等内容。书中还介绍了数据库技术的新发展,如面向对象数据库,分布式数据库,数据仓库与数据挖掘技术等。 本书配有较多的例题和适量的习题,随书光盘包括书中所有SQL例题和分别用Delphi和Visual Basic开发的数据库应用系统实例源程序和安装程序,并赠送PPT课件—套,不仅有利于教师进行多媒体教学,
《先进制造理论研究与工程技术系列:误差理论与数据处理》系统地介绍测量误差的基本理论与测量数据处理的基本方法,包括测量误差的基本概念、特征规律性、表述方法及传递计算,一般测量问题中的数据处理方法,不确定度的估计与合成,小二乘法和回归分析。 《误差理论与数据处理》为高等工科院校机械、材料、精密仪器等专业本科生教材,也可供相关专业工程技术人员参考。
《数据建模与DB设计》重点介绍数据建模与数据库设计的理论及应用。从数据模型的发展历程及其必要性引入,基于作者在研究和项目实践中积累的经验,让读者理解数据建模是业务负责人与数据设计者之间沟通的工具,数据模型决定数据处理性能与数据管理便利性。书中首先将数据建模划分为概念建模、逻辑建模、物理建模以及后的数据库设计四个阶段,明确了导出实体、设定实体的重要关系、设定键的数据建模流程。为了提高数据整合性和业务流程性能,先后提出了范式化和反范式化过程,在构建容易理解的数据结构的同时兼顾数据库的访问成本,寻找盈亏平衡点。《数据建模与DB设计》无论对数据分析设计领域的初学者还是实际业务的实践者,都很有启发和指导作用。
本书采用了众多流行的数据挖掘算法,如利用K-means算法进行信息聚类和网页自动抽取,利用贝叶斯分类器实现信息过滤与分类,将知识组织与网站优化有机地结合起来,使得主题、目录组织的思想融合贯通在智能网站设计当中。全书共分6章,主要介绍了网络日志的数据来源、类型及其预处理技术;用户信息行为,包括网络用户行为的构成因素、分类,信息行为模型;用户行为数据的提取和分析,用户个性化知识服务需求的影响因素;网站优化算法的设计;智能技术在网站开发中的应用;机器学习的实现原理与训练模型,利用贝叶斯分类算法对垃圾信息进行自动过滤。后,还对网站导航优化效果进行了调试与展示,并给出了实现的核心代码。 本书涉及数据挖掘、计算机编程、知识组织等多门学科的知识,理论性强。全书内容深入浅出,既有较深的理论分析,
本书是面对当前科学可视化、信息可视化、可视分析研究和应用的新形势,专门为计算机、数据处理、视觉设计、统计、数学、航空航天、建筑、遥感影像等专业本科生开设数据可视化课程而编写的一本教材。全书划分为三篇:基础篇、数据篇和应用篇。其中,基础篇从人、数据、可视化流程等三个层面阐述数据可视化的基础理论和概念;数据篇则针对实际应用中遇到的不同类型的数据,包括时空数据、地理信息数据、高维非空间数据、层次和网络数据介绍相应的可视化方法;应用篇着重介绍可视化综合应用及实用系统。为了便于学习,每章后都附有习题和参考文献。 本书的特点是内容完整,叙述简明,重点突出;以数据类型为导向,以行业应用为目标。作者专门收集和整理了相关的课程教案、典型数据、精彩案例、可视化作品、课程附属视频和动画材
本书全面、系统地介绍了数据仓库的原理、开发和应用技术。主要内容包含数据仓库、联机分析处理和数据挖掘的基本概念、体系结构、开发模型、项目规划、创建过程和应用管理,涵盖了数据仓库的完整生命周期。本书力求从务实的角度出发,揭开笼罩在数据仓库、联机分析处理和数据挖掘上面的神秘面纱,使读者能对数据仓库、联机分析处理和数据挖掘有一个正确认识,以推动数据仓库在我国的健康发展。 本书为授课教师免费提供电子教案,此教案用PowerPoint制作,可以任意修改。需要者可以从中国水利水电出版社网站www.waterpub.com.cn下载,也可与北京万水电子信息有限公司联系,联系电话:(010)82564395。