本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
部分(第1~4章)为基础和背景部分,主要介绍数据分析挖掘和数据化运营的相关背景、数据化运营中“协调配合”的本质,以及实践中常见分析项目类型的介绍。第二部分(第6~13章)是数据分析挖掘中的具体技巧和案例分享部分,主要介绍实践中常见的分析挖掘技术的实用技巧,并对大量的实践案例进行了全程分享展示。第三部分(第5章,第14~19章)是有关数据分析师的责任、意识、思维的培养和提升的总结和探索,以及一些有效的项目质控制度和经典的方法论介绍。
本书是《实用数据结构基础(第四版)》(陈元春、王中华、张亮、王勇编著,中国铁道出版社出版) 的配套学习指导书。全书内容分为5部分:教学内容指导(包括对主教材第1~10章的知识点分析、典型 习题分析和各章习题解答);自主设计实验指导(对10个自主设计实验的设计思想、算法分析进行了详细 指导);模拟试卷;模拟试卷参考答案;数据结构课程设计报告样例。 本书对数据结构的概念和原理的阐述通俗易懂,例子翔实;习题难易适中,题型丰富;对数据结构 基本运算的分析注重实现的过程。本书以C/C++语言作为算法的描述语言,对于书中的实验和一些重要 的算法均给出了完整的C/C++语言源程序,并全部在Visual C++ 6.0环境下运行通过。 本书适合作为普通高等院校计算机类专业数据结构课程的教学辅导书,也可作为成
本书以关系数据库为重点,系统、完整地讲述了当前数据库技术的基本原理和应用实践。取材上力图反映当前数据库技术的发展水平和发展趋势。 本书共分8章。第1章绪论,概述了数据管理的进展、数据模型、数据库管理系统和数据库工程的基本概念。第2至4章讲解了关系数据库的数据模型、数据语言和数据理论,其中对关系数据库的标准语言SQL进行了深入介绍。第5章详细讨论了数据库的安全性、完整性、并发控制和恢复等数据库保护技术,并以一个关系数据库产品为例,说明数据库保护技术在实际产品中是如何实现的。第6章讲述了设计数据库应用系统的方法。重点放在设计关系数据库应用系统上。第7章介绍关系数据库产品的发展过程和5个关系数据库产品实例。第8章数据库技术的新进展介绍了数据库技术的发展过程和新一代数据库系统,包括分布式数据库、并
本书是以高等院校培养应用型人才的发展目标而编写的,介绍了数据库系统原理与应用以及数据库系统开发技术。全书共分为十章,主要内容包括:数据库系统概述、关系数据库系统理论基础、SQL Server 2000的使用,数据库安全及维护、数据库系统设计、数据库访问技术介绍、使用S#和ADO.NET操作数据库、使用C#开发Windows数据库应用程序、基于C#和ASP.NET的Web数据库应用程序、数据库新技术概述。本书在讲述理论的同时与SQL Server2000有机结合,使理论与实践同步,同时介绍了使用C#和ASP.NET开发数据库应用程序的技术。 本书内容丰富、结构合理、实用性强、理论叙述严谨、庆用能力培养目标明确。读者学完本门课程后,能够具备数据库应用系统的独立开发能力。书中的开发实例均是作者的实际研发项目,具有较高的参考价值和实用价值。 本书可作为各大学、专科院校
随着网络的广泛应用,数据发布成为各领域发布数据、获取数据的一个重要手段。随着知识发现与机器学习在诸多领域的深度应用和广度拓展,隐私保护数据挖掘已经成为知识发现领域的一个核心问题,基于数据发布的隐私保护数据挖掘已经成为涉及到每个国家、每位公民的首要问题。刘英华编*的这本《基于数据发布的隐私保护模型研究》基于安全多方和加密技术,设计出了全新的完全同态加密算法,并在此基础上提出FHE-DK-MEANS模型和FHE-DBIRCH模型。
《MySQL是怎样使用的:快速入门MySQL》采用通俗易懂的表达方式,对如何使用MySQL进行了详细的介绍。 《MySQL是怎样使用的:快速入门MySQL》完全从零基础用户的角度出发,依照用户认知习惯,从MySQL的安装开始,介绍了MySQL的服务器程序和客户端程序的使用、MySQL的数据类型、数据库和表的基本操作、列的属性、MySQL中的表达式和函数、简单和复杂的增删改查语句等入门知识,还介绍了视图、存储程序、备份与恢复、用户与权限管理等高级概念以及使用Java语言连接MySQL服务器等知识。 《MySQL是怎样使用的:快速入门MySQL》较好地契合了MySQL初学人员的学习曲线,内容深入浅出,通俗易懂,可帮助初学人员迅速入门MySQL。
本书共12章,以信息的采集 、传输和处理为主线,主要包括计算机数据采集与 分析技术概述、数据采集信号分析基础、传感器技术、模/数转换器、数/模 转换器、数据采集系统常用电路、数据采集系统抗干扰技术、总线接口技术 、输入/输出接口技术、数据分析与处理、使用LabVIEW进行数据采集与分析 等内容。同时,《数据采集与分析技术(第二版)》在后以数字式血压仪为 例详细介绍了数据采集设备的软、硬件开发。《数据采集与分析技术(第二 版)》的例子均来源于工程实践, 简明实用,为读者提高动手实践能力提供 了良好的范例。 《数据采集与分析技术(第二版)》主要面向从事计算机数据采集与分析 的工程人员和希望学习相关技术的大专院校学生。
20世纪90年代兴起的数据仓库和数据挖掘代表着信息序化和信息分析技术的重大进展。两者的结合,已成为人类处理和分析海量信息的有力武器。 本书在论述数据仓库和数据挖掘技术基本概念的基础上,系统和深入地剖析了数据仓库的模型,以数据仓库为应用平台的联机分析处理(OLAP)技术,以证券行业为对象的数据仓库的开发实例,数据库挖掘、文本挖掘、Web挖掘、数据挖掘软件,以及数据挖掘的应用,尤其在竞争情报系统和客户关系管理中的应用,从而为了解和掌握数据仓库和数据挖掘技术提供了一个知识门户。 本书可供我国企业界、情报界、咨询界、教育界的信息分析、竞争情报、信息管理、知识管理、战略管理和软科学研究从业者的专业进修,以及高等院校师生教学和参考之用。
本书第1版列为*“面向21世纪课程教材”。第2版作了较大的修改和补充,增加了关系逻辑、递归SQL、对象联系图、UML的类图、ODMG标准、ODBC和XML等内容。这次第3版被*列为普通高等教育“十一五”*规划教材,对内容又作了修订和充实。 本书详细介绍数据库系统的基本原理、方法和发展趋势。全书分为上、下两篇。上篇为基础篇,介绍传统的数据库技术,内容包括:数据库概论、关系模型和关系运算理论、关系数据库语言SQL、关系数据库的规范化设计、数据库设计与ER模型、数据库的存储结构和系统实现技术。下篇为发展篇,介绍数据库技术的发展,内容包括:对象数据库系统、分布式数据库系统、ODBC技术、XML技术和现代信息集成技术。 本书是作者长期从事数据库教学和科研活动所获成果的结晶。全书内容丰富,叙述清楚、严谨,每章后面均有适量的习题,适
本书系统地介绍了决策分析的相关理论与方法,并对决策支持系统及其实现技术进行了描述。主要内容包括: 决策支持系统的概念、结构、分析、设计、开发及实现等相关知识: 各种决策类型的理论与方法,如*型决策、模糊型决策、多目标决策与多属性决策、群体决策、智能决策等。 本书内容充实,重点突出,特色鲜明,适合作为高等学校管理类相关专业本科及研究生教材,同时也可供企业领导以及广大对决策科学感兴趣的读者阅读。
从数据中心机房监控系统的自定制技术、监控系统可信方法等方面,综述国内外研究进展,确定研究内容。第1章,主要讲述智能绿色数据中心机房监控系统的内涵;第2章,主要讲述基于大批量定制的绿色数据中心机房的自定制机理与方法;第3章,主要讲述绿色数据中心机房的用户身份认证、完整性等可信方法;第4章,给出了绿色数据中心机房智能监控技术应用,研制绿色智能机房监控系统,在该绿色智能机房监控系统架构上实施用户自定制技术、可信增强技术模块功能,并测试各项技术及整个系统的应用效果。 本书是作者长期从事数据中心机房监控系统,特别是数据中心机房监控系统自定制、可信性研究工作的方法和应用成果的总结,本书所研究技术应用到实际数据中心机房运行,这些实践工作对本书的形成具有十分重要的意义。
本书是面对当前科学可视化、信息可视化、可视分析研究和应用的新形势,专门为计算机、数据处理、视觉设计、统计、数学、航空航天、建筑、遥感影像等专业本科生开设数据可视化课程而编写的一本教材。全书划分为三篇:基础篇、数据篇和应用篇。其中,基础篇从人、数据、可视化流程等三个层面阐述数据可视化的基础理论和概念;数据篇则针对实际应用中遇到的不同类型的数据,包括时空数据、地理信息数据、高维非空间数据、层次和网络数据介绍相应的可视化方法;应用篇着重介绍可视化综合应用及实用系统。为了便于学习,每章后都附有习题和参考文献。 本书的特点是内容完整,叙述简明,重点突出;以数据类型为导向,以行业应用为目标。作者专门收集和整理了相关的课程教案、典型数据、精彩案例、可视化作品、课程附属视频和动画材
本书系统讲解数据库的基本概念,数据库设计的基本方法和数据库应用开发的基本技术,并介绍了数据库技术新进展。本书强调理论与实践,技术与应用的结合。内容系统全面,深入浅出。 本书可作为高等学校计算机基础教学课程中数据库系统的教材,也可以供数据库应用部门,从事计算机应用系统设计和开发部门的工程技术人员参考。
本书主要包括三部分内容,即误差和数据处理基础、试验设计方法与应用和计算机数据处理软件简介。从误差理论入手,分别介绍测量值与误差、偶然误差的分布、误差传递等误差理论中的内容,介绍统计检验、方差分析、回归分析和聚类分析等数据处理方法与应用,介绍提高分析化学准确度的方法及质量控制方法,介绍正交试验设计、多因素序贯试验设计、*化区组和拉丁方设计、析因设计、响应面设计方法与应用,后一章以较大篇幅对现时流行的大型统计软件之一SPSS(Statistical Product and Service Solutions)进行简要介绍,书末附有习题及常用的统计数表。 本书着重介绍基本概念和基本理论,并在此基础上结合专业特点,介绍了各种统计方法在化学化工、医药、环境检测、矿物加工等多方面的应用,本书把误差与数据处理、质量控制和实验设计作为重点。
本书着力于介绍数据挖掘基础知识、基本原理、常用算法,主要内容包括数据挖掘概述、数据的描述与可视化、数据的采集和预处理、数据的归约、关联规则挖掘、分类与预测、 非线性预测模型、聚类分析、深度学习简介、使用 Weka 进行数据挖掘。本书通俗易懂,注重基础知识、基本原理和基本方法,注重启发和引申,以培养学生独立思考和独立发现的能力。本书适合作为数据科学与大数据、信息管理、统计等专业的本科层次基础课教材,也可作为相关专业研究生层次的参考用书。
本全书内容主要包括11章和三个附录,其中11章又分为两大部分,部分是一些基础的介绍性的内容,章和第二章完整地讲述了元数据的意义以及一些基本的概念,第三章则从总体上分明绍了当前主要的元数据标准。第二部分则根据无数据的仓储项目生命周期的各个阶段,分别在第四章到第九章介绍了元数据的工具的评估,元数据仓储项目的组织和人员的配置,如何制定元数据的项目计划,元数据体系的结构的设计,如何通过元数据来提高数据的质量以及元模型的构造,此外,第十章还详细地介绍了开发周期的各个阶段该交付的产品以及取得的阶段性的成果,后第十一章展望了元数据的未来发展的趋势。
本书重点介绍数据质量管理与安全管理的理论及应用。首先通过数据管理现况和问题的分析,提出数据质量管理的步必须是将各种来源的数据标准化,具有统一的数据格式和规则。书稿中强调了提高数据质量不仅可提高信息系统的质量,还可提高经营活动的质量。需要制定质量管理计划或执行具体的质量管理活动。定义了数据质量的准确性、一致性、可用性、可达性、及时性、安全性这6个标准以及对应的管理流程,划分了5个能力成熟度的等级,界定了从管理者到执行者等各个质量管理活动和责任。提出多项数据质量管理主要技术和各国实用案例,还进一步在Orange数据库中实践了数据质量诊断流程。书稿后半部针对日益增长的数据库安全性的需求,提出了安全管理系统构建、访问控制,数据伪装等具体可行的技术手段,后还将数据安全技术推广到大数据的应用场景。
本书采用图解形式对“大数据”这一概念进行了全新解读,将大数据从一个IT术语变成了人人能读懂的大众词汇。本书从大数据的“前世今生”讲起,通过列举各行各业应用大数据的案例,全面解读了大数据和个人的关系、如何利用大数据创业、大数据中隐藏了多少价值、大数据给我们带来了哪些冲击和变革、如何利用大数据进行精准营销等读者十分关心的热点问题。本书图文并茂,读者利用零散时间,就能迅速了解大数据知识。 本书适合企业管理者、创业者、投资者、高校相关专业师生等想运用大数据改变未来生活的人士阅读。
商业智能是将企事业单位积累的数据转化为知识,帮助企事业单位做出科学决策的工具。蔡颖、鲍立威编著的《商业智能原理与应用》以“商业智能”应用为主线,全面系统地介绍了商业智能的基本概念、方法和技术,克服了以“数据挖掘” 技术为丰线的局限性,并以MS SQLServer作为数据仓库管理平台,以SQL Server Business Intelligence DeveloprnentVisualStudio作为商业智能开发平台,进行了丰富的案例演示。《商业智能原理与应用》可作为高等院校高年级本科生教材,也可作为MBA教材以及盯相关专业人员、市场营销人员、管理决策支持等实际经济管理领域实务工作者的参考用书。
你是否有过这样的经历:在项目的后一刻突然被要求在图中修改或添加某个数据点?这时为了完成项目,你将不得不冒着降低准确性的风险,然而,在Tableau中不会发生这种情况。Tableau是一个革命性的工具包,利用它可以简单、高效地创建高质量的数据可视化图形。本书通过大量的具体案例,详细讲解了如何利用Tableau软件进行数据可视化分析,包括基本使用方法、具体操作步骤、实现原理及一些实用技巧等,为快速掌握Tableau软件提供了翔实指导。 本书共9章,第1章讲解如何连接不同数据源,包括文本、Excel、Access数据库文件及服务器上的数据;第2~5章循序渐进讲解各种图形的创建方法,包括单变量图、双变量图、多变量图和地图;第7~8章详细讲解了如何自定义图中各个元素以及如何将做好的可视化图形打包分享;第6章和第9章主要介绍Tableau的高级功能,包括自