本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
本书是《实用数据结构基础(第四版)》(陈元春、王中华、张亮、王勇编著,中国铁道出版社出版) 的配套学习指导书。全书内容分为5部分:教学内容指导(包括对主教材第1~10章的知识点分析、典型 习题分析和各章习题解答);自主设计实验指导(对10个自主设计实验的设计思想、算法分析进行了详细 指导);模拟试卷;模拟试卷参考答案;数据结构课程设计报告样例。 本书对数据结构的概念和原理的阐述通俗易懂,例子翔实;习题难易适中,题型丰富;对数据结构 基本运算的分析注重实现的过程。本书以C/C++语言作为算法的描述语言,对于书中的实验和一些重要 的算法均给出了完整的C/C++语言源程序,并全部在Visual C++ 6.0环境下运行通过。 本书适合作为普通高等院校计算机类专业数据结构课程的教学辅导书,也可作为成
《MySQL是怎样使用的:快速入门MySQL》采用通俗易懂的表达方式,对如何使用MySQL进行了详细的介绍。 《MySQL是怎样使用的:快速入门MySQL》完全从零基础用户的角度出发,依照用户认知习惯,从MySQL的安装开始,介绍了MySQL的服务器程序和客户端程序的使用、MySQL的数据类型、数据库和表的基本操作、列的属性、MySQL中的表达式和函数、简单和复杂的增删改查语句等入门知识,还介绍了视图、存储程序、备份与恢复、用户与权限管理等高级概念以及使用Java语言连接MySQL服务器等知识。 《MySQL是怎样使用的:快速入门MySQL》较好地契合了MySQL初学人员的学习曲线,内容深入浅出,通俗易懂,可帮助初学人员迅速入门MySQL。
本书是一本Oracle数据库管理的入门教材,适合于初中级的读者,是作者二十多年IT工作和教学实践的总结与升华。 本着“把Oracle数据从高雅的象牙塔中带出来,使它的贵族身份贫民化,为普通人提供一套能买得起,而且容易读懂的Oracle数据库实用教材”的写作理念,本书使用生动而简单的生活例子来解释复杂的计算机和数据库概念,避免用计算机的例子来解释计算机和数据库的概念。本书是自封闭的,除了的SQL知识之外,读者可以在没有任何计算机专业知识的情况下从头开始阅读此书,而且也不需要其他的参考书。为了消除读者对IT教材常有的畏惧感,书中使用的语言轻松而幽默。 本书是一本Oracle数据库管理的实用教材。虽然它覆盖了OCP(Oracle认证专家)或OCA考试的几乎全部的内容,但重点放在实际工作能力的训练。因此本书中的每章附有大量的例题,而且
李於洪主编的《数据仓库与数据挖掘导论》为数据仓库与数据挖掘的基础教程,是作者多年来从事数据仓库与数据挖掘课程教学经验的梳理和总结。为了增强内容的直观性和可理解度,全书以大量图、表、实例融入其中。全书共分为四篇14章。篇为导引,共分2章:用实例和实例分析引导学生理解数据仓库与数据挖掘的概念内涵及其产生背景。第二篇为数据仓库,共分5章:详细介绍了数据仓库的体系结构及其组成部分的功能;从商业需求的角度介绍了数据仓库维度建模方法和联机分析处理操作;介绍了元数据在数据仓库建设中的重要性、分类方法与作用。第三篇为数据挖掘,共分4章:通过浅显易懂的语言及实例,深入浅出地介绍了关联分析方法、神经网络算法、决策树算法和聚类分析方法。第四篇为实验与工具,共分3章:提供了数据仓库实验、神经网络建模实
数据仓库及联机分析处理是数据库技术发展和应用的一个新阶段,本书全面、详细地介绍了构建数据仓库以及进行多维数据分析的技术,并力求把数据仓库理论以及在该理论领域的相关应用尽可能完美地融合起来,其内容涵盖数据仓库的构建理论、构建示例、前端多维数据的展示及分析技术、对数据仓库及多维数据集的管理和维护等技术。本书以目前流行的Microsoft SQl Server 2000数据库管理系统作为实践平台,以便于读者实践。本书语言通俗易懂,实例丰富。 本书非常适合作为计算机、商科及相关专业本科学生学习数据仓库及多维数据分析技术的教材,同时也适合作为研究生数据仓库等课程的教材。
《数据挖掘原理、算法及应用》以各类数据挖掘算法为核心,以智能数据分析技术的发展为主线,结合作者自身的研究和应用经验,阐述数据挖掘研究领域的主要理论和典型算法。全书共分8章:第1章为绪论;第2-5章分别介绍数据挖掘的主要技术、各类典型算法及其编程实现,包括数据预处理技术,关联规则挖掘技术、分类技术,聚类技术等几大类技术和其中包含的典型算法;第6-8章分别简要介绍一些数据挖掘的应用专题,包括时间序列数据挖掘、Weh挖掘、空间数据挖掘等。
本书是在版的基础上修订而成的。 本书为清华大学出版社出版、由严蔚敏和吴伟民编著的《数据结构》(C语言版)(以下简称教科书)的学习辅导书。主要内容包括:教科书中的每一种数据存储结构的图示;教科书中每一种存储结构的基本操作函数及调用这些基本操作的主程序和程序运行结果;教科书中几乎每一种算法的实现。对于教科书中一些较复杂的算法,本书提供了详细的解析。有些在教科书中一带而过的存储结构(如第2章的静态链表和第6章的二叉树的三叉链表),本书也提供了完整的基本操作函数及主程序和程序运行结果。本书配有光盘,光盘中包括书中所有程序及用标准C语言改写的程序。所有程序均在计算机上运行通过。 本书适用于使用教科书的大中专学生和自学者。书中的基本操作函数也可供从事计算机工程与应用工作的科技人员参考和采
本书系统讲述数据仓库的基本概念、基本原理以及建立数据仓库的方法和过程。主要内容包括:决策支持系统的发展、数据仓库环境结构、数据仓库设计、数据仓库粒度划分、数据仓库技术、分布式数据仓库、EIS系统和数据仓库的关系、外部和非结构化数据与数据仓库的关系、数据装裁问题、数据仓库与Web、ERP与数据仓库以及数据仓库设计的复查要目。 本书是数据仓库之父撰写的关于数据仓库的权威著作,既可作为相关专业的研究生教材,也是数据仓库的研究、开发和管理人员的指南。
数据仓库与数据挖掘是计算机专业和其他一些与计算机技术关系密切专业必修的核心课程。《数据仓库与数据挖掘技术》系统地介绍了数据仓库和数据挖掘的基本概念、相关知识和基本方法,每种数据挖掘方法都有详尽的实例描述和具体实现步骤。《数据仓库与数据挖掘技术》结构严谨,条理清晰,语言浅显易懂,循序渐进地表达了知识内容;《数据仓库与数据挖掘技术》坚持理论与实际相结合,概念和具体方法相结合,使知识具体化,生动化;实例实现的过程建立在sql2005数据挖掘软件的基础上,以帮助读者在学习后达到学以致用的目的。 本书可以作为计算机类、信息类等相关专业本科生数据挖掘课程的教材,也可以作为其他专业技术人员的自学参考书。
本书以精练的语言介绍HBase的基础知识,让初学者能够快速上手使用HBase,对HBase的核心思想(如数据读取、数据备份等)和HBase架构(如LSM树、WAL)有深入的分析,让有经验的HBase开发人员也能够循序渐进地深入理解HBase源码,以便更好地去调试和解决线上遇到的各种问题。本书更加专注HBase在线实时系统的调优,让HBase集群响应延迟更低,能够更好地为在线实时系统服务。本书结合企业的“用户行为分析系统”,让读者能够快速上手的同时,也不乏企业HBase实际应用场景,理论不脱离实际,真正做到从入门到精通。 本书适合有一定Java基础的程序员作为HBase入门教程,HBase运维人员可以将本书作为参考手册来部署和监控HBase,正在将HBase应用到在线生成环境中的软件开发人员也可以参考本书来调优HBase在线集群性能。
本书是在作者多年从事数据挖掘行业实践和相关科学研究的基础上编写而成,书中包括数据挖据理论研究及实际应用的现状分析、研究内容的组织框架、研究方法与技术路线的描述、数据挖掘理论及应用的综述、不确定性理论、多目标优化的分类器方法、模糊多目标优化的分类器模型和算法、基于粗糙集和统计贡献度的特征选择算法、基于粗糙集预处理和粗近似的多目标优化的分类器模型和算法以及基于模糊化、核方法和惩罚因子的多目标优化的分类器模型和算法等内容。本书含有不确定性多目标优化的数据挖掘在信用评分、Web客户忠诚度分析、蛋白质交互的热点区域预测以及重大疾病的医疗诊断和预测等几个经典领域中的实际应用的描述。后,通过对研究内容和实际应用效果的总结,展望了进一步研究和应用的方向。本书可供从事数据挖掘、机器学习与知识
本书是将大数据这一计算机前沿科学和基本应用有机结合的典范教材,全面介绍大数据和相关的基础知识,由浅入深地剖析大数据的分析处理方法和技术手段,突出介绍大数据*的发展趋势和技术成果。本书的一大亮点是每章中都使用图表对大数据与传统数据处理方式进行对比。另外,本书注重启发式的学习策略,便于读者理解和掌握。全书每章均包括实际应用案例与关键词注释,方便读者查阅和自学,同时配备习题和参考答案。本书体系完整、内容丰富、注重应用、前瞻性强、适用性好,并有开放式的课程教学网站(http://www.cmu.edu.cn/computer)提供技术支持。本书既可以作为普通高校大数据技术的基础教材,也可以作为职业培训教育及相关技术人员的参考用书。
随着Python应用领域的拓展,越来越多的人将Python用于处理大型数值数据集,使用标准格式来进行数据的存储和通信也显得越来越重要,而HDF5也正迅速成为人们存储科学数据的选择。本书向任何有Python数据分析基本背景的人介绍如何在Python下使用HDF5。 本书将着重于HDF5的本地功能集,而不是Python的高层抽象。熟悉Python和NumPy的读者,更容易阅读和掌握本书的内容。本书适合有一定基础的Python开发者,尤其适合要使用Python开发数据存储和处理等相关应用的读者阅读参考。
本书针对计算机、信息管理和其他相关专业学生的发展需求,系统、全面地介绍了大数据技术与应用的基本知识和技能,详细介绍了大数据基础、大数据的行业应用、大数据的基础设施、大数据技术基础、Hadoop分布式架构、大数据管理、大数据分析、人工智能与机器学习、数据科学与数据科学家、开放数据的时代,以及大数据发展与展望等内容,具有较强的系统性、可读性和实用性。本书是为高等院校 大数据 相关课程全新设计编写、具有丰富实践特色的主教材,也可供有一定实践经验的软件开发人员和管理人员参考,或作为继续教育的教材。 本书配套授课电子课件,需要的教师可登录www.cmpedu.com免费注册、审核通过后下载,或联系编辑索取(微信:15910938545,QQ:2850823885,email:2308140194@qq.com,电话:010-88379739)另外,为方便任课教师进行交流,提供本科计算机
本书主要包括三部分内容,即误差和数据处理基础、试验设计方法与应用和计算机数据处理软件简介。从误差理论入手,分别介绍测量值与误差、偶然误差的分布、误差传递等误差理论中的内容,介绍统计检验、方差分析、回归分析和聚类分析等数据处理方法与应用,介绍提高分析化学准确度的方法及质量控制方法,介绍正交试验设计、多因素序贯试验设计、*化区组和拉丁方设计、析因设计、响应面设计方法与应用,后一章以较大篇幅对现时流行的大型统计软件之一SPSS(Statistical Product and Service Solutions)进行简要介绍,书末附有习题及常用的统计数表。 本书着重介绍基本概念和基本理论,并在此基础上结合专业特点,介绍了各种统计方法在化学化工、医药、环境检测、矿物加工等多方面的应用,本书把误差与数据处理、质量控制和实验设计作为重点。
从数据中心机房监控系统的自定制技术、监控系统可信方法等方面,综述国内外研究进展,确定研究内容。第1章,主要讲述智能绿色数据中心机房监控系统的内涵;第2章,主要讲述基于大批量定制的绿色数据中心机房的自定制机理与方法;第3章,主要讲述绿色数据中心机房的用户身份认证、完整性等可信方法;第4章,给出了绿色数据中心机房智能监控技术应用,研制绿色智能机房监控系统,在该绿色智能机房监控系统架构上实施用户自定制技术、可信增强技术模块功能,并测试各项技术及整个系统的应用效果。 本书是作者长期从事数据中心机房监控系统,特别是数据中心机房监控系统自定制、可信性研究工作的方法和应用成果的总结,本书所研究技术应用到实际数据中心机房运行,这些实践工作对本书的形成具有十分重要的意义。
本书阐述了数据挖掘(通常称为数据库知识发现)的概念、方法和应用。从强调数据分析入手,介绍了数据库和数据挖掘的概念,指出数据挖掘是对大型数据库、数据构件库和其他大型信息资源中标识知识含义的那些类型的自动的或便捷的提取,并通过一个通用的框架回顾了当前的市场可供产品。数据挖掘是一个跨学科的知识领域,汲取了数据库技术、人工智能、机器学习、神经网络、统计学、模式识别、知识库系统、知识获取、信息检索、高性能计算、数据可视化等方面的成果,本书内容从数据库的视角,描述了数据挖掘系统的原型、结构、特征、方法,重点讲解了数据挖掘的可行性、实用性、有效性和大型数据库中模型发现的可测量性等问题。本书逐章讲解了数据分类、预测、联结和分组的概念和技术,这些专题都配有实例,对各类问题都分别列举了*算法
本书阐述了数据挖掘(通常称为数据库知识发现)的概念、方法和应用。从强调数据分析入手,介绍了数据库和数据挖掘的概念,指出数据挖掘是对大型数据库、数据构件库和其他大型信息资源中标识知识含义的那些类型的自动的或便捷的提取,并通过一个通用的框架回顾了当前的市场可供产品。数据挖掘是一个跨学科的知识领域,汲取了数据库技术、人工智能、机器学习、神经网络、统计学、模式识别、知识库系统、知识获取、信息检索、高性能计算、数据可视化等方面的成果,本书内容从数据库的视角,描述了数据挖掘系统的原型、结构、特征、方法,重点讲解了数据挖掘的可行性、实用性、有效性和大型数据库中模型发现的可测量性等问题。本书逐章讲解了数据分类、预测、联结和分组的概念和技术,这些专题都配有实例,对各类问题都分别列举了*算法,并
本书严格按照*考试中心制定的《全国计算机等级考试考试大纲(2004年版)》编写,章节安排与*考试中心主编的《全国计算机等级考试三级教程——数据库技术(2004年版)》同步,每节细化为4个模块:考点分析、经典题解、即学既练答案。实践表明,这种“一点一练、即学即会”的结构体例更便于记忆与理解,方便学习与应试。 本书配有上机模拟盘,盘中含有数套全真上机达标试题,上机题的整个考试过程与真实考试完全相当,便于读者进行考前上机演练。 本书具有标准、严谨、实用、高效、考点全面、考题典型、练习丰富等特点,非常适合有关考生使用,也可作为高等院校或培训班的教材。