本书是一本关于计算信息设计的书籍。从如何获取原始数据开始,到如何理解原始数据,本书都给出了非常详尽的介绍。本书使用由作者开发的开源编程环境Processing编程,它非常简单易用。对于熟悉使用Java的程序员来说,本书后面的章节还介绍了如何将Processing和Java结合使用。 本书是写给那些拥有一个数据集合,好奇如何探索它,并且考虑如何交流这些数据的人们的。随着我们处理越来越多的信息,需要可视化数据的人们的数量增长的非常迅速。更重要的是,读者已经了某些可视化领域的专家。通过让更大范围的人们都接触到可视化思想,我们在接下来的几十年中应该可以看到一些真正让人惊叹的成果。
面对“人们被数据淹没,却饥渴于知识”的挑战,数据挖掘和知识发现技术应运而生,并得以蓬勃发展。数据挖掘涉及到人工智能、模式识别、机器学习、统计学等领域,因此,我们把体现当代科学技术发展特征的多学科间的知识交叉及成果反映到教材中来,同时本书从智能信息处理及数据挖掘两大主题出发,着重于介绍将智能信息处理中的技术如何应用于数据挖掘领域,如智能搜索、分类、聚类和智能决策等。 本书在介绍智能信息处理理论、方法、技术的基础上,全面系统地介绍了数据挖掘的概念、相关技术的原理及应用。全书共分9章。章主要从整体上介绍数据挖掘和知识发现的基本概念、研究现状及发展方向;第二章介绍了数据挖掘的理论基础;第三章详细论述了用于数据挖掘的计算智能方法的理论基础;第四章论述了神经网络和进化计算的分类方法;第
本书讲述在流行的大数据分布式存储和计算平台Hadoop上设计实现数据仓库,将传统数据仓库建模与SQL开发的简单性与大数据技术相结合,快速、高效地建立可扩展的数据仓库及其应用系统。 本书内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用HIVE进行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala进行快速联机数据分析,使用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。本书适合数据库管理员、大数据技术人员、Hadoop技术人员、数据仓库技术人员,也适合高等院校和培训机构相关专业的师生教学参考。
数据结构是计算机及其相关专业的重要课程,是计算机软件开发及应用人员的专业基础。本书首先介绍数据结构与算法的基础知识,然后系统地论述线性表、栈、队列、串、数组和广义表、树和二又树、图等基本数据结构,并讨论了常用的查找和排序技术。在用例选择方面充分考虑了电子信息类专业特点,尤其突出信息与通信工程相关专业的特色。在各章最后描述了相应的标准模板库(STL),旨在使读者了解STL与数据结构的关系,并且能够掌握各类STL的应用,提高实际应用能力和程序设计的效率。 本书内容丰富、层次清晰、讲解深入浅出,可作为计算机及相关专业,尤其是电子信息类专业本专科数据结构课程的教材,也可供从事计算机软件开发和应用的工程技术人员阅读和参考。
《数据结构(c语言版)》在选材与编排上,贴近当前普通高等院校“数据结构”课程的现状和发展趋势,符合研究生考试大纲,内容难度适度,突出实用性和应用性。《数据结构(c语言版)》共8章,内容包括绪论,线性表,栈和队列,串、数组和广义表,树和二叉树,图,查找和排序。《数据结构(c语言版)》采用类c语言作为数据结构和算法的描述语言。 《数据结构(c语言版)》可作为普通高等院校计算机和信息技术相关专业“数据结构”课程的教材使用,也可供从事计算机工程与应用工作的科技工作者参考。
本书全面介绍了数据挖掘的理论和方法,旨在为读者提供将数据挖掘应用于实际问题所必需的知识。本书涵盖五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都包含两章:前面一章讲述基本概念、代表性算法和评估技术,后面一章较深入地讨论高级概念和算法。目的是使读者在透彻地理解数据挖掘基础的同时,还能了解更多重要的高级主题。此外,书中还提供了大量示例、图表和习题。 本书适合作为相关专业高年级本科生和研究生数据挖掘课程的教材,同时也可作为数据挖掘研究和应用开发人员的参考书。
本书结合理论和实践,由浅入深,多方面介绍了Hadoop这一高性能的海量数据处理和分析平台。全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。第Ⅱ部分介绍MapReduce,主题包括MapReduce应用开发;MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。第Ⅲ部分介绍Hadoop的运维,主题涉及构建Hadoop集群、管理Hadoop。第Ⅳ部分介绍Hadoop相关开源项目,主题涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供了三个案例,分别来自医疗卫生信息技术服务商塞纳(Cerner)、微软的人工智能项目ADAM(一种大规模分布式深度学习框架)和开源项目Cascading(一个新的针对MapReduce的数据处理API)。本书是一本很好不错、全面的Hadoop参考书和工具书,阐述了Hadoop生态圈的很新发展和应用,程序员可以
本书从实例的角度出发,循序渐进地讲解了SQL Server 2005的理论知识和基本操作。主要内容包括:数据库的基本知识、SQL Server概述、数据库和表的创建与管理、表中数据的查询、Transact-SQL语句、索引、视图、游标、事务、存储过程、触发器、SQL Server安全性管理、备份与恢复、SQL Server提供的应用程序接口、应用开发实例等。 本书突出实际技能的培养,每章后都有习题和实验,以加深学生对基本知识的理解。另外,还用一个综合性的实例贯穿全书,逐步实现一个完整数据库系统的设计。参考最后一章的应用实例,学生能够开发自己的数据库管理系统,真正做到学以致用。 本书既可作为高职高专及大专相关专业教材,同时也可供广大初学者和数据库技术人员使用。
本书在简要回顾基本C 程序设计概念的基础上,全面系统地介绍了队列、堆栈、树、图等基本数据结构。本书将C 语言作为数据结构的算法描述语言。一方面对传统的数据结构内容进行了C 语言实现,另一方面将数据结构与面向对象技术结合起来,围绕抽象数据类型的概念来讨论每一种数据结构及算法。书中大量C 语言的程序实例既是数据结构的具体实现,又是面向对象技术的算法基础。本书理论与实践并重,每章都有大量的习题,强调数据结构的应用价值。 本书可作为计算机类及信息类相关专业的核心教材,也可供广大研究开发人员自学参考使用。
数据结构是计算机及其相关专业的重要课程,是计算机软件开发及应用人员的专业基础。本书首先介绍数据结构与算法的基础知识,然后系统地论述线性表、栈、队列、串、数组和广义表、树和二又树、图等基本数据结构,并讨论了常用的查找和排序技术。在用例选择方面充分考虑了电子信息类专业特点,尤其突出信息与通信工程相关专业的特色。在各章最后描述了相应的标准模板库(STL),旨在使读者了解STL与数据结构的关系,并且能够掌握各类STL的应用,提高实际应用能力和程序设计的效率。 本书内容丰富、层次清晰、讲解深入浅出,可作为计算机及相关专业,尤其是电子信息类专业本专科数据结构课程的教材,也可供从事计算机软件开发和应用的工程技术人员阅读和参考。
本书中凝练了有关Oracle是什么及其版本的功能等大量信息,并将这些信息压缩组织为一种易于阅读的形式,并特别指出了所强调的内容、示例和帮助性提示。其中各章节包含了以下内容: Oracle产品、选件、数据结构,以及Oracle9i、Oracle8i和Oracle8的整体结构。Oracle网络、管理、监控、性能优化、数据仓库和分布式数据库。多用户并发性、联机事务处理(OLTP)、高可用性和硬件体系结构(如,SMP、MPPT 和NUMA)。Oracle与Web。作者简介 Rick Greenwald在计算机软件领域已经驰聘了近二十年,其间曾为Data General、Cognos和Gupta工作过,目前是Oracle公司的一名分析师。他已经出版过6部专著,而且就不同技术问题发表的文章简直不计其数,此外还曾在学术会议和培训课上做过演讲。除了本书以外,Rick所著的书还包括《Oracle Power Objects Developer's Guide》、《Mastering Oracle Power Object》、
10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍Python数据挖掘建模过程,实践性极强。 本书共15章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。 基础篇(~5章),章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘
适合的往往是实用的,就像我们要讲述的MySQL一样,它的功能不是全面的,架构也不是完善的,但是其体积小、速度快、总体拥有和维护成本低,尤其是它具备开放源码的优势,使其迅速成为中小型企业和网站的数据库。 本书共分为4个部分(篇)和5个附录。其中第1篇为MySQL数据库基础篇,内容包括数据库所涉及的基本概念、MySQL数据库的安装与配置等。第2篇为MySQL数据库操作和应用篇,内容包括操作数据库对象、操作表对象、操作索引对象、操作视图对象、操作触发器对象和操作数据等。第3篇为MySQL数据库管理篇,内容包括MySQL数据库的用户管理和权限管理、MySQL数据库的日志管理、MySQL数据库的性能优化等。第4篇为MySQL数据库实战案例篇,内容包括Java+MySQL案例——在线书城和PHP+MySQL案例——智能考试系统两个实战案例。附录部分(光盘中)包括了MySQL数据库操作和
《数据挖掘原理、算法及应用》以各类数据挖掘算法为核心,以智能数据分析技术的发展为主线,结合作者自身的研究和应用经验,阐述数据挖掘研究领域的主要理论和典型算法。全书共分8章:章为绪论;第2-5章分别介绍数据挖掘的主要技术、各类典型算法及其编程实现,包括数据预处理技术,关联规则挖掘技术、分类技术,聚类技术等几大类技术和其中包含的典型算法;第6-8章分别简要介绍一些数据挖掘的应用专题,包括时间序列数据挖掘、Weh挖掘、空间数据挖掘等。
“大数据”一词已成为当下最热门的词汇之一。人们热切期待大数据能给工作、学习和生活等方面带来的变化,而大数据的采集、存储、计算、分析挖掘、呈现和安全等技术正是实现这一变化的关键。《大数据技术全解:基础、设计、开发与实践》的重点不在于对大数据技术的原理性介绍,而是从实战角度出发,系统地阐述如何基于Hadoop开源软件为客户设计、安装和开发一个大数据系统。《大数据技术全解:基础、设计、开发与实践》还着重分享了具体实践中的一些案例,不仅对于从事大数据系统开发的IT技术人员具有珍贵的参考价值,而且对准备实施大数据系统项目的企业级客户也具有指导作用。 《大数据技术全解:基础、设计、开发与实践》可以作为计算机软件专业的本科生和研究生的大数据技术教材,也可作为大数据技术开发培训、大数据系统咨询规划
本书以Oracle 10g为基础,对Oracle RAC进行了全面的介绍和分析。全书分为两个部分,共14章,部分是集群理论篇,这部分从集群基础知识入手,通过分析集群环境和单机环境的不同,介绍了集群环境的各个组件及其作用,以及集群环境的一些专有技术,包括Oracle Clusterware、Oracle Database、ASM、Cache Fusion等。第二部分是实践篇,每一章都针对RAC的一个知识点展开讲解,包括Oracle Clusterware的维护、HA与LB、备份、恢复、Flashback家族、RAC和Data Guard的结合使用、RAC和Stream的结合使用,最后对ASM进行深入介绍,并给出性能调整的指导思想。 本书按照“发现问题→解决问题→实践与理论相结合”的方式进行介绍,首先对现实问题进行分析,然后提供合适的解决方案,最后自然地引出Oracle中的理论知识点,这种讲解方法能够有效地降低阅读难度,帮助读者更好地掌握相关技能。
在本书中,作者将自己多年形成的编程习惯以及阅读既有代码的体验凝练成了编程中的价值观、原则和77种实现模式。 沟通、简单和灵活的价值观应当被所有开发人员所铭记。局部影响、化重复、将逻辑与数据捆绑等原则同样是通用性的指导思想,比价值观更贴近编程场景,在价值观和模式之间搭建了桥梁。在77种实现模式中,每一种模式都覆盖了编写简洁、清晰、易扩展、易维护的代码这一原则的某个方面。它们为日常的编程提供了丰富翔实的参考依据,并告诉大家这些代码如何为降低沟通成本和提高有效产出提供保障。 本书适用于各个阶段的开发者群体。刚刚涉足软件开发领域的新人能够透过大师的眼睛来看待编程,了解编程的价值观与原则;具有丰富经验的资深工程师则可以通过这些模式进行反思,探究成功实践背后的意义。把价值观、原则和开发
本书总结了作者多年来管理Oracle高可用数据库的经验,特别是近些年来在淘宝网(..corn)工作的大量实战经验。全书共分为五篇,依次为高可用性篇、数据处理篇、性能优化篇、系统维护篇和监控体系篇,其中对管理Oracle高可用数据库的讲解尤为细致,在帮助您学习Oracle高可用性方面极具参考价值。本书不仅适合有高可用需求的Oracle DBA参考和阅读,部分章节还适合有Oracle高可用需求的系统管理员、系统构架师,以及管理者和决策者参考和阅读。
堪称相关行业的“动向”和“密码”的“大数据”究竟是什么?为什么如此受众人关注?未来大数据将改变什么?本书以图解的方式为大家详细解读众人关注的焦点——大数据。 大数据不仅仅是行业的热门话题,也是各行各业关注的焦点。因为它不仅改变了社会,也改变了我们的生活和工作方式。大数据还可应用于各个领域,比如气象预测、预防犯罪、医疗领域等,其功能无比强大。读完本书,你将读懂什么是大数据!
适合的往往是实用的,就像我们要讲述的MySQL一样,它的功能不是全面的,架构也不是完善的,但是其体积小、速度快、总体拥有和维护成本低,尤其是它具备开放源码的优势,使其迅速成为中小型企业和网站的数据库。 本书共分为4个部分(篇)和5个附录。其中第1篇为MySQL数据库基础篇,内容包括数据库所涉及的基本概念、MySQL数据库的安装与配置等。第2篇为MySQL数据库操作和应用篇,内容包括操作数据库对象、操作表对象、操作索引对象、操作视图对象、操作触发器对象和操作数据等。第3篇为MySQL数据库管理篇,内容包括MySQL数据库的用户管理和权限管理、MySQL数据库的日志管理、MySQL数据库的性能优化等。第4篇为MySQL数据库实战案例篇,内容包括Java+MySQL案例——在线书城和PHP+MySQL案例——智能考试系统两个实战案例。附录部分(光盘中)包括了MySQL数据库操作和