大数据是当前流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。 张俊林著的这本《大数据日知录:架构与算法》从架构与算法的角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层出不穷的新架构、新系统等。本书对众多纷繁芜杂的相关技术文献和系统进行了择优汰劣并系统性地对相关知识分门别类地进行整理和介绍,将大数据相关技术分为大数据基础理论、大数据系统体系结
本书主要以OpenTSDB的很新版本(2.3.1版本)为基础进行介绍。章从OpenTSDB的入门开始,介绍市面上多种时序数据库和云端时序数据库,OpenTSDB的基础概念、源码环境搭建及Grafana的基本使用等。第2章主要介绍OpenTSDB的网络层,涉及Java NIO基础、Netty基本使用,分析了OpenTSDB网络层的架构和实现。第3章介绍OpenTSDB中UniqueId组件的原理,主要讲解如何实现UID与字符串之间的映射。第4章介绍OpenTSDB如何实现时序数据的存储及相关优化。第5章介绍OpenTSDB如何实现时序数据的查询,其中分析了OpenTSDB查询中每个步骤的实现。第6章和第7章主要介绍OpenTSDB中的元数据及Tree结构的实现和功能。第8章主要分析OpenTSDB中的插件及工具类实现原理。
本书以大数据为研究背景,系统分析了传统数据技术当前存在的问题以及面临的挑战,并对比了当前主流的面向大数据的数据库解决方案,在此基础上阐述了笔者的研究工作:基于MapReduce平台高处处理大数据的OLAP研究。书中反应了当前大规模数据仓库研究的热点和成果,值得大数据研究的人员参考和应用。
过去几十年里,Web的迅速发展使其成为世界上规模zui大的公共数据源。Web挖掘的目标是从Web超链接、网页内容和使用日志中探寻有用的信息。 《世界计算机教材精选:Web数据挖掘(第2版)》旨在阐述Web数据挖掘的概念及其核心算法,使读者获得相对完整的关于Web数据挖掘的算法和技术知识。本书不仅介绍了搜索、页面爬取和资源探索以及链接分析等传统的Web挖掘主题,而且还介绍了结构化数据的抽取、信息整合、观点挖掘和Web使用挖掘等内容,这些内容在已有书籍中没有提及过,但它们在Web数据挖掘中却占有非常重要的地位。全书分为两大部分:部分包括第2章到第5章,介绍数据挖掘的基础,第二部分包括第6章到2章,介绍Web相关的挖掘任务。从本书自版出版之后,很多领域已经有了重大的进展。新版大部分的章节都已经添加了新的材料来反应这些进展,主要
本书是机器学习和数据挖掘领域的经典教材,被众多国外名校选为教材。书中详细介绍用于数据挖掘领域的机器学习技术和工具以及实践方法,并且提供了一个公开的数据挖掘工作平台Weka。本书主要内容包括:数据输入/输出、知识表示、数据挖掘技术(决策树、关联规则、基于实例的学习、线性模型、聚类、多实例学习等)以及在实践中的运用。本版对上一版内容进行了全面更新,以反映自第2版出版以来数据挖掘领域的技术变革和新方法,包括数据转换、集成学习、大规模数据集、多实例学习等,以及新版的Weka机器学习软件。
本书全面而详细地讲述了关于数据仓库每一个重要部分的内容,包括计划、需求、体系、基础、结构、设计、数据准备、信息传递、配置和维护等。本书编排合理,每章提供本章主题,本章小结,可以使读者将每一个概念和技术同数据仓库的实践和市场结合起来;还提供复习思考题和练习供读者巩固学习到的知识。总之,本书几乎涵盖了数据仓库领域所有方面的知识,如果你想成为数据仓库领域专家,它是值得一读的。 本书是专门为IT专业人员而量身定做的介绍数据仓库知识的书籍,适合于想掌握数据仓库基础知识的系统分析员、程序员、数据分析员、数据库管理员、项目经理和软件工程师阅读,还非常适合作为大中院校相关专业的教科书或培训用书,供自学人员、大学课程或科研机构使用。
《大数据搜索与日志挖掘及可视化方案(第2版)》提出的分布式大数据搜索与日志挖掘及可视化方案是基于ELK Stack而提出的,它能有效应对海量大数据所带来的分布式存储与处理、全文检索、日志挖掘、可视化等问题。构建在全文检索开源软件Lucene之上的Elasticsearch,不仅能对海量规模的数据完成分布式索引与检索,还能提供数据聚合分析。据国际的数据库产品评测机构DB Engines的统计,在2016年1月,Elasticsearch已超过Solr等,成为排名的搜索引擎类应用;Logstash能有效处理来源于各种数据源的日志信息;Kibana能得出可视化分析结果。了解基于ELK Stack的大数据搜索与日志挖掘及可视化方案,掌握Elasticsearch、Logstash、Kibana的基本使用方法和技巧,很有必要。
Code Halo(数据场)是围绕在人们、设备、企业和行业周围的数据,通过破译这些数据所提供的信息和洞见,我们能够创造出新的商业模型,抓住此次基于数据场实现的技术变革所带来的巨大机遇,在数据场时代立于不败地位。书中呈现了抓住此次机遇的方式方法,以及如何在自己所处的行业内为此次机遇的到来做好万全的准备,并适时出手抓住这次机遇。
面对“人们被数据淹没,却饥渴于知识”的挑战,数据挖掘和知识发现技术应运而生,并得以蓬勃发展。数据挖掘涉及到人工智能、模式识别、机器学习、统计学等领域,因此,我们把体现当代科学技术发展特征的多学科间的知识交叉及成果反映到教材中来,同时本书从智能信息处理及数据挖掘两大主题出发,着重于介绍将智能信息处理中的技术如何应用于数据挖掘领域,如智能搜索、分类、聚类和智能决策等。 本书在介绍智能信息处理理论、方法、技术的基础上,全面系统地介绍了数据挖掘的概念、相关技术的原理及应用。全书共分9章。章主要从整体上介绍数据挖掘和知识发现的基本概念、研究现状及发展方向;第二章介绍了数据挖掘的理论基础;第三章详细论述了用于数据挖掘的计算智能方法的理论基础;第四章论述了神经网络和进化计算的分类方法;第
《数据结构综合设计实验教程》内容共分8章,前4章为基本数据结构的应用,第5章为多种数据结构的综合应用,第6~8章为数据结构知识扩展(部分数据结构书中含有这部分内容,但由于课时等原因讲解较少或未讲,因此可以放到综合设计中进行深入讲解;还有部分数据结构书中没有这部分内容,可以作为补充材料进行讲解)。本书在最后列出了一些实用的数据结构实践题目,可以方便老师在实践教学中选用或者学生自己选做。本书附录部分给出了实验报告的基本格式和实验报告范例,学生可以参照其要求进行实验。刘城霞主编的《数据结构综合设计实验教程》可作为高等院校计算机专业及相关专业的教材或参考书,也可供从事软件开发工作的人员和计算机编程爱好者参考。
为推广数据中心的建设技术,贯彻执行国家标准,本书总结了数据中心供配电系统、空调系统、机柜系统和布线系统的理论和实践经验,阐述了数据中心用电设备对于电能的基本要求,介绍了数据中心环境要求、设备布局、空调系统规划、未来的发展趋势以及数据中心空调系统的评估和优化。
本书全面介绍了应用SQL Server 2008数据库管理系统进行数据库管理与开发的知识,本书共有10章内容,主要内容包括:职业能力需求分析、课程定位、数据库应用系统概述、数据库的相关知识、数据库管理、数据表管理、数据库对象的应用、数据库的日常维护、数据库的安全管理、数据库管理系统的设计与实现等。
《SQL Server数据库原理及应用教程》选用以网络环境为背景而广泛使用的SQL Server 2000关系型数据库管理系统作为数据库系统平台,全面系统地介绍了数据库技术的基础理论、数据库系统设计方法、现代数据库系统开发应用等。介绍了 Transact-SQL编程、网络数据库系统安全、面向对象数据库技术、并行数据库系统和分布式数据库系统、数据仓库、数据挖掘,以及以SQL Server 2000作为网络编程的后台数据库,通过ODBC和ADO数据库访问技术,把ASP技术或JSP技术制作的Web网页与数据库之间连接起来等。
本书分为部分,共九章。第壹部分(章)主要介绍了企业大数据系统的前期准备工作,包括如何构建企业大数据处理系统的软件环境和集群环境。第二部分(第2~7章)首先介绍了Spark的基本原理,Spark2.0版本的SparkSQL、StructuredStreaming原理和使用方法,以及Spark的多种优化方式;然后,介绍了Druid的基本原理、集群的搭建过程、数据摄入过程,以及在查询过程中如何实现Druid查询API;接着介绍了日志收集系统Flume的基本架构和关键组件,以及分层日志收集架构的设计与实践;后介绍了分布式消息队列Kafka的基本架构和集群搭建过程,以及使用Java语言实现客户端API的详细过程。第三部分(第8~9章)主要介绍了企业大数据处理的两个实际应用案例,分别是基于Druid构建多维数据分析平台和基于JMX指标的监控系统。
《数据库管理与应用》主要以实际工作过程为导向,坚持“校企合作、工学交替”的方向,以学生易于就业为最终目标,以企业用人标准为依据进行编写,并通过理论与实训相结合的教学方式,全面介绍了数据库管理与应用技术。《数据库管理与应用》共分为7个学习情境:学习情境一为熟悉、安装和配置数据库,学习情境二介绍数据库设计与创建,学习情境三介绍数据库安全管理,学习情境四介绍数据库性能监测和日常维护,学习情境五讲解数据库的操纵,学习情境六讲述T-SQL语言及其应用,学习情境七通过一个综合案例讲述数据库系统的编程和测试,使学生对前面所学知识融会贯通。 本教材根据完成职业岗位的实际工作任务所需知识、能力、素质等方面的要求来选取教材内容,并以真实的工作任务及其工作过程为依据整合、优化教材内容,强调掌握实用的数