大数据是当前流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。 张俊林著的这本《大数据日知录:架构与算法》从架构与算法的角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层出不穷的新架构、新系统等。本书对众多纷繁芜杂的相关技术文献和系统进行了择优汰劣并系统性地对相关知识分门别类地进行整理和介绍,将大数据相关技术分为大数据基础理论、大数据系统体系结
本书主要以OpenTSDB的很新版本(2.3.1版本)为基础进行介绍。章从OpenTSDB的入门开始,介绍市面上多种时序数据库和云端时序数据库,OpenTSDB的基础概念、源码环境搭建及Grafana的基本使用等。第2章主要介绍OpenTSDB的网络层,涉及Java NIO基础、Netty基本使用,分析了OpenTSDB网络层的架构和实现。第3章介绍OpenTSDB中UniqueId组件的原理,主要讲解如何实现UID与字符串之间的映射。第4章介绍OpenTSDB如何实现时序数据的存储及相关优化。第5章介绍OpenTSDB如何实现时序数据的查询,其中分析了OpenTSDB查询中每个步骤的实现。第6章和第7章主要介绍OpenTSDB中的元数据及Tree结构的实现和功能。第8章主要分析OpenTSDB中的插件及工具类实现原理。
本书以大数据为研究背景,系统分析了传统数据技术当前存在的问题以及面临的挑战,并对比了当前主流的面向大数据的数据库解决方案,在此基础上阐述了笔者的研究工作:基于MapReduce平台高处处理大数据的OLAP研究。书中反应了当前大规模数据仓库研究的热点和成果,值得大数据研究的人员参考和应用。
本书内容简介:数据挖掘和文本挖掘是当前信息技术中的一个重要研究领域;将遗传算法和社会演化算法应用于数据及文本挖掘方法研究,具有较大的理论意义和实用价值本书研究了基于遗传算法和社会演化算法的数据挖掘和文本挖掘方法,主要包括数据挖掘和文本挖掘中的属性约简问题、聚类问题,并将其应用于产品研发决策中所做主要工作包括:提出一种基于遗传算法和k-medoids算法的新的聚类方法;采用遗传算法和模式聚合进行文本特征降维;采用遗传算法和潜在语义索引进行文本特征降维;采用社会演化算法进行聚类;采用混沌社会演化算法进行聚类;采用改进的遗传算法和社会演化算法进行文本聚类研究;将文本挖掘应用到产品研发决策中,构建产品研发文本知识地图,以期提高产品研发的效率和质量。
近年来,随着Web技术的发展和应用的普及,大量用户将线下行为转移到线上进行,并且通过各种社会媒体随时随地进行社会交互和情感表达。这些海量的社会行为形成的大数据,催生了社会计算这个新的跨学科的研究和应用领域。《清华大学学术专著·社会计算:用户在线行为分析与挖掘》在大数据的时代背景和社会计算的框架下,介绍从大量用户在线行为数据中发现其中隐含的用户行为模式和兴趣偏好的方法和技术。全书主要内容分为7个部分,分别介绍用户在线搜索行为、网上购物行为、浏览行为、社会标注行为、评论行为以及社交行为等方面的数据分析技术和方法,涉及搜索意图的分析、购物模式的发现、周期行为的挖掘、标签的有效聚类、评论意见的挖掘、用户偏好的发现、个性化方法、链接分析以及社会网络的分析方法等研究内容。 《清华大学学术专
数据库的性能优化一直是DBA日常工作中非常重要的组成部分,然而很多DBA在学习了大量技术,参加了大量培训后,仍然会在实际工作中遇到难以下手的问题。实际上,在数据库优化工作中,方法和思路远比技术实现重要得多。 《DBA的思想天空:感悟Oracle数据库本质》重在介绍Oracle数据库的性能调优方法及相应的工作思路,但并不拘泥于技术细节。作者通过大量真实案例,深度剖析了相关技术原理,同时还阐述了理论知识在实践中的应用方法。优化工作的本质其实就是透过表象探寻根源,解决问题实现调优,正所谓 思路是道,操作方法是技 ,得道是极大的提升,也是DBA的思想精髓。 n
过去几十年里,Web的迅速发展使其成为世界上规模zui大的公共数据源。Web挖掘的目标是从Web超链接、网页内容和使用日志中探寻有用的信息。 《世界计算机教材精选:Web数据挖掘(第2版)》旨在阐述Web数据挖掘的概念及其核心算法,使读者获得相对完整的关于Web数据挖掘的算法和技术知识。本书不仅介绍了搜索、页面爬取和资源探索以及链接分析等传统的Web挖掘主题,而且还介绍了结构化数据的抽取、信息整合、观点挖掘和Web使用挖掘等内容,这些内容在已有书籍中没有提及过,但它们在Web数据挖掘中却占有非常重要的地位。全书分为两大部分:部分包括第2章到第5章,介绍数据挖掘的基础,第二部分包括第6章到2章,介绍Web相关的挖掘任务。从本书自版出版之后,很多领域已经有了重大的进展。新版大部分的章节都已经添加了新的材料来反应这些进展,主要
本书是机器学习和数据挖掘领域的经典教材,被众多国外名校选为教材。书中详细介绍用于数据挖掘领域的机器学习技术和工具以及实践方法,并且提供了一个公开的数据挖掘工作平台Weka。本书主要内容包括:数据输入/输出、知识表示、数据挖掘技术(决策树、关联规则、基于实例的学习、线性模型、聚类、多实例学习等)以及在实践中的运用。本版对上一版内容进行了全面更新,以反映自第2版出版以来数据挖掘领域的技术变革和新方法,包括数据转换、集成学习、大规模数据集、多实例学习等,以及新版的Weka机器学习软件。
《数据科学导引》是博雅大数据学院针对新开设的“数据科学与大数据技术”专业编写的数据科学导论课程教材。 《数据科学导引》内容共分十五章,包括绪论、数据预处理、回归模型、分类模型、集成模型、聚类模型、关联规则挖掘、降维、特征选择、EM算法、概率图模型、文本分析、图与网络分析、深度学习、分布式计算。附录部分对相关的基础知识做了简要介绍。 《数据科学导引》还提供了大量的数据分析实践案例,有助于加深读者对理论知识的理解,及培养其实际应用能力。 《数据科学导引》可作为全国高等学校数据科学相关专业的本科生和研究生教材,也可供从事相关工作的技术人员参考使用。
本书由浅入深、循序渐进地介绍了微软公司推出的数据库管理系统——中文版Microsoft SQL Server 2005系统的操作方法和使用技巧。全书共分13章,分别介绍了数据库技术的基础知识、Microsoft SQL Server 2005系统的安装和配置、Transact-SQL语言、安全性管理、管理数据库文件、备份和还原、数据类型和表、操纵表中数据、索引管理、查询优化技术、视图、存储过程、触发器、用户定义函数、数据完整性、自动化管理任务、系统监视和调整等内容。 本书内容丰富,结构清晰,语言简练,图文并茂,具有很强的实用性和可操作性,是一本适合于大中专院校、职业院校及各类社会培训学校的教材,也是广大初、中级电脑用户的自学参考书。
《数据库技术与应用(Access2010)/普通高等教育计算机基础课程规划教材》以目前普遍使用的Access2010版本为基础编写,全书共分7章,主要内容包括:数据库基础、表的创建和使用、查询、窗体、报表、宏、模块和VBA编程。 《数据库技术与应用(Access2010)/普通高等教育计算机基础课程规划教材》编写结构合理、层次分明、语言清晰简明,难点分散,采用较多的实例详细讲解了数据库中各个对象的具体操作。在每一章的末尾,收集了较多的习题,可帮助读者在短时间内把握主要内容、掌握知识要点。 《数据库技术与应用(Access2010)/普通高等教育计算机基础课程规划教材》适合作为各类普通高等院校数据库应用课程的教材,也可以作为全国计算机等级考试二级Access的教材,以及培训班的教学用书或自学参考书。
本书详细地介绍使用 Access 开发数据库系统的知识、技术与实际应用。全书共 13 章,每一章都是一个独立的主题,以数据库系统的开发流程来组织各章内容和排列顺序,有助于梳理 Access 知识体系和数据库开发流程。本书内容包括 Access 数据库术语、数据库对象及其视图、Access 界面环境的使用与定制、数据库的整体设计流程、创建数据库和表、设计表结构、设置表的主键和索引、创建表之间的关系、在数据表视图中操作数据、使用查询操作数据、使用窗体显示和编辑数据、使用报表呈现与打印数据、使用表达式和 SQL 语句、使用宏让操作自动化、管理和维护数据库等内容,最后一章介绍了开发一个数据库管理系统的具体方法和步骤。 为了帮助读者更好地理解在开发数据库的过程中涉及的 Access 知识和技术,本书提供了 72 个案例,读者可以在学习过程中多加练习,不
本书详细介绍了数据库原理、方法及其应用开发技术。全书共分12章,分别介绍了数据库系统原理概论、microsoft sqlserver2005系统概述、sql语言概述、transact?sql程序设计基础、sql高级功能、数据库的安全管理、数据库的故障和恢复、数据转换、关系数据库规范化理论、数据库设计与实施、ado.访问数据库技术、在线考试系统开发实例等内容。同时书中以c#作为开发平台详细讲述了ado.访问数据库开发的全过程,最后书中介绍了一个在线考试系统开发实例。本书在讲述理论的同时与sqlserver 2005有机结合,使理论与实践同步,同时介绍了使用ado.和c#开发数据库应用程序的基本方法和技术。 本书既可作为普通高等学校相关专业的教材,也可作为软件学院、成人教育和自学考试同名课程的教材和教学参考书,还可供it领域的科技人员参考。
《MySQL从入门到精通》从初学者角度出发,通过通俗易懂的语言以及丰富多彩的实例,详细介绍了MySQL开发应该掌握的各方面技术。《MySQL从入门到精通》共分为4篇23章,包括数据库基础,初识MySQL,使用MySQL图形化管理工具,数据库操作,存储引擎及数据类型,操作数据表,MySQL基础,表数据的增、删、改操作,数据查询,常用函数,索引,视图,数据完整性约束,存储过程与存储函数,触发器,事务的应用,事件,备份与恢复,MySQL性能优化,权限管理及安全控制,PHP管理MySQL数据库中的数据,Apache PHP MySQL实现网上社区,Struts 2 Spring Hibernate MySQL实现网络商城等内容。所有知识都结合具体实例进行介绍,涉及的程序代码也给出了详细的注释,可以使读者轻松领会MySQL的精髓,快速提高开发技能。 《MySQL从入门到精通》内容详尽,实例丰富,非常适合作为编程初学
《数据结构综合设计实验教程》内容共分8章,前4章为基本数据结构的应用,第5章为多种数据结构的综合应用,第6~8章为数据结构知识扩展(部分数据结构书中含有这部分内容,但由于课时等原因讲解较少或未讲,因此可以放到综合设计中进行深入讲解;还有部分数据结构书中没有这部分内容,可以作为补充材料进行讲解)。本书在最后列出了一些实用的数据结构实践题目,可以方便老师在实践教学中选用或者学生自己选做。本书附录部分给出了实验报告的基本格式和实验报告范例,学生可以参照其要求进行实验。刘城霞主编的《数据结构综合设计实验教程》可作为高等院校计算机专业及相关专业的教材或参考书,也可供从事软件开发工作的人员和计算机编程爱好者参考。