本书主要以OpenTSDB的很新版本(2.3.1版本)为基础进行介绍。章从OpenTSDB的入门开始,介绍市面上多种时序数据库和云端时序数据库,OpenTSDB的基础概念、源码环境搭建及Grafana的基本使用等。第2章主要介绍OpenTSDB的网络层,涉及Java NIO基础、Netty基本使用,分析了OpenTSDB网络层的架构和实现。第3章介绍OpenTSDB中UniqueId组件的原理,主要讲解如何实现UID与字符串之间的映射。第4章介绍OpenTSDB如何实现时序数据的存储及相关优化。第5章介绍OpenTSDB如何实现时序数据的查询,其中分析了OpenTSDB查询中每个步骤的实现。第6章和第7章主要介绍OpenTSDB中的元数据及Tree结构的实现和功能。第8章主要分析OpenTSDB中的插件及工具类实现原理。
近年来,随着Web技术的发展和应用的普及,大量用户将线下行为转移到线上进行,并且通过各种社会媒体随时随地进行社会交互和情感表达。这些海量的社会行为形成的大数据,催生了社会计算这个新的跨学科的研究和应用领域。《清华大学学术专著·社会计算:用户在线行为分析与挖掘》在大数据的时代背景和社会计算的框架下,介绍从大量用户在线行为数据中发现其中隐含的用户行为模式和兴趣偏好的方法和技术。全书主要内容分为7个部分,分别介绍用户在线搜索行为、网上购物行为、浏览行为、社会标注行为、评论行为以及社交行为等方面的数据分析技术和方法,涉及搜索意图的分析、购物模式的发现、周期行为的挖掘、标签的有效聚类、评论意见的挖掘、用户偏好的发现、个性化方法、链接分析以及社会网络的分析方法等研究内容。 《清华大学学术专
数据库的性能优化一直是DBA日常工作中非常重要的组成部分,然而很多DBA在学习了大量技术,参加了大量培训后,仍然会在实际工作中遇到难以下手的问题。实际上,在数据库优化工作中,方法和思路远比技术实现重要得多。 《DBA的思想天空:感悟Oracle数据库本质》重在介绍Oracle数据库的性能调优方法及相应的工作思路,但并不拘泥于技术细节。作者通过大量真实案例,深度剖析了相关技术原理,同时还阐述了理论知识在实践中的应用方法。优化工作的本质其实就是透过表象探寻根源,解决问题实现调优,正所谓 思路是道,操作方法是技 ,得道是极大的提升,也是DBA的思想精髓。 n
本书共章。第章是概述,阐述数据挖掘的意义与实际应用。第~章介绍网络和数据技术基础知识。这一部分内容涉及互联网上通信、交换、保存和显示信息的基础技术(如、、、、、等),并讲解用于查询网络文档和数据集的基本技术(和正则表达式)。第~章介绍网络抓取和文本挖掘的实用工具箱。这一部分由三个核心章节组成:第章讲解多种网络抓取技术,涉及正则表达式的使用、、各类接口、其他数据类型以及开源社区相关的技术;第章深入介绍用于统计性文本处理的技术;第章给出关于用管理数据的项目中常见问题的一些见解。第~章介绍实际案例分析,涉及美国参议院里的合作网络、从半结构化文档解析信息、利用预测年奥斯卡奖、绘制姓氏地理分布图、采集关于手机的数据、分析产品评论里的情绪等。这些案例分析针对日常的数据抓取和文本处理的工
《数据科学导引》是博雅大数据学院针对新开设的“数据科学与大数据技术”专业编写的数据科学导论课程教材。 《数据科学导引》内容共分十五章,包括绪论、数据预处理、回归模型、分类模型、集成模型、聚类模型、关联规则挖掘、降维、特征选择、EM算法、概率图模型、文本分析、图与网络分析、深度学习、分布式计算。附录部分对相关的基础知识做了简要介绍。 《数据科学导引》还提供了大量的数据分析实践案例,有助于加深读者对理论知识的理解,及培养其实际应用能力。 《数据科学导引》可作为全国高等学校数据科学相关专业的本科生和研究生教材,也可供从事相关工作的技术人员参考使用。
改变命运的不只是努力,比努力更重要的是决策。过去的决策决定了现状,正在做的决策注定将影响未来。如何汲取前人的预测和决策智慧?利用大数据技术提高决策质量和效率?本书围绕上述问题,介绍决策与生活和工作的关系、决策的历史渊源、传统文化中的决策智慧,阐述现代决策理论与基本过程、如何提高决策质量和效率,探索大数据时代的预测与决策。本书不是“决策操作手册”,而尝试为各类组织机构的管理者、涉及数据技术的科技工作者和具有传统文化基础的普通读者提供可资借鉴的智慧。
这本易于上手的初学指南详细介绍了数据库的核心概念、DBA的职责和企业数据库的功能,能引导你完成数据库的配置、管理、规划、备份、恢复以及实现高可用性。你会获得对SQL和PL/SQL的深入了解,同时学习到管理大型数据库和使用Oracle工程系统的重要相关信息。
本书详细地介绍使用 Access 开发数据库系统的知识、技术与实际应用。全书共 13 章,每一章都是一个独立的主题,以数据库系统的开发流程来组织各章内容和排列顺序,有助于梳理 Access 知识体系和数据库开发流程。本书内容包括 Access 数据库术语、数据库对象及其视图、Access 界面环境的使用与定制、数据库的整体设计流程、创建数据库和表、设计表结构、设置表的主键和索引、创建表之间的关系、在数据表视图中操作数据、使用查询操作数据、使用窗体显示和编辑数据、使用报表呈现与打印数据、使用表达式和 SQL 语句、使用宏让操作自动化、管理和维护数据库等内容,最后一章介绍了开发一个数据库管理系统的具体方法和步骤。 为了帮助读者更好地理解在开发数据库的过程中涉及的 Access 知识和技术,本书提供了 72 个案例,读者可以在学习过程中多加练习,不
本书完整全面地讲述数据挖掘的概念、方法、技术和研究进展。本书对前两版做了全面修订,加强和重新组织了全书的技术内容,重点论述了数据预处理、频繁模式挖掘、分类和聚类等的内容,还全面讲述了OLAP和离群点检测,并研讨了挖掘网络、复杂数据类型以及重要应用领域。 本书是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都的参考书,是一本适用于数据分析、数据挖掘和知识发现课程的教材,可以用做高年级本科生或者一年级研究生的数据挖掘导论教材。
在《白话统计》中你可以解决很多简单的网络搜索所不能解决的问题。在当前网络发达的时代,几乎任何概念和知识点都可以从网络上查到。但是有一点你很难查到,那就是统计分析的思路和观点。比如,你可以很容易地在网上查到什么是线性回归,但你却查不到怎么“做”线性回归分析,在你遇到实际数据时仍然不知道如何分析。在《白话统计》中你可以获得这些思路和观点。尽管这些观点未必是所有人都认可的,但根据笔者多年的分析经验,它们在实践中通常是奏效的。《白话统计》凝结了作者十多年来对统计分析的理解,对各种方法的介绍采用全新的理念和思路,不再是介绍方法本身,而是试图将各种方法之间的联系阐述清楚;不再是介绍方法如何计算出结果,而是尽量说明方法背后的思想。当然,本书同时提供了如何实现结果的软件(涉及Excel、SAS、R、JMP
本书系统介绍以太坊智能合约的开发,对智能合约相关知识进行全面梳理,尤其是对智能合约开发语言Solidity进行了详细解读,智能合约的开发者可以从书中获得一些启发和指导。本书可以作为一本案头手册,方便开发者在开发智能合约时随时查阅。
本书全面而详细地讲述了关于数据仓库每一个重要部分的内容,包括计划、需求、体系、基础、结构、设计、数据准备、信息传递、配置和维护等。本书编排合理,每章提供本章主题,本章小结,可以使读者将每一个概念和技术同数据仓库的实践和市场结合起来;还提供复习思考题和练习供读者巩固学习到的知识。总之,本书几乎涵盖了数据仓库领域所有方面的知识,如果你想成为数据仓库领域专家,它是值得一读的。 本书是专门为IT专业人员而量身定做的介绍数据仓库知识的书籍,适合于想掌握数据仓库基础知识的系统分析员、程序员、数据分析员、数据库管理员、项目经理和软件工程师阅读,还非常适合作为大中院校相关专业的教科书或培训用书,供自学人员、大学课程或科研机构使用。
《大数据搜索与日志挖掘及可视化方案(第2版)》提出的分布式大数据搜索与日志挖掘及可视化方案是基于ELK Stack而提出的,它能有效应对海量大数据所带来的分布式存储与处理、全文检索、日志挖掘、可视化等问题。构建在全文检索开源软件Lucene之上的Elasticsearch,不仅能对海量规模的数据完成分布式索引与检索,还能提供数据聚合分析。据国际的数据库产品评测机构DB Engines的统计,在2016年1月,Elasticsearch已超过Solr等,成为排名的搜索引擎类应用;Logstash能有效处理来源于各种数据源的日志信息;Kibana能得出可视化分析结果。了解基于ELK Stack的大数据搜索与日志挖掘及可视化方案,掌握Elasticsearch、Logstash、Kibana的基本使用方法和技巧,很有必要。