本书主要以OpenTSDB的很新版本(2.3.1版本)为基础进行介绍。章从OpenTSDB的入门开始,介绍市面上多种时序数据库和云端时序数据库,OpenTSDB的基础概念、源码环境搭建及Grafana的基本使用等。第2章主要介绍OpenTSDB的网络层,涉及Java NIO基础、Netty基本使用,分析了OpenTSDB网络层的架构和实现。第3章介绍OpenTSDB中UniqueId组件的原理,主要讲解如何实现UID与字符串之间的映射。第4章介绍OpenTSDB如何实现时序数据的存储及相关优化。第5章介绍OpenTSDB如何实现时序数据的查询,其中分析了OpenTSDB查询中每个步骤的实现。第6章和第7章主要介绍OpenTSDB中的元数据及Tree结构的实现和功能。第8章主要分析OpenTSDB中的插件及工具类实现原理。
近年来,随着Web技术的发展和应用的普及,大量用户将线下行为转移到线上进行,并且通过各种社会媒体随时随地进行社会交互和情感表达。这些海量的社会行为形成的大数据,催生了社会计算这个新的跨学科的研究和应用领域。《清华大学学术专著·社会计算:用户在线行为分析与挖掘》在大数据的时代背景和社会计算的框架下,介绍从大量用户在线行为数据中发现其中隐含的用户行为模式和兴趣偏好的方法和技术。全书主要内容分为7个部分,分别介绍用户在线搜索行为、网上购物行为、浏览行为、社会标注行为、评论行为以及社交行为等方面的数据分析技术和方法,涉及搜索意图的分析、购物模式的发现、周期行为的挖掘、标签的有效聚类、评论意见的挖掘、用户偏好的发现、个性化方法、链接分析以及社会网络的分析方法等研究内容。 《清华大学学术专
本书系统全面地阐述了数据库设计理论、数据库管理技术与方法、基于VB.NET的数据库访问技术和数据库应用系统开发技术与方法。全书分为4篇。篇数据库设计理论,内容包括数据库系统概述、关系数据库和数据库设计;第二篇数据库管理,介绍SQLserver和SQL语言, Traact—SQL、存储过程和触发器,数据库保护机制;第三篇应用开发vB.NET程序设计基础,AD0.NET与数据库访问技术和数据库应用系统开发。第4篇实践,包括10个实验,目的是培养学生的VB.NET程序设计技能、融Traact—SQL、存储过程、触发器、视图为一体的数据库操纵和管理技能以及基于ADO.NET的数据库访问技能;实验十是一个大作业,要求学生运用本书介绍的所有数据库设计技术、管理技术和访问技术开发一个实际的数据库应用系统,以求达到实践和创新能力的提高。本书内容全面翔实,技术求新务实,实
廉启国编著的《Stata数据统计分析教程》定位 为Stata入门级的书籍,以Windows平台下Stata 13 .1 MP版本为基准,围绕数据访问、数据管理、数据 呈现和数据分析4个核心问题进行了详细阐述(并介绍 了大量实用且免费的第三方命令)。此外,本书还介 绍了Stata编程以便提高用户日常科研工作效率并介 绍了工作流程以有助于用户更好地实施项目管理(含 数据的加密和恢复)。最后,本书通过两章对近年来 比较热门的Meta分析和日常科研中频繁使用的样本量 估计进行了介绍。
本书引入真实的案例, 以提供优质的数据分析服务、 撰写高质量的数据分析报告为目标。在阐述数据分析时, 力求以系统的观念从所研究主题的整体着眼, 综合不同的分析角度、 数据处理方式、 分析方法和分析工具, 以揭示数据更本质的特点和更深层次的规律。书中以实际案例为背景, 说明综合采用统计方法、 数据挖掘方法进行数据分析的主要问题。 本书适合学过数据分析基础知识的读者阅读,也可供大学生、初入数据分析职场人员、参与CDA考试的人员学习使用。
《数据挖掘概念与技术》(英文版)(第2版)版曾被KDnuggets的读者评选为欢迎的数据挖掘专著,是一本可读性的教材。它从数据库角度全面系统地介绍了数据挖掘的基本概念、基本方法和基本技术以及数据挖掘的技术研究进展,重点关注其可行性、有用性、有效性和可伸缩性问题。但是,自版出版之后,数据挖掘领域的研究又取得了很大的进展,开发出了新的数据挖掘方法、系统和应用。第2版在这一方面进行了加强,增加了多个章节讲述的数据挖掘方法,以便能够挖掘出复杂类型的数据,包括流数据、序列数据、图结构数据、社群网络数据和多重关系数据。 《数据挖掘概念与技术》(英文版)(第2版)主要特点 全面实用地论述了从实际业务数据中抽取出的读者需要知道的概念和技术。 更新并结合了来自读者的反馈、数据挖掘领域的技术变化以及统计和机器学习