《从零进阶!数据分析的统计基础(第2版)》 共 6 章,分别讲解了数据分析的步骤和方法、描述性统计分析、抽样估计、假设检验、方差分析、 相关与回归分析,使用简单的语言介绍了这些数据分析基本方法的核心思想和涉及的统计学、概率论等方面 的理论内容,并使用图示的方法详细介绍了使用 Excel 2013 进行简单的描述性统计分析和使用 SPSS 进行相 关的数据分析的过程与结果分析。
大数据是当前流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。 张俊林著的这本《大数据日知录:架构与算法》从架构与算法的角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层出不穷的新架构、新系统等。本书对众多纷繁芜杂的相关技术文献和系统进行了择优汰劣并系统性地对相关知识分门别类地进行整理和介绍,将大数据相关技术分为大数据基础理论、大数据系统体系结
本书主要以OpenTSDB的很新版本(2.3.1版本)为基础进行介绍。章从OpenTSDB的入门开始,介绍市面上多种时序数据库和云端时序数据库,OpenTSDB的基础概念、源码环境搭建及Grafana的基本使用等。第2章主要介绍OpenTSDB的网络层,涉及Java NIO基础、Netty基本使用,分析了OpenTSDB网络层的架构和实现。第3章介绍OpenTSDB中UniqueId组件的原理,主要讲解如何实现UID与字符串之间的映射。第4章介绍OpenTSDB如何实现时序数据的存储及相关优化。第5章介绍OpenTSDB如何实现时序数据的查询,其中分析了OpenTSDB查询中每个步骤的实现。第6章和第7章主要介绍OpenTSDB中的元数据及Tree结构的实现和功能。第8章主要分析OpenTSDB中的插件及工具类实现原理。
本书以大数据为研究背景,系统分析了传统数据技术当前存在的问题以及面临的挑战,并对比了当前主流的面向大数据的数据库解决方案,在此基础上阐述了笔者的研究工作:基于MapReduce平台高处处理大数据的OLAP研究。书中反应了当前大规模数据仓库研究的热点和成果,值得大数据研究的人员参考和应用。
近年来,随着Web技术的发展和应用的普及,大量用户将线下行为转移到线上进行,并且通过各种社会媒体随时随地进行社会交互和情感表达。这些海量的社会行为形成的大数据,催生了社会计算这个新的跨学科的研究和应用领域。《清华大学学术专著·社会计算:用户在线行为分析与挖掘》在大数据的时代背景和社会计算的框架下,介绍从大量用户在线行为数据中发现其中隐含的用户行为模式和兴趣偏好的方法和技术。全书主要内容分为7个部分,分别介绍用户在线搜索行为、网上购物行为、浏览行为、社会标注行为、评论行为以及社交行为等方面的数据分析技术和方法,涉及搜索意图的分析、购物模式的发现、周期行为的挖掘、标签的有效聚类、评论意见的挖掘、用户偏好的发现、个性化方法、链接分析以及社会网络的分析方法等研究内容。 《清华大学学术专
数据库的性能优化一直是DBA日常工作中非常重要的组成部分,然而很多DBA在学习了大量技术,参加了大量培训后,仍然会在实际工作中遇到难以下手的问题。实际上,在数据库优化工作中,方法和思路远比技术实现重要得多。 《DBA的思想天空:感悟Oracle数据库本质》重在介绍Oracle数据库的性能调优方法及相应的工作思路,但并不拘泥于技术细节。作者通过大量真实案例,深度剖析了相关技术原理,同时还阐述了理论知识在实践中的应用方法。优化工作的本质其实就是透过表象探寻根源,解决问题实现调优,正所谓 思路是道,操作方法是技 ,得道是极大的提升,也是DBA的思想精髓。 n
大数据是“在多样的或者大量的数据中快速获取信息的能力”。 大数据是一种思维方式,必须融入到企业的每一个毛细血管中。大数据时代已经到来,正在引发一场革命! 大数据正以的速度颠覆人们探索世界的方法,引起社会、经济、学术、科研、国防、军事等领域的深刻变革。 数据成为资产、产业垂直整合、泛互联网化是大数据时代的三大发展趋势。 大数据是“在多样的或者大量的数据中快速获取信息的能力”。 大数据是一种思维方式,必须融入到企业的每一个毛细血管中。大数据时代已经到来,正在引发一场革命! 大数据正以的速度颠覆人们探索世界的方法,引起社会、经济、学术、科研、国防、军事等领域的深刻变革。 数据成为资产、产业垂直整合、泛互联网化是大数据时代的三大发展趋势。 数据资产成为和土地、资本、人力并驾齐驱的关键生产要
本书是机器学习和数据挖掘领域的经典教材,被众多国外名校选为教材。书中详细介绍用于数据挖掘领域的机器学习技术和工具以及实践方法,并且提供了一个公开的数据挖掘工作平台Weka。本书主要内容包括:数据输入/输出、知识表示、数据挖掘技术(决策树、关联规则、基于实例的学习、线性模型、聚类、多实例学习等)以及在实践中的运用。本版对上一版内容进行了全面更新,以反映自第2版出版以来数据挖掘领域的技术变革和新方法,包括数据转换、集成学习、大规模数据集、多实例学习等,以及新版的Weka机器学习软件。
过去几十年里,Web的迅速发展使其成为世界上规模zui大的公共数据源。Web挖掘的目标是从Web超链接、网页内容和使用日志中探寻有用的信息。 《世界计算机教材精选:Web数据挖掘(第2版)》旨在阐述Web数据挖掘的概念及其核心算法,使读者获得相对完整的关于Web数据挖掘的算法和技术知识。本书不仅介绍了搜索、页面爬取和资源探索以及链接分析等传统的Web挖掘主题,而且还介绍了结构化数据的抽取、信息整合、观点挖掘和Web使用挖掘等内容,这些内容在已有书籍中没有提及过,但它们在Web数据挖掘中却占有非常重要的地位。全书分为两大部分:部分包括第2章到第5章,介绍数据挖掘的基础,第二部分包括第6章到2章,介绍Web相关的挖掘任务。从本书自版出版之后,很多领域已经有了重大的进展。新版大部分的章节都已经添加了新的材料来反应这些进展,主要
本书是《Oracle . Edwards技术与应用丛书》系列丛书的基础篇,全书共分五章,通过介绍信息化的概念和内容,从而引出企业信息化的ERP的概念,及在企业实现ERP的软件应用系统Oracle . Edwards EnterpriseOne系统。进而以企业应用. Edwards EnterpriseOne为主线,通过一些模拟企业的使用场景,让读者学习. Edwards EnterpriseOne的基本应用功能、财务、分销和生产管理的使用方法、. Edwards的项目实施方法学和. Edwards OBA(Oracle Business Accelerated )(Oracle业务加速器)。本书兼顾需要Oracle . Edwards EnterpriseOne知识的各类相关读者,它是Oracle . Edwards EnterpriseOne系统的入门指南,通过阅读本书,读者可以对E有一个直观和感性的认识。 本书内容选择得当、深浅适中,是学习Oracle . Edwards EnterpriseOne系统的一本理想的入门书,可作为计算机类、管理类高年级本科生、研究生学习Oracle . Edwards EnterpriseOne软件系
数据结构是计算机及其相关专业的重要课程,是计算机软件开发及应用人员的专业基础。本书首先介绍数据结构与算法的基础知识,然后系统地论述线性表、栈、队列、串、数组和广义表、树和二又树、图等基本数据结构,并讨论了常用的查找和排序技术。在用例选择方面充分考虑了电子信息类专业特点,尤其突出信息与通信工程相关专业的特色。在各章最后描述了相应的标准模板库(STL),旨在使读者了解STL与数据结构的关系,并且能够掌握各类STL的应用,提高实际应用能力和程序设计的效率。 本书内容丰富、层次清晰、讲解深入浅出,可作为计算机及相关专业,尤其是电子信息类专业本专科数据结构课程的教材,也可供从事计算机软件开发和应用的工程技术人员阅读和参考。
Code Halo(数据场)是围绕在人们、设备、企业和行业周围的数据,通过破译这些数据所提供的信息和洞见,我们能够创造出新的商业模型,抓住此次基于数据场实现的技术变革所带来的巨大机遇,在数据场时代立于不败地位。书中呈现了抓住此次机遇的方式方法,以及如何在自己所处的行业内为此次机遇的到来做好万全的准备,并适时出手抓住这次机遇。
《大数据搜索与日志挖掘及可视化方案(第2版)》提出的分布式大数据搜索与日志挖掘及可视化方案是基于ELK Stack而提出的,它能有效应对海量大数据所带来的分布式存储与处理、全文检索、日志挖掘、可视化等问题。构建在全文检索开源软件Lucene之上的Elasticsearch,不仅能对海量规模的数据完成分布式索引与检索,还能提供数据聚合分析。据国际的数据库产品评测机构DB Engines的统计,在2016年1月,Elasticsearch已超过Solr等,成为排名的搜索引擎类应用;Logstash能有效处理来源于各种数据源的日志信息;Kibana能得出可视化分析结果。了解基于ELK Stack的大数据搜索与日志挖掘及可视化方案,掌握Elasticsearch、Logstash、Kibana的基本使用方法和技巧,很有必要。
《数据结构(c语言版)》在选材与编排上,贴近当前普通高等院校“数据结构”课程的现状和发展趋势,符合研究生考试大纲,内容难度适度,突出实用性和应用性。《数据结构(c语言版)》共8章,内容包括绪论,线性表,栈和队列,串、数组和广义表,树和二叉树,图,查找和排序。《数据结构(c语言版)》采用类c语言作为数据结构和算法的描述语言。 《数据结构(c语言版)》可作为普通高等院校计算机和信息技术相关专业“数据结构”课程的教材使用,也可供从事计算机工程与应用工作的科技工作者参考。
数据库内核是数据库系统稳定运行的心脏,DB2数据库内核庞大而复杂。本书从DB2内核组件入手,同时介绍了其与操作系统在进程、共享内存、信号量之间的关系。作者在《高级进阶DB2:内部结构、高级管理与问题诊断》中重点介绍了各个内部组件的层次与功能、内存体系结构、存储内部结构、高级锁等。优化器是任何数据库执行SQL的关键部分,本书对优化器产生的各种执行计划进行了详细解释,这对于理解DB2内部工作原理大有裨益。同时,本书还介绍了DB2各种诊断工具的使用,各种数据库配置参数的含义及调整、数据库系统视图等。 n 最的DB2图书“三部曲”,DB2从业人员的案头书。 n n
10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍Python数据挖掘建模过程,实践性极强。 本书共15章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。 基础篇(~5章),章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘