《从零进阶!数据分析的统计基础(第2版)》 共 6 章,分别讲解了数据分析的步骤和方法、描述性统计分析、抽样估计、假设检验、方差分析、 相关与回归分析,使用简单的语言介绍了这些数据分析基本方法的核心思想和涉及的统计学、概率论等方面 的理论内容,并使用图示的方法详细介绍了使用 Excel 2013 进行简单的描述性统计分析和使用 SPSS 进行相 关的数据分析的过程与结果分析。
大数据是当前流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。 张俊林著的这本《大数据日知录:架构与算法》从架构与算法的角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层出不穷的新架构、新系统等。本书对众多纷繁芜杂的相关技术文献和系统进行了择优汰劣并系统性地对相关知识分门别类地进行整理和介绍,将大数据相关技术分为大数据基础理论、大数据系统体系结
本书主要以OpenTSDB的很新版本(2.3.1版本)为基础进行介绍。章从OpenTSDB的入门开始,介绍市面上多种时序数据库和云端时序数据库,OpenTSDB的基础概念、源码环境搭建及Grafana的基本使用等。第2章主要介绍OpenTSDB的网络层,涉及Java NIO基础、Netty基本使用,分析了OpenTSDB网络层的架构和实现。第3章介绍OpenTSDB中UniqueId组件的原理,主要讲解如何实现UID与字符串之间的映射。第4章介绍OpenTSDB如何实现时序数据的存储及相关优化。第5章介绍OpenTSDB如何实现时序数据的查询,其中分析了OpenTSDB查询中每个步骤的实现。第6章和第7章主要介绍OpenTSDB中的元数据及Tree结构的实现和功能。第8章主要分析OpenTSDB中的插件及工具类实现原理。
近年来,随着Web技术的发展和应用的普及,大量用户将线下行为转移到线上进行,并且通过各种社会媒体随时随地进行社会交互和情感表达。这些海量的社会行为形成的大数据,催生了社会计算这个新的跨学科的研究和应用领域。《清华大学学术专著·社会计算:用户在线行为分析与挖掘》在大数据的时代背景和社会计算的框架下,介绍从大量用户在线行为数据中发现其中隐含的用户行为模式和兴趣偏好的方法和技术。全书主要内容分为7个部分,分别介绍用户在线搜索行为、网上购物行为、浏览行为、社会标注行为、评论行为以及社交行为等方面的数据分析技术和方法,涉及搜索意图的分析、购物模式的发现、周期行为的挖掘、标签的有效聚类、评论意见的挖掘、用户偏好的发现、个性化方法、链接分析以及社会网络的分析方法等研究内容。 《清华大学学术专
数据库的性能优化一直是DBA日常工作中非常重要的组成部分,然而很多DBA在学习了大量技术,参加了大量培训后,仍然会在实际工作中遇到难以下手的问题。实际上,在数据库优化工作中,方法和思路远比技术实现重要得多。 《DBA的思想天空:感悟Oracle数据库本质》重在介绍Oracle数据库的性能调优方法及相应的工作思路,但并不拘泥于技术细节。作者通过大量真实案例,深度剖析了相关技术原理,同时还阐述了理论知识在实践中的应用方法。优化工作的本质其实就是透过表象探寻根源,解决问题实现调优,正所谓 思路是道,操作方法是技 ,得道是极大的提升,也是DBA的思想精髓。 n
大数据是“在多样的或者大量的数据中快速获取信息的能力”。 大数据是一种思维方式,必须融入到企业的每一个毛细血管中。大数据时代已经到来,正在引发一场革命! 大数据正以的速度颠覆人们探索世界的方法,引起社会、经济、学术、科研、国防、军事等领域的深刻变革。 数据成为资产、产业垂直整合、泛互联网化是大数据时代的三大发展趋势。 大数据是“在多样的或者大量的数据中快速获取信息的能力”。 大数据是一种思维方式,必须融入到企业的每一个毛细血管中。大数据时代已经到来,正在引发一场革命! 大数据正以的速度颠覆人们探索世界的方法,引起社会、经济、学术、科研、国防、军事等领域的深刻变革。 数据成为资产、产业垂直整合、泛互联网化是大数据时代的三大发展趋势。 数据资产成为和土地、资本、人力并驾齐驱的关键生产要
本书是机器学习和数据挖掘领域的经典教材,被众多国外名校选为教材。书中详细介绍用于数据挖掘领域的机器学习技术和工具以及实践方法,并且提供了一个公开的数据挖掘工作平台Weka。本书主要内容包括:数据输入/输出、知识表示、数据挖掘技术(决策树、关联规则、基于实例的学习、线性模型、聚类、多实例学习等)以及在实践中的运用。本版对上一版内容进行了全面更新,以反映自第2版出版以来数据挖掘领域的技术变革和新方法,包括数据转换、集成学习、大规模数据集、多实例学习等,以及新版的Weka机器学习软件。
本书由实战经验丰富的数据中心运维达人、专家,以运维人手记的方式,分享这些年踩过的坑、蹚过的雷,不成功经验,还有对挫折和教训的反思,甚至还有惊心动魄的数据中心火灾救援过程。内容分为两大部分,“运维人手记”和“关键设备运维指南”。部分是通过虚拟人物——运维人Peter和Tom,以小说体的形式介绍运维人员在实际工作中会经历的那些事儿。首次汇聚了业内运维精英的实操案例,有助于运维人员从别人的教训中吸收经验,降低自己犯错的概率。第二部分是由数据中心核心设备供应商们讲述数据中心的主要设备在运维过程中需要注意的要点,体现了厂商的多年技术积累和经验之谈,有助于运维人员提升设备维护水平。 本书适合数据中心运维工作人员、企业管理者,以及对信息系统和数据中心运维感兴趣的各界人士阅读。
本书分为两部分,共10章,从架构到管理,从自动化测试到持续集成,通过丰富的工作实例,系统而深入地讲解敏捷DW/BI的基本原理、关键技术和项目管理实践,为在真实商业智能和数据仓库项目上应用敏捷分析方法提供系统使用指南。从管理角度,详细介绍敏捷分析的基本原则,敏捷项目管理的有效实践,包括章程、规划、执行和检测敏捷分析项目的有效实践,展现如何使用案例和用户故事驱使价值持续传递,并讲解团队管理和领导的敏捷风格如何有效地替代传统命令控制风格;从技术角度,深入讲解能够持续传递商业价值并有质量保障的技术方法,包括设计推进、测试驱动的数据仓库开发、版本控制和项目自动化,以及应用敏捷分析时的一些注意事项。本书内容全面,讲解深入,并且涵盖许多经过实践检验的解决方案,适合IT决策者、数据仓库专业人士、数据库
本书共11章,章主要讲述虚拟化安全的基本理论;第2章阐释如何配置常用的管理程序平台:VMwareESXi、MicrosoftHyper-V和CitrixXenServer等;第3章讲述如何设计安全的虚拟网络,涉及虚拟网络与物理网络、虚拟网络安全考虑因素等;第4章讲述高级虚拟网络操作,内容包括网络运营挑战和解决方案,虚拟环境中的负载均衡等;第5章讲述虚拟化管理和客户端安全,涉及保护VMwarevCenter、MicrosoftSCVMM和CitrixXenCenter相关的内容;第6章讲述如何保护虚拟机,涉及安全考虑因素、威胁,虚拟机的缺陷等;第7章讲述日志和审计方面的实践,涉及日志和审计的重要意义、虚拟日志和审计选项,以及与现有日志平台集成和有效的日志管理;第8章讲述虚拟化安全的变更和配置管理,内容包括虚拟机如何影响变更和配置管理,将虚拟化集成到变更管理,虚拟化配置管理的佳实践等;第9章讲述如何
数据库原理课程不仅是大学计算机及相关专业的必修主干课程,也是其他许多专业学生的选修课程。同时,随着数据库系统的深入发展各类人员对数据库理论与技术的需求也在不断增加。因此,需要编写一本既有原理又具应用,同时又能较好地适应新技术发展的数据库教材。 编写本书的指导思想是帮助学生掌握数据库系统的基本原理、技术和方法,了解现代数据库系统的特点及发展趋势,接受用所学知识解决实际问题的基本训练,培养学生研究和设计数据库系统的能力,为后续专业课程及开发应用打下良好的基础。
通过做数据分析学习数据分析 《数据挖掘与预测分析(第2版)》提供了从数据准备到探索性数据分析、数据建模及模型评估等整个数据分析过程的内容。《数据挖掘与预测分析(第2版)》不仅提供了理解软件底层算法的“白盒”方法,而且提供了能够使读者利用现实世界数据集开展数据挖掘与预测分析的应用方法。第2版的新内容: 添加了500多页的新内容,包括20个新章节,例如,数据建模准备、成本-效益分析、缺失数据填充、聚类优劣度量以及细分模型等。 针对前沿主题的新章节,例如,多元分类模型、BIRCH聚类、集成学习(bagging及boosting)、模型投票与趋向平均等。 每章节后均附有R语言开发园地,读者可以获得完成书中分析所需的R语言源代码,以及通过R代码生成的图、表和结果。 书中的附录为那些对统计基础生疏的读者提供了了解基本概念的材料。 超过750个章
《Spark大数据处理技术》是一本全面介绍Spark及Spark生态圈相关技术的书籍,是首本深入介绍Spark原理和架构的技术书籍。主要内容有Spark基础功能介绍及内部重要模块分析,包括部署模式、调度框架、存储管理以及应用监控;同时也详细介绍了Spark生态圈中其他的软件和模块,包括SQL处理引擎Shark和SparkSQL、流式处理引擎SparkStreaming、图计算框架Graphx以及分布式内存文件系统Tachyon。《Spark大数据处理技术》从概念和原理上对Spark核心框架和生态圈做了详细的解读,并对Spark的应用现状和未来发展做了的介绍,旨在为大数据从业人员和Spark爱好者提供一个更深入学习的平台。 《Spark大数据处理技术》适合任何大数据、Spark领域的从业人员阅读,同时也为架构师、软件开发工程师和大数据爱好者展现了一个现代大数据框架的架构原理和实现细节。相信通过学习《Spark大数据
本书是“面向对象建模与设计”领域的经典著作。全书由四个部分组成。个部分以一种高层的、独立于语言的方式描述面向对象的概念,以及UML表示法;第二部分从问题陈述到分析、系统设计和类设计,一步一步地描述了软件开发的面向对象方法学;第三部分用面向对象语言和关系数据库描述了面向对象设计的实现;第四部分描述了成功的面向对象开发所需要的软件工程实践。本书还配有丰富的习题,覆盖了一系列应用领域以及实现目标,而且在书的后面给出了部分习题的答案。 本书可以作为高年级本科生或研究生软件工程或面向对象技术课程的教材,也可以供相关技术人员参考。
本书是《Oracle . Edwards技术与应用丛书》系列丛书的基础篇,全书共分五章,通过介绍信息化的概念和内容,从而引出企业信息化的ERP的概念,及在企业实现ERP的软件应用系统Oracle . Edwards EnterpriseOne系统。进而以企业应用. Edwards EnterpriseOne为主线,通过一些模拟企业的使用场景,让读者学习. Edwards EnterpriseOne的基本应用功能、财务、分销和生产管理的使用方法、. Edwards的项目实施方法学和. Edwards OBA(Oracle Business Accelerated )(Oracle业务加速器)。本书兼顾需要Oracle . Edwards EnterpriseOne知识的各类相关读者,它是Oracle . Edwards EnterpriseOne系统的入门指南,通过阅读本书,读者可以对E有一个直观和感性的认识。 本书内容选择得当、深浅适中,是学习Oracle . Edwards EnterpriseOne系统的一本理想的入门书,可作为计算机类、管理类高年级本科生、研究生学习Oracle . Edwards EnterpriseOne软件系