本书主要以OpenTSDB的很新版本(2.3.1版本)为基础进行介绍。章从OpenTSDB的入门开始,介绍市面上多种时序数据库和云端时序数据库,OpenTSDB的基础概念、源码环境搭建及Grafana的基本使用等。第2章主要介绍OpenTSDB的网络层,涉及Java NIO基础、Netty基本使用,分析了OpenTSDB网络层的架构和实现。第3章介绍OpenTSDB中UniqueId组件的原理,主要讲解如何实现UID与字符串之间的映射。第4章介绍OpenTSDB如何实现时序数据的存储及相关优化。第5章介绍OpenTSDB如何实现时序数据的查询,其中分析了OpenTSDB查询中每个步骤的实现。第6章和第7章主要介绍OpenTSDB中的元数据及Tree结构的实现和功能。第8章主要分析OpenTSDB中的插件及工具类实现原理。
大数据是当前流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。 张俊林著的这本《大数据日知录:架构与算法》从架构与算法的角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层出不穷的新架构、新系统等。本书对众多纷繁芜杂的相关技术文献和系统进行了择优汰劣并系统性地对相关知识分门别类地进行整理和介绍,将大数据相关技术分为大数据基础理论、大数据系统体系结
本书是目前有关数据挖掘在数据化运营实践领域比较全面和系统的著作,也是诸多数据挖掘书籍中为数不多的穿插大量真实的实践应用案例和场景的著作,更是创造性地针对数据化运营中不同分析挖掘课题类型,推出一一对应的分析思路集锦和相应的分析技巧集成,为读者提供“菜单化”实战锦囊的著作。作者结合自己数据化运营实践中大量的项目经验,用通俗易懂的“非技术”语言和大量活泼生动的案例,围绕数据分析挖掘中的思路、方法、技巧与应用,全方位整理、总结、分享,帮助读者深刻领会和掌握“以业务为核心,以思路为重点,以分析技术为辅佐”的数据挖掘实践应用宝典。全书共19章,分为三个部分:基础篇(~4章)系统介绍了数据分析挖掘和数据化运营的相关背景、数据化运营中“协调配合”的核心,以及实践中常见分析项目类型;实战篇(第6~
本书是使用Spark进行大规模数据分析的实战宝典,由大数据公司Cloudera的数据科学家撰写。四位作者首先结合数据科学和大数据分析的广阔背景讲解了Spark,然后介绍了用Spark和Scala进行数据处理的基础知识,接着讨论了如何将Spark用于机器学习,同时介绍了常见应用中几个常用的算法。此外还收集了一些更加新颖的应用,比如通过文本隐含语义关系来查询Wikipedia或分析基因数据。
《Spark大数据处理技术》是一本全面介绍Spark及Spark生态圈相关技术的书籍,是国内首本深入介绍Spark原理和架构的技术书籍。主要内容有Spark基础功能介绍及内部重要模块分析,包括部署模式、调度框架、存储管理以及应用监控;同时也详细介绍了Spark生态圈中其他的软件和模块,包括SQL处理引擎Shark和SparkSQL、流式处理引擎SparkStreaming、图计算框架Graphx以及分布式内存文件系统Tachyon。《Spark大数据处理技术》从概念和原理上对Spark核心框架和生态圈做了详细的解读,并对Spark的应用现状和未来发展做了一定的介绍,旨在为大数据从业人员和Spark爱好者提供一个更深入学习的平台。 《Spark大数据处理技术》适合任何大数据、Spark领域的从业人员阅读,同时也为架构师、软件开发工程师和大数据爱好者展现了一个现代大数据框架的架构原理和实现细节。相信通过学习《Sp
这是一本依据技术版本,系统、全面、详细讲解Spark的著作,作者结合自己在微软和IBM的实践经验和对Spark源代码的研究撰写而成。首先从技术层面讲解了Spark的体系结构、工作机制、安装与部署、开发环境搭建、计算模型、Benchmark、BDAS等内容;然后从应用角度讲解了一些简单的、有代表性的案例;对Spark的性能优化进行了探讨。
《Druid实时大数据分析原理与实践》内容提要 Druid 作为一款开源的实时大数据分析软件,最近几年快速全球互联网公司,特别是对于海量数据和实时性要求高的场景,包括广告数据分析、用户行为分析、数据统计分析、运维监控分析等,在腾讯、阿里、优酷、小米等公司都有大量成功应用的案例。《Druid实时大数据分析原理与实践》的目的就是帮助技术人员更好地深入理解Druid 技术、大数据分析技术选型、Druid 的安装和使用、特性的使用,也包括一些源代码的解析,以及一些常见问题的快速回答。 Druid 的生态系统正在不断扩大和成熟,Druid 也正在解决越来越多的业务场景。希望本书能帮助技术人员做出更好的技术选型,深度了解Druid 的功能和原理,更好地解决大数据分析问题。《Druid实时大数据分析原理与实践》适合大数据分析的从业人员、IT 人员、互联网从业者
本书共分为三部分。理论篇重点介绍大数据时代下数据处理的基本理论及相关处理技术,并引入NoSQL数据库;系统篇主要介绍了各种类型NoSQL数据库基本知识;应用篇对国内外知名公司在利用NoSQL数据库在处理海量数据方面的应用做了阐述。本书对大数据时代面临的挑战,以及NoSQL数据库的基本知识做了清晰的阐述,有助于帮助读者整理思路,了解需求,并更有针对性、有选择的深入学习相关知识。
谁将是忠实的客户?谁将不是呢?哪些消息对 哪些客户细分?如何化客户的价值?如 何将部的价值化?本书提供了强大的工具,可 以从上述和其他重要商业问题所在的公司数据库中 提取它们的答案。自本书第1版问世以来,数据挖掘 已经日益成为现代商业不可缺少的工具。在沙版本中,作者对每个章节都进行了大量的更新和 修订,并且添加民个新的章节。本书保留了早期版 本的重点,指导市场分析师、业务经理和数据挖掘 专家利用数据挖掘方法和技术来解决重要的商业问 题。在不牺牲准确度的前提下,为了简单起见,即使 是复杂的主题,作者也进行了简洁明了的介绍,并尽 量减少对技术术语或数学公式的使用。每个技术主 题都通过案例研究和源自作者经验的真实案例进行 说明,每章都包含了针对从业者的宝贵提示。书中介 绍
本书共5章,涉及使用SAS EG做数据分析的主要分析方法。其中,章为数据分析方法概述,第2章至第4章为横截面数据分析方法。第5章为时间序列分析方法。每章都根据所涉及的知识点的不同,选取了实用的案例,并为读者准备了相应的思考和练习题。 本书是一本面向商业数据分析初学者的教材,从具体的商业数据分析案例入手,使读者掌握数据分析的目的、理念、思路与分析步骤。本书力图淡化技术,对于方法的介绍也尽量避免涉及过多的数学内容,和高等数学相关的内容只在线形回归和主成分分析这两节中涉及到,而且都辅以图形作形象的展现。因此本书的读者只需要具有高中水平的数学基础即可。
《SOA概念、技术与设计》系统介绍SOA概念、技术与设计。全书共分五部分,分别介绍SOA与Web服务的基本原理,SOA与第二代Web服务规范扩展,SOA与面向服务,构建SCA的计划与分析、技术与设计。《SOA概念、技术与设计》由浅人深,示例翔实,应用大量模式,真正覆盖SOA实质部分。每章配有要点小结,使渎者能更深入理解该章主题。《SOA概念、技术与设计》适合于考虑实施面向服务架构的软件开发者、架构师或项目经理阅读参考。 学习SOA的指南在世界范围所采用的革命性计算平台中,面向服务架构(SOA)处于核心位置,并赢得了主要软件供应商的普遍支持。《SOA概念、技术与设计》是部端到端的SOA教程,逐步指导读者从零开始学习面向服务的建模与设计方法。《SOA概念、技术与设计》通过125个案例研究、300多个模式,详细讲解和分析构建SOA平台的最重要方面:目标
本书由浅入深、循序渐进地介绍了微软公司推出的数据库管理系统——中文版Microsoft SQL Server 2005系统的操作方法和使用技巧。全书共分13章,分别介绍了数据库技术的基础知识、Microsoft SQL Server 2005系统的安装和配置、Transact-SQL语言、安全性管理、管理数据库文件、备份和还原、数据类型和表、操纵表中数据、索引管理、查询优化技术、视图、存储过程、触发器、用户定义函数、数据完整性、自动化管理任务、系统监视和调整等内容。 本书内容丰富,结构清晰,语言简练,图文并茂,具有很强的实用性和可操作性,是一本适合于大中专院校、职业院校及各类社会培训学校的教材,也是广大初、中级电脑用户的自学参考书。
如果你是一名IT工程师,CTO希望你在一周内提交一份公司未来IT系统基础架构的初步建议; 如果你是一位IT营销人员,客户需要你在一周内向他汇报未来大数据系统的大致技术方向; … 在这个信息严重过剩的时代,一周内从浩渺的技术细节的海洋中抓住关键的技术脉络,并进一步提出有一定理论依据的技术思考,这几乎是不可能完成的任务。 您是否想过阅读一本关于大数据的图书帮助解决如上问题? 浩如烟海的大数据领域图书可以大致归纳为三类:第一类是描述大数据的应用前景与社会意义;第二类是研讨大数据作为一个大型IT系统的系统架构与技术架构;第三类是研讨大数据领域的具体技术,例如HADOOP相关的编程等。 对于需要快速掌握大数据系统技术脉络,或者是需要对未来IT系统做系统思考的技术工作者来说,需要的是第二类图
《数据库技术与应用(Access2010)/普通高等教育计算机基础课程规划教材》以目前普遍使用的Access2010版本为基础编写,全书共分7章,主要内容包括:数据库基础、表的创建和使用、查询、窗体、报表、宏、模块和VBA编程。 《数据库技术与应用(Access2010)/普通高等教育计算机基础课程规划教材》编写结构合理、层次分明、语言清晰简明,难点分散,采用较多的实例详细讲解了数据库中各个对象的具体操作。在每一章的末尾,收集了较多的习题,可帮助读者在短时间内把握主要内容、掌握知识要点。 《数据库技术与应用(Access2010)/普通高等教育计算机基础课程规划教材》适合作为各类普通高等院校数据库应用课程的教材,也可以作为全国计算机等级考试二级Access的教材,以及培训班的教学用书或自学参考书。
本书详细介绍了数据库原理、方法及其应用开发技术。全书共分12章,分别介绍了数据库系统原理概论、microsoft sqlserver2005系统概述、sql语言概述、transact?sql程序设计基础、sql高级功能、数据库的安全管理、数据库的故障和恢复、数据转换、关系数据库规范化理论、数据库设计与实施、ado.访问数据库技术、在线考试系统开发实例等内容。同时书中以c#作为开发平台详细讲述了ado.访问数据库开发的全过程,最后书中介绍了一个在线考试系统开发实例。本书在讲述理论的同时与sqlserver 2005有机结合,使理论与实践同步,同时介绍了使用ado.和c#开发数据库应用程序的基本方法和技术。 本书既可作为普通高等学校相关专业的教材,也可作为软件学院、成人教育和自学考试同名课程的教材和教学参考书,还可供it领域的科技人员参考。
本书详细地介绍使用 Access 开发数据库系统的知识、技术与实际应用。全书共 13 章,每一章都是一个独立的主题,以数据库系统的开发流程来组织各章内容和排列顺序,有助于梳理 Access 知识体系和数据库开发流程。本书内容包括 Access 数据库术语、数据库对象及其视图、Access 界面环境的使用与定制、数据库的整体设计流程、创建数据库和表、设计表结构、设置表的主键和索引、创建表之间的关系、在数据表视图中操作数据、使用查询操作数据、使用窗体显示和编辑数据、使用报表呈现与打印数据、使用表达式和 SQL 语句、使用宏让操作自动化、管理和维护数据库等内容,最后一章介绍了开发一个数据库管理系统的具体方法和步骤。 为了帮助读者更好地理解在开发数据库的过程中涉及的 Access 知识和技术,本书提供了 72 个案例,读者可以在学习过程中多加练习,不
本书的主要内容包括金融工程导论、金融工程定价方法及其R语言函数计算、远期合约及其R语言函数计算、期货合约及其R语言函数计算、期货套期保值及其R语言函数计算、互换合约及其R语言函数计算、期权合约及其策略、Black Scholes期权定价方法及其R语言函数计算、蒙特卡罗模拟法期权定价及其R语言函数计算、二叉树法期权定价及其R语言函数计算、有限差分法期权定价及其R语言函数计算、利率衍生证券及其R语言函数计算以及奇异期权及其R语言函数计算,本书的最后提供了关于R语言的两个附录。本书内容新颖、全面,实用性强,融理论、方法、应用于一体,是一本供金融工程、金融数学、计算金融、量化金融、投资学、金融学、保险学、金融专业硕士、经济学、统计学、数量经济学、管理科学与工程、应用数学、计算数学、概率论与数理统计等专业的本科高年
《数据库管理与应用》主要以实际工作过程为导向,坚持“校企合作、工学交替”的方向,以学生易于就业为最终目标,以企业用人标准为依据进行编写,并通过理论与实训相结合的教学方式,全面介绍了数据库管理与应用技术。《数据库管理与应用》共分为7个学习情境:学习情境一为熟悉、安装和配置数据库,学习情境二介绍数据库设计与创建,学习情境三介绍数据库安全管理,学习情境四介绍数据库性能监测和日常维护,学习情境五讲解数据库的操纵,学习情境六讲述T-SQL语言及其应用,学习情境七通过一个综合案例讲述数据库系统的编程和测试,使学生对前面所学知识融会贯通。 本教材根据完成职业岗位的实际工作任务所需知识、能力、素质等方面的要求来选取教材内容,并以真实的工作任务及其工作过程为依据整合、优化教材内容,强调掌握实用的数
《数据科学导引》是博雅大数据学院针对新开设的“数据科学与大数据技术”专业编写的数据科学导论课程教材。 《数据科学导引》内容共分十五章,包括绪论、数据预处理、回归模型、分类模型、集成模型、聚类模型、关联规则挖掘、降维、特征选择、EM算法、概率图模型、文本分析、图与网络分析、深度学习、分布式计算。附录部分对相关的基础知识做了简要介绍。 《数据科学导引》还提供了大量的数据分析实践案例,有助于加深读者对理论知识的理解,及培养其实际应用能力。 《数据科学导引》可作为全国高等学校数据科学相关专业的本科生和研究生教材,也可供从事相关工作的技术人员参考使用。
商业智能时代已经全面到来,分析型人才的岗位数量在就业市场中呈现井喷式增长。无论是从事产品研发的工程师,还是从事产品推广的市场人员、人力资源和财务会计人员,都需要掌握数据分析技术,否则很有可能被人工智能替代。 本书包括18章,涉及使用R语言做数据分析和数据挖掘的主要分析方法。其中,、2章为数据分析方法概述,第3章为R语言编程基础,第4章到第8章为统计学习方法,第9章到6章为数据挖掘方法,7章为特征工程,8章为R文本挖掘。每章都根据所涉及的知识点的不同,选取了实用的案例,并为读者准备了相应的练习题。 本书作为CDA数据分析师系列丛书中《如虎添翼!数据处理的SPSS和SASEG实现(第2版)》和《胸有成竹!数据分析的SPSS和SASEG进阶(第2版)》的姊妹篇,将前两本书的内容进行整合并做了重大拓展,而且秉承了该系列丛书的特点:内
唐剑锋编著的《大型主机数据库系统管理基础与应用开发》是大型主机系列课程的主干教材,全书共分12章,主要从应用的角度介绍了现代大型主机数据库系统的相关概念、知识及技能。 《大型主机数据库系统管理基础与应用开发》简要介绍了SQL语句的基础知识,比较了主机平台DB2和LUW平台DB2的基本概念,主机DB2的内部结构和处理机制、基本对象管理的知识和技能,数据备份与复原的基本知识,数据迁移的基本知识,并简要介绍了表空间级统计信息搜集和更新的基本知识,以案例的方式探讨了主机DB2锁的基本概念和知识,简要介绍了主机DB2权限管理的基本技能,探讨了DB2forLUW与DB2forz/OS互连的基本知识和技能,最后以大量样例的方式介绍了COBOL嵌入式应用程序开发的基本知识和技能。 《大型主机数据库系统管理基础与应用开发》可作为高等院校计算机学院、软件学
本书为普通高等教育“十一五”规划教材,是电力企业信息化系列教材之一。 本书全面深入介绍了数据仓库、联机分析处理(OLAP)和数据挖掘的基本概念、工具及实际应用。全书分成三篇,数据仓库与数据挖掘原理篇的主要内容包括数据仓库的基本概念和结构、创建过程、联机分析处理、数据挖掘的基本概念和方法等;数据仓库与数据挖掘工具篇介绍几个现在市场上主流的数据仓库和数据挖掘工具,包括ETL工具Data Stage、商务智能工具 Congos和数据挖掘工具SAS;数据仓库与数据挖掘应用篇以某电力公司为例介绍一个数据仓库应用系统的建设过程,包括系统需求分析、系统架构设计、数据模型设计、数据库规划、ETL开发等。 本书可作为计算机、信息管理与信息系统等相关专业的学生学习数据仓库、OLAP及数据挖掘技术的实用教程,也可供从事数据仓库、数据挖掘