本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
本书主要以OpenTSDB的很新版本(2.3.1版本)为基础进行介绍。章从OpenTSDB的入门开始,介绍市面上多种时序数据库和云端时序数据库,OpenTSDB的基础概念、源码环境搭建及Grafana的基本使用等。第2章主要介绍OpenTSDB的网络层,涉及Java NIO基础、Netty基本使用,分析了OpenTSDB网络层的架构和实现。第3章介绍OpenTSDB中UniqueId组件的原理,主要讲解如何实现UID与字符串之间的映射。第4章介绍OpenTSDB如何实现时序数据的存储及相关优化。第5章介绍OpenTSDB如何实现时序数据的查询,其中分析了OpenTSDB查询中每个步骤的实现。第6章和第7章主要介绍OpenTSDB中的元数据及Tree结构的实现和功能。第8章主要分析OpenTSDB中的插件及工具类实现原理。
本书以大数据为研究背景,系统分析了传统数据技术当前存在的问题以及面临的挑战,并对比了当前主流的面向大数据的数据库解决方案,在此基础上阐述了笔者的研究工作:基于MapReduce平台高处处理大数据的OLAP研究。书中反应了当前大规模数据仓库研究的热点和成果,值得大数据研究的人员参考和应用。
本书内容简介:数据挖掘和文本挖掘是当前信息技术中的一个重要研究领域;将遗传算法和社会演化算法应用于数据及文本挖掘方法研究,具有较大的理论意义和实用价值本书研究了基于遗传算法和社会演化算法的数据挖掘和文本挖掘方法,主要包括数据挖掘和文本挖掘中的属性约简问题、聚类问题,并将其应用于产品研发决策中所做主要工作包括:提出一种基于遗传算法和k-medoids算法的新的聚类方法;采用遗传算法和模式聚合进行文本特征降维;采用遗传算法和潜在语义索引进行文本特征降维;采用社会演化算法进行聚类;采用混沌社会演化算法进行聚类;采用改进的遗传算法和社会演化算法进行文本聚类研究;将文本挖掘应用到产品研发决策中,构建产品研发文本知识地图,以期提高产品研发的效率和质量。
近年来,随着Web技术的发展和应用的普及,大量用户将线下行为转移到线上进行,并且通过各种社会媒体随时随地进行社会交互和情感表达。这些海量的社会行为形成的大数据,催生了社会计算这个新的跨学科的研究和应用领域。《清华大学学术专著·社会计算:用户在线行为分析与挖掘》在大数据的时代背景和社会计算的框架下,介绍从大量用户在线行为数据中发现其中隐含的用户行为模式和兴趣偏好的方法和技术。全书主要内容分为7个部分,分别介绍用户在线搜索行为、网上购物行为、浏览行为、社会标注行为、评论行为以及社交行为等方面的数据分析技术和方法,涉及搜索意图的分析、购物模式的发现、周期行为的挖掘、标签的有效聚类、评论意见的挖掘、用户偏好的发现、个性化方法、链接分析以及社会网络的分析方法等研究内容。 《清华大学学术专
《不确定信息的处理与知识挖掘》在作者对粗糙集相关理论进行研究及应用的基础上,系统论述了不确定信息的处理与知识挖掘理论、方法体系,囊括了包含作者近期成果在内的一些先进模型、算法和实例。主要内容包括:基于广义决策系统分割点区分度的连续属性离散化方法、基于改进粒子群优化的连续属性离散化方法、基于相对分辨矩阵和信息熵的属性约简算法、基于属性区分频度的约简改进算法、基于全局寻优的完备信息系统知识获取算法、基于相容矩阵计算的不完备信息系统知识获取算法,后介绍了不确定信息的处理在城市交通领域中的应用研究。
数据库的性能优化一直是DBA日常工作中非常重要的组成部分,然而很多DBA在学习了大量技术,参加了大量培训后,仍然会在实际工作中遇到难以下手的问题。实际上,在数据库优化工作中,方法和思路远比技术实现重要得多。 《DBA的思想天空:感悟Oracle数据库本质》重在介绍Oracle数据库的性能调优方法及相应的工作思路,但并不拘泥于技术细节。作者通过大量真实案例,深度剖析了相关技术原理,同时还阐述了理论知识在实践中的应用方法。优化工作的本质其实就是透过表象探寻根源,解决问题实现调优,正所谓 思路是道,操作方法是技 ,得道是极大的提升,也是DBA的思想精髓。 n
“大数据”一词已成为当下最热门的词汇之一。人们热切期待大数据能给工作、学习和生活等方面带来的变化,而大数据的采集、存储、计算、分析挖掘、呈现和安全等技术正是实现这一变化的关键。《大数据技术全解:基础、设计、开发与实践》的重点不在于对大数据技术的原理性介绍,而是从实战角度出发,系统地阐述如何基于Hadoop开源软件为客户设计、安装和开发一个大数据系统。《大数据技术全解:基础、设计、开发与实践》还着重分享了具体实践中的一些案例,不仅对于从事大数据系统开发的IT技术人员具有珍贵的参考价值,而且对准备实施大数据系统项目的企业级客户也具有指导作用。 《大数据技术全解:基础、设计、开发与实践》可以作为计算机软件专业的本科生和研究生的大数据技术教材,也可作为大数据技术开发培训、大数据系统咨询规划
本书从Power BI的基础功能讲起,逐步深入到Power BI进阶实战,以业务案例为导向,以Power BI桌面版操作为基础进行讲解,深入讲述Power BI在各个业务部门的应用。本书包括7篇共21章内容,分业务场景进行讲解。篇用1章内容讲述Power BI基础操作,方便读者快速入门;第2篇用4章内容讲述如何用Power BI爬取天气、电影、销售、股票等数据;第3篇用4章内容讲述销售部门如何用Power BI分解销售目标,分析业绩达成、会员RFM和业绩构成;第4篇用5章内容讲述产品相关应用,包括存货分析、帕累托分析、关联分析、款分析和数据化陈列;第5篇用2章内容讲述在财务方面的应用,包括盈亏平衡分析和上市公司利润表分析;第6篇用3章内容讲述人力资源应用,包括人员结构及离职率分析、新员工分析和考勤分析;第7篇用2章内容讲述简化报告的技巧。
《数据科学导引》是博雅大数据学院针对新开设的“数据科学与大数据技术”专业编写的数据科学导论课程教材。 《数据科学导引》内容共分十五章,包括绪论、数据预处理、回归模型、分类模型、集成模型、聚类模型、关联规则挖掘、降维、特征选择、EM算法、概率图模型、文本分析、图与网络分析、深度学习、分布式计算。附录部分对相关的基础知识做了简要介绍。 《数据科学导引》还提供了大量的数据分析实践案例,有助于加深读者对理论知识的理解,及培养其实际应用能力。 《数据科学导引》可作为全国高等学校数据科学相关专业的本科生和研究生教材,也可供从事相关工作的技术人员参考使用。
本书由浅入深、循序渐进地介绍了微软公司推出的数据库管理系统——中文版Microsoft SQL Server 2005系统的操作方法和使用技巧。全书共分13章,分别介绍了数据库技术的基础知识、Microsoft SQL Server 2005系统的安装和配置、Transact-SQL语言、安全性管理、管理数据库文件、备份和还原、数据类型和表、操纵表中数据、索引管理、查询优化技术、视图、存储过程、触发器、用户定义函数、数据完整性、自动化管理任务、系统监视和调整等内容。 本书内容丰富,结构清晰,语言简练,图文并茂,具有很强的实用性和可操作性,是一本适合于大中专院校、职业院校及各类社会培训学校的教材,也是广大初、中级电脑用户的自学参考书。
《MySQL从入门到精通》从初学者角度出发,通过通俗易懂的语言以及丰富多彩的实例,详细介绍了MySQL开发应该掌握的各方面技术。《MySQL从入门到精通》共分为4篇23章,包括数据库基础,初识MySQL,使用MySQL图形化管理工具,数据库操作,存储引擎及数据类型,操作数据表,MySQL基础,表数据的增、删、改操作,数据查询,常用函数,索引,视图,数据完整性约束,存储过程与存储函数,触发器,事务的应用,事件,备份与恢复,MySQL性能优化,权限管理及安全控制,PHP管理MySQL数据库中的数据,Apache PHP MySQL实现网上社区,Struts 2 Spring Hibernate MySQL实现网络商城等内容。所有知识都结合具体实例进行介绍,涉及的程序代码也给出了详细的注释,可以使读者轻松领会MySQL的精髓,快速提高开发技能。 《MySQL从入门到精通》内容详尽,实例丰富,非常适合作为编程初学
本书详细地介绍使用 Access 开发数据库系统的知识、技术与实际应用。全书共 13 章,每一章都是一个独立的主题,以数据库系统的开发流程来组织各章内容和排列顺序,有助于梳理 Access 知识体系和数据库开发流程。本书内容包括 Access 数据库术语、数据库对象及其视图、Access 界面环境的使用与定制、数据库的整体设计流程、创建数据库和表、设计表结构、设置表的主键和索引、创建表之间的关系、在数据表视图中操作数据、使用查询操作数据、使用窗体显示和编辑数据、使用报表呈现与打印数据、使用表达式和 SQL 语句、使用宏让操作自动化、管理和维护数据库等内容,最后一章介绍了开发一个数据库管理系统的具体方法和步骤。 为了帮助读者更好地理解在开发数据库的过程中涉及的 Access 知识和技术,本书提供了 72 个案例,读者可以在学习过程中多加练习,不
《数据库技术与应用(Access2010)/普通高等教育计算机基础课程规划教材》以目前普遍使用的Access2010版本为基础编写,全书共分7章,主要内容包括:数据库基础、表的创建和使用、查询、窗体、报表、宏、模块和VBA编程。 《数据库技术与应用(Access2010)/普通高等教育计算机基础课程规划教材》编写结构合理、层次分明、语言清晰简明,难点分散,采用较多的实例详细讲解了数据库中各个对象的具体操作。在每一章的末尾,收集了较多的习题,可帮助读者在短时间内把握主要内容、掌握知识要点。 《数据库技术与应用(Access2010)/普通高等教育计算机基础课程规划教材》适合作为各类普通高等院校数据库应用课程的教材,也可以作为全国计算机等级考试二级Access的教材,以及培训班的教学用书或自学参考书。
本书详细介绍了数据库原理、方法及其应用开发技术。全书共分12章,分别介绍了数据库系统原理概论、microsoft sqlserver2005系统概述、sql语言概述、transact?sql程序设计基础、sql高级功能、数据库的安全管理、数据库的故障和恢复、数据转换、关系数据库规范化理论、数据库设计与实施、ado.访问数据库技术、在线考试系统开发实例等内容。同时书中以c#作为开发平台详细讲述了ado.访问数据库开发的全过程,最后书中介绍了一个在线考试系统开发实例。本书在讲述理论的同时与sqlserver 2005有机结合,使理论与实践同步,同时介绍了使用ado.和c#开发数据库应用程序的基本方法和技术。 本书既可作为普通高等学校相关专业的教材,也可作为软件学院、成人教育和自学考试同名课程的教材和教学参考书,还可供it领域的科技人员参考。
如果你是一名有经验的开发者并对开发以数据为中心的iPhone和iPad应用程序感兴趣,那么《iOS数据库应用编程(第2版)》恰好适合你。这本必须拥有的书进行了新的充分修订,并且在结构上对应企业应用程序的数据流。该书作者Patrick Alessi经验丰富,他先向你演示了如何从大规模数据库获取数据并将数据放入设备上和显示该数据。然后讲解了如何直接在设备上建立数据,并和Web服务通信。在本书的,你将能自信地为iPhone和iPad实现数据驱动应用程序并将iOS应用程序和现有的企业系统集成。