当前不乏大数据具体技术组件的书籍,但却很少有从大数据平台整体建设和产品形态的宏观角度入手来阐释的。本书重点介绍大数据开发平台服务构建的整体思路和解决方案,内容涵盖一个成熟的大数据开发平台必不可少的各类核心组件:工作流调度系统、集成开发环境、元数据管理系统、数据交换服务、数据可视化服务、数据质量管理服务,以及测试环境的建设等。书中还凝结了作者多年平台建设的实践经验,以及对大数据相关从业人员能力建设和职业规划的宝贵建议。本书适合广大志在深入了解大数据平台建设、开发和应用的在职人员及院校师生。
随着大数据研究热潮的兴起,各种数据可视化图表层出不穷,大数据生动呈现就成为了具有挑战性的工作,随之出现了大量的可视化软件。本书是基于行业占有率比较高的Microsoft Power BI近期新版本所编写的,详细介绍Microsoft Power BI的数据可视化功能,包括数据类型和运算符、软件的安装、连接数据源、数据基础操作、可视化设计原则、可视化图表、自定义可视化效果、报表、仪表板、查询编辑器、运行R脚本、数据不错操作、数据分析表达式、网页流量数据分析、超市运营数据分析、Power BI移动应用和Power BI应用开发等内容。
本书是斯坦福大学计算机科学专业数据库系列课程第二门课的教科书。书中对数据库系统实现原理进行了深入阐述,并具体讨论了数据库管理系统的三个主要成分——存储管理器、查询处理器和事务管理器的实现技术。此外,第2版充分反映了数据管理技术的新进展,对内容进行了扩充,除了在版中原有的“信息集成”一章(0章)中加入了新的内容外,还增加了两个全新的章:“数据挖掘”(1章)和“数据库系统与互联网”(2章)。 本书适合作为高等院校计算机专业研究生的教材或本科生的教学参考书,也适合作为从事相关研究或开发工作的专业技术人员的高级参考资料。
本书是一本从理论到实践的全面且细致的企业数据驱动指南,作者见证并献身百度大数据的建设,毫无保留地将成败摸索实践的真实场景进行完整还原,并对近十年大数据从业经验与心得做了归纳和总结,同时详解大数据本质、理念与现状,并围绕数据驱动四环节——采集、建模、分析、指标,深入浅出地讲述企业如何从零到一将完整的数据驱动方案落地,全面展示大数据在各领域内的应用情况与趋势展望。
本书是一本从理论到实践的全面且细致的企业数据驱动指南,作者见证并献身百度大数据的建设,毫无保留地将成败摸索实践的真实场景进行完整还原,并对近十年大数据从业经验与心得做了归纳和总结,同时详解大数据本质、理念与现状,并围绕数据驱动四环节——采集、建模、分析、指标,深入浅出地讲述企业如何从零到一将完整的数据驱动方案落地,全面展示大数据在各领域内的应用情况与趋势展望。
本书针对spark从验证性环境迁移到实际生产环境时会遇到的各种问题给出了实际的帮助,涵盖了开发及维护生产级Spark应用的各种方法、组件与有用实践。全书分为6章, ~ 2章帮助读者深入理解Spark的内部机制以及它们在生产流程中的含义;第3章和第5章阐述了针对配置参数的法则和权衡方案,用来调优Spark,改善性能,获得高可用性和容错性;第4章专门讨论Spark应用中的安全问题;第6章则全面介绍生产流,以及把一个应用迁移到一个生产工作流中时所需要的各种组件,同时对Spark生态系统进行了梳理。
本书以当前主流的大型数据库管理系统SQL server 2014和数据库建模工具PowerDesigner 16.5为操作平台,精心组织设计了14个上机实验和1个课程设计。本书实验目的明确,实验步骤清晰,可操作性强,知识点编排循序渐进、由浅人深,使读者能够有效地将理论应用到实践当中,便于对数据库理论知识的巩固和加深。每个实验后均配有适量习题,便于学生课后练习。 本书可作为高等院校软件工程专业、计算机相关专业本科生数据库课程上机实验和课程设计的教材,也可作为数据库管理人员及数据库应用系统开发人员的参考用书。
本书采用能够自然体现抽象数据类型概念的C 语言作为算法描述语言,把数据结构的原理和算法分析技术有机地结合在一起。全书内容包括线性表、栈、队列、递归、广义表、字符串、数组、树、图、查找以及各种排序算法,并给出了相关的实验指导。书中还引入了一些比较高级的数据结构和相关的算法分析技术。 本书可作为高等院校计算机或相关专业的教材,也可以作为其他程序类课程的辅导教材,同时也适用准备参加研究生入学考试、自学考试和各类程序设计竞赛的人员阅读。
本书将整体内容分为两部分,在第1部分中以影响数据读取效率的所有 要素为类别,对其各自的概念、原理、 特征、应用准则,以及表的结构特 征、多样化的索引类型、优化器的内部作用、优化器为各种结果制定的执行 计划予以详细说明,并以对优化器的正确理解为基础,提出对执行计划和执 行速度产生影响的索引构建战略方案;在第2部分中主要介绍提高数据 读取效率的具体战略方案,在这部分中介绍与数据读取效率相关的局部范围 扫描的原理和具体应用方法,以及对被认为是提高数据库使用效率基础的表 连接的所有类型予以详细说明。 《海量数据库解决方案》系列丛书深受广大读者的喜爱已经长达10年之久,在被誉为“”的同时,它已经变成了数据库用户不可或缺的书籍。作者竭力探求能够让IT工作者在实际工作中轻松应用并掌控的巧妙方法 ,提供事半
本书是一本数据库管理的教材,内容翔实,示例丰富,由浅入深。 本书从数据库管理环境、数据库分析、数据库设计、实现以及高级数据库五个方面全面介绍了数据库的知识。每章之后安排了大量的习题帮助读者梳理知识,掌握基本的概念、原理。 本书还包含一个贯穿始终的实例,让读者体验数据库开发的全过程。本书的网站(://.prenhall./hoffer)中还包含大量相关资源,有助于读者复习所学知识,拓展知识面。本书适合作为相关专业的本科生、研究生的教材,也适合作为从事数据库方面工作的人员和自学者的参考书。
本书是讲述数据库系统原理的经典教材。全书分为4个部分。部分讲述事务处理的概念、并发控制技术和数据库恢复技术,第二部分讲述面向数据库的概念、语言、设计及对象-关系和扩展-关系系统,第三部分主要描述了数据库安全和客户-服务器体系结构,第四部分简要介绍了XML、数据挖掘和数据仓库等几种新兴技术。 本书是高等院校计算机及相关专业本科生、研究生数据库系统课程的理想教材,也是对相关技术人员非常有价值的参考书。
数据结构是计算机专业教学计划中的一门核心课程,也是信息管理、通信电子、自动控制等与计算机技术关系密切的专业的一门基础课程。要从事和计算机科学与技术相关的工作,尤其是计算机应用领域的开发和研制工作,必须具备坚实的数据结构的基础。本书对C 语言作了简单介绍,叙述了抽象数据类型和面向对象的概念,介绍了线性表、栈、队列、数组、广义表、树和图等数据结构,并且介绍了查找和排序的方法。全书用C 语言描述并实现了所有数据结构的类和程序,并附有习题,便于教学。 本书是为高等院校开设“数据结构”课程编写的教材,可作为计算机专业本科生教材使用,也可供从事计算机软件开发和应用的工程技术人员阅读、参考。