这是一本跟数据科学和数据科学家有关的“手册”,它还包含传统统计学、编程或计算机科学教科书中所没有的信息。 本书有3个组成部分:一是多层次地讨论数据科学是什么,以及数据科学涉及哪些其他学科;二是数据科学的技术应用层面,包括教程和案例研究;三是给正在从业和有抱负的数据科学家介绍一些职业资源。本书中有很多职业和培训相关资源(如数据集、网络爬虫源代码、数据视频和如何编写API),所以借助本书,你现在就可以开始数据科学实践,并快速地提升你的职业水平。
Spark SQL 是 Spark 技术体系中较有影响力的应用(Killer application),也是 SQL-on-Hadoop 解决方案 中举足轻重的产品。《Spark SQL内核剖析》由 11 章构成,从源码层面深入介绍 Spark SQL 内部实现机制,以及在实际业务场 景中的开发实践,其中包括 SQL 编译实现、逻辑计划的生成与优化、物理计划的生成与优化、Aggregatio算子和 Joi算子的实现与执行、Tungste优化技术、生产环境中的一些改造优化经验等。 《Spark SQL内核剖析》不属于入门级教程,需要读者对基本概念有的了解。在企业中任职的系统架构师和软件开发人员,以及对大数据、分布式计算和数据库系统实现感兴趣的研究人员,均适合阅读《Spark SQL内核剖析》。
本书是普通高等教育“十一五”规划教材。《数据结构(第3版)》主要内容包括绪论、线性表和数组、栈和队列、树、图、排序、查找、数据结构程序设计等,最后,以Java语言为例,介绍了面向对象程序设计的数据结构。书中各章后附有自测练习题。《数据结构(第3版)》适用于高等职业学校、高等专科学校、成人高等学校、本科院校举办的二级职业技术学院,也可供示范性软件职业技术学院、继续教育学院、民办高等学校、技能型紧缺人才培养使用,还可供本科院校、计算机专业人员和爱好者参考。
《电力安全作业全媒体培训教材》以安规为蓝本,结合近年来电力行业发生的典型事故案例,集动画、文字、图片等媒体表现形式与一体,将全媒体与电力安全培训的内容结合起来,既有引人入胜的案例,又有对安规的多维度解读,包含《电力安全事故案例动漫集(配电部分)》、《电力安全事故案例动漫集(线路部分)》两部事故案例动漫片及《国家电网公司电力安全工作规程(配电部分)》全媒体释义、《国家电网公司电力安全工作规程(线路部分)》全媒体释义。《国家电网公司电力安全工作规程(线路部分)》全媒体释义是从图片、视频、案例、释义多维度诠释《国家电网公司电力安全工作规程 线路部分》,旨在帮助使用人员理解、执行条文规定,主要内容包括总则和保证安全的组织措施、保证安全的技术措施、线路运行和维护、邻近带电导线的工作、线