《数据算法:Hadoop/Spark大数据处理技巧》介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这还概要介绍了MapReduce、Hadoop和Spark。 主要包括: 完成超大量交易的购物篮分析。 数据挖掘算法(K-均值、KNN和朴素贝叶斯)。 使用超大基因组数据完成DNA和RNA测序。 朴素贝叶斯定理和马尔可夫链实现数据和市场预测。 推荐算法和成对文档相似性。 线性回归、Cox回归和皮尔逊(Pearson)相关分析。 等位基因频率和DNA挖掘。 社交网络分析(推荐系统、三角形计数和情感分析)。
《SQL指南(第4版)》为SQL名著中文版,兼顾技术与实践,全面细致介绍高级技术,致力于打造SQL编程专家。《SQL指南(第4版)》阐释了数据库设计、优化和操作的各方面内容,提供了成为SQL编程专业人士所需的技术与技巧、针对新旧挑战性难题的解决方案、专业的思考方式(以保证程序的正确性与高效性),并涉及了数据库设计与规范化、SQL数据类型、查询、分组、集合操作、优化等主题。另外,JoeCelko以通俗易懂的语言叙述了一些关键问题,比如避免使用过多NULL的原因及查询优化方式等。《SQL指南(第4版)》适合中高级SQL编程人员学习参考。
Spark SQL 是 Spark 技术体系中较有影响力的应用(Killer application),也是 SQL-on-Hadoop 解决方案 中举足轻重的产品。《Spark SQL内核剖析》由 11 章构成,从源码层面深入介绍 Spark SQL 内部实现机制,以及在实际业务场 景中的开发实践,其中包括 SQL 编译实现、逻辑计划的生成与优化、物理计划的生成与优化、Aggregatio算子和 Joi算子的实现与执行、Tungste优化技术、生产环境中的一些改造优化经验等。 《Spark SQL内核剖析》不属于入门级教程,需要读者对基本概念有的了解。在企业中任职的系统架构师和软件开发人员,以及对大数据、分布式计算和数据库系统实现感兴趣的研究人员,均适合阅读《Spark SQL内核剖析》。
《算法竞赛入门经典——训练指南(升级版)》是《算法竞赛入门经典(第2版)》一书的重要补充,旨在补充原书中没有涉及或者讲解得不够详细的内容,从而构建一个更完整的知识体系。本书通过大量有针对性的题目,让抽象复杂的算法和数学具体化、实用化。 《算法竞赛入门经典——训练指南(升级版)》共包括6章,分别为算法设计基础、数学基础、实用数据结构、几何问题、图论算法与模型以及更多算法专题。全书通过206道例题深入浅出地介绍了上述领域的各个知识点、经典思维方式以及程序实现的常见方法和技巧,并在章末给出了丰富的分类习题,供读者查漏补缺和强化学习效果。 《算法竞赛入门经典——训练指南(升级版)》题目多选自近年来ACM/ICPC区域赛和总决赛真题,内容全面,信息量大,覆盖了常见算法竞赛中的大多数细分知识点。书中还给出
是不是准备把你的静态:HTML页面上升到新高度,想要使用PHP和MySQL构建数据库驱动的网站?《Head First PHP MySQL(中文版)》正是你需要的实践指南,可以让你很快地建立并运行动态网站。你可以具体动手构建真实的应用,包括从一个视频游戏高分公告板到一个在线约会网站等大量应用。读完《Head First PHP MySQL(中文版)》,你将学会如何验证表单,使用会话ID和cookie、完成数据库查询和联接、处理文件I/O操作等。我们认为,你的时间如此宝贵,不应过多地浪费在与新概念的斗争中。通过使用认知科学和学习理论的近期新研究成果,你将享受一种多感官学习体验,《Head First PHP MySQL(中文版)》采用了一种专门为你的大脑而设的丰富格式娓娓道来,而不是长篇累牍地说教,让你昏昏欲睡。