本书是来自一线MySQL DBA的技能进阶笔记,凝结了作者多年数据库管理心得。 全书从运维管理、架构优化和运维开发三个层面娓娓道来,精心筛选了作者在实际工作 中总结的技巧、对常见问题的处理方法以及对于运维体系的思考和实践;尤其是运维开 发章节从0 到1 构建运维体系,能够对DBA已有知识体系和技能栈做到全新梳理。
《数据算法:Hadoop/Spark大数据处理技巧》介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这还概要介绍了MapReduce、Hadoop和Spark。 主要包括: 完成超大量交易的购物篮分析。 数据挖掘算法(K-均值、KNN和朴素贝叶斯)。 使用超大基因组数据完成DNA和RNA测序。 朴素贝叶斯定理和马尔可夫链实现数据和市场预测。 推荐算法和成对文档相似性。 线性回归、Cox回归和皮尔逊(Pearson)相关分析。 等位基因频率和DNA挖掘。 社交网络分析(推荐系统、三角形计数和情感分析)。