要实现卓越的软件开发生产率,管理者需要持续不断地关注开发项目中的人员、激励措施以及团队沟通。在本书中,世界知名的软件工程大师兰达尔W.延森博士介绍了一种体现这些关注点、经过长期验证的定量化方法。他将帮助你度量你所在组织的开发能力和生产率,然后利用这些信息来提高开发人员和团队多方面的能力,并构建更加的软件开发成本和进度估算。
通过本书你将了解到如何使用、部署和维护Apache Spark开源集群计算框架。本书由Spark的创始人所撰写,重点介绍Spark近期新版本的新功能和新特点。本书将Spark功能分解为若干独立主题来进行全面介绍。 本书的主要内容有:大数据技术和Spark概述。通过实例学习DataFrame、SQL、Dataset等Spark的核心API。了解Spark的低级API实现,包括RDD以及SQL和DataFrame的执行过程。了解Spark如何在集群上运行。Spark集群和应用程序的调试、监控、和调优。学习Spark强大的流处理引擎——结构化流处理。学习MLlib并了解如何应用它解决包括分类、推荐,以及其他多种实际问题。