本书是机器学习领域的入门教材,详细阐述了机器学习的基本理论和方法。全书由12 章组成,包括绪论、线性模型与逻辑斯谛回归、决策树、贝叶斯分类器、k 近邻算法、支持向量机、人工神经网络、线性判别分析、主成分分析法、聚类、EM 算法与高斯混合聚类、集成学习等。 对每一种机器学习算法,均从算法原理的理论推导和MATLAB 实现两方面进行介绍。本书既注意保持理论分析的严谨性, 又注重机器学习算法的实用性,同时强调机器学习算法的思想和原理在计算机上的实现。全书内容选材恰当,系统性强,行文通俗流畅,具有较强的可读性。本书的建议课时为48 课时,可作为数据科学与大数据技术、计算机科学与技术、统计学以及信息与计算科学等本科专业的教材或教学参考书, 也可以作为理工科研究生机器学习课程的教材或参考书。
本书介绍如何构建完整的机器学习流水线,从而在生产环境中准备数据以及训练、验证、部署和管理机器学习模型。你将了解机器学习流水线的每个环节,以及如何利用TensorFlow Extended(TFX)构建机器学习流水线。模型的生命周期是一个闭环,其中包括数据读取、数据校验、数据预处理、模型训练、模型分析、模型验证、模型部署、模型反馈等环节。你将学习如何利用Beam、Airflow、Kubeflow、TensorFlow Serving等工具将每一个环节的工作自动化。学完本书,你将不再止步于训练单个模型,而是能够从更高的角度将模型产品化,从而为公司创造更大的价值。
本书详细描述了PMML规范(Ver4.3)所支持的8种模型:神经网络模型、决策树模型、规则集模型、序列模型、评分卡模型、支持向量机模型、时间序列模型和聚合模型。全书不是简单地介绍PMML语法,而是融合各种挖掘模型基础知识和算法知识,告诉开发者如何融会贯通地掌握、使用PMML语言,不仅能够学习到标准的PMML模型表达方式,而且能学习机器学习模型的丰富知识,从而熟练地把PMML语言应用到自己的项目实践中。 本书可供从事数据挖掘(机器学习)、人工智能系统开发的软件开发者和爱好者学习使用,也可以作为高等院校大数据和人工智能等相关专业的教材。