集成学习方法是一类先进的机器学习方法,这类方法训练多个学习器并将它们结合起来解决一个问题,在实践中获得了巨大成功。 《集成学习:基础与算法》分为三部分。部分主要介绍集成学习的背景知识;第二部分主要介绍集成学习方法的核心知识,包括Boosting、Bagging、Random Forests 等经典算法,平均、投票和Stacking 等模型和方法、相关理论分析工作,以及多样性度量和增强方面的进展;第三部分介绍集成学习方法的进阶议题,包括集成修剪、聚类集成和集成学习方法在半监督学习、主动学习、代价敏感学习、类别不平衡学习及提升可理解性方面的进展。此外,《集成学习:基础与算法》还在每章的“拓展阅读”部分提供了相关的进阶内容。
部分开始解决问题第二部分算法分析第三部分算法设计范式第四部分一些的算法第五部分基本数据结构第六部分树第七部分图
近年来,随着数据获取能力的不断提高和计算机的飞速发展,人们获得的数据信息越来越多,数据维数越来越高,如何寻找这些海量高维数据信息中潜在的规律,更好地为人类服务,是目前人工智能面临的挑战之一。 在没有标签信息的情况下,对高维数据实施维数约简的同时进行归类分析,挖掘数据的内在低秩结构,是当前机器学习的一个难点、也是热点之一。谱聚类作为聚类分析的一种,不仅对初始值和数据噪声有更好的鲁棒性,而且实施简单,可以被标准的线性代数方法进行有效求解。因此,基于低秩结构学习的谱聚类理论和方法在机器学习、人工智能、大数据技术方面有着更加广阔的应用空间。 本书主要研究了基于低秩结构学习的谱聚类理论与方法,从矩阵和张量两方面进行研究。重点关注紧凑低秩表示学习、鲁棒的无监督特征选择学习、图正则化低秩因