Multi-label classification using hierarchical embedding

Zhu Yuexin Nov 23, 2017

2017.9发表在Expert Systems with Applications。

作者：Vikas Kumar、Arun K.Pujari、VineetPadmanabhan、Sandeep KumarSahu、Venkateswara RaoKagita

Multi-label classification using hierarchical embedding

摘要

由于输出空间的指数规模，发掘特征空间和标签空间中的内在信息一直是近年来研究的重点，参数化和嵌入的使用也一直是多标签分类MLC的主要焦点。现有的大多数方法都是使用整个训练集来学习单个线性参数化，因此不能捕获特征空间和标签空间中的非线性内在信息。为了克服这个问题，我们提出了一个分段线性嵌入，它使用最大余量矩阵分解来模拟线性参数化。我们假设符合相似嵌入的特征向量在某种意义上是相似的。结合上述概念，提出了一种新的分层矩阵分解方法用于多标签分类。

tips:

maximum margin matrix factorization : 最大余量矩阵分解/最大边际矩阵分解

主要内容

其实论文没太看懂，涉及到太多不了解的东西，比如线性参数化、嵌入(embedding)、矩阵分解等，算法公式太多，没细看。。

摘抄一段描述：

受上述观察的启发，我们提出了一种新的算法MLC-HMF(Multi-Label Classification use Hierachical Matrix Factorization)，它本质上是一种分层矩阵分解方法。我们的算法最初通过使用k均值聚类将训练样例分成两个不相交的分量。然后，对于每个组件，U和V被学习。如此计算的U和V被用于测试各个分量中的训练向量，以便未被正确分类的实例将被进一步处理用于下一轮递归。 MLC-HMF返回训练集的子集和关联的（U，V）。它也产生了不用于进一步分类的训练实例的残留。从某种意义上说，我们的算法从层次上选择适合于多标签分类的不同适应度的训练集。层次的深度决定了更精细的残留水平。

总结

本文提出了一种新的多标签分类方法MLC-HMF，该方法通过对参数化的低秩约束学习分段线性嵌入来捕获原始特征和标签空间中存在的非线性内在关系。

在多标签分类问题中，不经常出现的标签（尾标签）与较少的训练数据相关联，并且比经常出现的标签更难以预测，但是也可以提供更多的信息和奖励。由于尾部标签的存在，低秩标签矩阵假设在嵌入方法在现实世界的应用中不能成立。我们认为，我们提出的分层嵌入可能为克服这个困难铺平了道路，可以更有效地处理尾标签。

MLC-HMF是有史以来第一次在多标签学习环境中进行分段线性嵌入的尝试。深入研究不同的嵌入方式，如准线性嵌入及其优于线性嵌入和非线性嵌入的优点。我们计划在未来进行这一调查。我们的实验分析表明，分层嵌入能够为多标签分类产生更准确的结果。这激发了未来研究的新线路，其中可以使用所提出的算法的计算复杂性。算法的核心部分是基于梯度下降的搜索。研究梯度下降的不同算法策略，提高计算效率是值得的

Tips

数据集下载：labic、meka、mulan