威海市网站建设_网站建设公司_Angular_seo优化
2026/1/13 13:27:50 网站建设 项目流程

使用监督学习训练图像聚类模型

在机器学习领域,大多数模型都依赖于监督学习,需要耗费高昂成本和时间来获取带标注的数据。无监督学习的主要方法——聚类,旨在根据显著特征将数据点分组,每个组(簇)代表一个类别,例如同一人物的照片或同一物种的动物图像。

传统的聚类算法通常依赖启发式规则来决定簇之间的边界,例如簇中心之间的阈值距离或簇的分布形状。在一篇提交给国际计算机视觉大会(ICCV)的论文中,提出了一种新方法:直接从数据中学习如何划分边界。

核心方法:分层图神经网络

该方法首先将视觉数据表示为一个,其中每个节点代表一张图像,每个节点与其在特征空间中的k个最近邻节点相连。

然后,使用一个图神经网络来生成图中节点的向量表示(节点嵌入)。与先前工作不同的是,该方法不依赖启发式规则,而是使用带标签的元训练数据来学习如何对这些向量进行聚类,并决定聚类的精细程度。

该方法的核心创新在于其分层处理方式。聚类模型基于节点嵌入预测节点之间的连接边,共享边的节点组被定义为一个簇。完成一层聚类后,将每个簇聚合成一个代表该簇的“超节点”,然后在新的超节点图上重复整个过程:构建k最近邻图,通过GNN传递,并预测超节点之间的连接边。这个过程迭代进行,直到模型不再预测出新的连接边为止。

模型训练与优势

该聚类模型基于两个目标进行训练:

  1. 准确预测节点之间的连接:正确的连接是指那些将元训练数据中同类型的两个代表(例如,同一演员的两张照片)联系起来的边。
  2. 准确预测局部数据密度:对于每个节点,模型需要预测其附近邻居中属于同类型的比例。

通过单一模型联合预测连接和密度,显著提高了计算效率。同时,由于采用了分层处理方案,模型可以优化整个输入图的聚类效果,避免了先前方法中将图分割成子图再进行处理所带来的局限性。

实验与结果

在实验中,使用两组不同的元训练数据:一组是人类面部特写,另一组是特定动物物种的图像。用训练好的面部模型在两个与训练集类别重叠极低(0%和低于2%)的数据集上进行测试;用训练好的物种模型在一个包含未见过的物种的数据集上进行测试。结果显示,与之前的基于GNN的聚类模型和无监督聚类方法相比,该方法的F分数平均提升了49%和47%。

这项正在进行的研究,正在探索训练一个更通用的聚类模型的可能性,以使其推理性能能够更好地跨不同数据类型(例如同时精确聚类人脸和动物物种)迁移。

鸣谢:Tianjun Xiao, Yongxin Wang, Yuanjun Xiong, Wei Xia, David Wipf, Zhang Zheng, Stefano Soatto
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询