威海市网站建设_网站建设公司_Angular_seo优化-常州市网站建设公司

使用监督学习训练图像聚类模型

在机器学习领域，大多数模型都依赖于监督学习，需要耗费高昂成本和时间来获取带标注的数据。无监督学习的主要方法——聚类，旨在根据显著特征将数据点分组，每个组（簇）代表一个类别，例如同一人物的照片或同一物种的动物图像。

传统的聚类算法通常依赖启发式规则来决定簇之间的边界，例如簇中心之间的阈值距离或簇的分布形状。在一篇提交给国际计算机视觉大会（ICCV）的论文中，提出了一种新方法：直接从数据中学习如何划分边界。

核心方法：分层图神经网络

该方法首先将视觉数据表示为一个图，其中每个节点代表一张图像，每个节点与其在特征空间中的k个最近邻节点相连。

然后，使用一个图神经网络来生成图中节点的向量表示（节点嵌入）。与先前工作不同的是，该方法不依赖启发式规则，而是使用带标签的元训练数据来学习如何对这些向量进行聚类，并决定聚类的精细程度。

该方法的核心创新在于其分层处理方式。聚类模型基于节点嵌入预测节点之间的连接边，共享边的节点组被定义为一个簇。完成一层聚类后，将每个簇聚合成一个代表该簇的“超节点”，然后在新的超节点图上重复整个过程：构建k最近邻图，通过GNN传递，并预测超节点之间的连接边。这个过程迭代进行，直到模型不再预测出新的连接边为止。

模型训练与优势

该聚类模型基于两个目标进行训练：

准确预测节点之间的连接：正确的连接是指那些将元训练数据中同类型的两个代表（例如，同一演员的两张照片）联系起来的边。
准确预测局部数据密度：对于每个节点，模型需要预测其附近邻居中属于同类型的比例。

通过单一模型联合预测连接和密度，显著提高了计算效率。同时，由于采用了分层处理方案，模型可以优化整个输入图的聚类效果，避免了先前方法中将图分割成子图再进行处理所带来的局限性。

实验与结果

在实验中，使用两组不同的元训练数据：一组是人类面部特写，另一组是特定动物物种的图像。用训练好的面部模型在两个与训练集类别重叠极低（0%和低于2%）的数据集上进行测试；用训练好的物种模型在一个包含未见过的物种的数据集上进行测试。结果显示，与之前的基于GNN的聚类模型和无监督聚类方法相比，该方法的F分数平均提升了49%和47%。

这项正在进行的研究，正在探索训练一个更通用的聚类模型的可能性，以使其推理性能能够更好地跨不同数据类型（例如同时精确聚类人脸和动物物种）迁移。

鸣谢：Tianjun Xiao, Yongxin Wang, Yuanjun Xiong, Wei Xia, David Wipf, Zhang Zheng, Stefano Soatto
更多精彩内容请关注我的个人公众号公众号（办公AI智能小助手）或者我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号（网络安全技术点滴分享）

威海市网站建设_网站建设公司_Angular_seo优化

使用监督学习训练图像聚类模型

核心方法：分层图神经网络

模型训练与优势

实验与结果

热门文章

文章分类

标签云

需要专业的网站建设服务？

威海市网站建设_网站建设公司_Angular_seo优化

使用监督学习训练图像聚类模型

核心方法：分层图神经网络

模型训练与优势

实验与结果

热门文章

文章分类

标签云

相关文章

DroidCam OBS插件完整指南：零成本将手机变专业直播摄像头

神经网络王炸来袭！性能效率可解释性三buff

闲置机顶盒变身高性能服务器：TY1613刷Armbian终极指南 [特殊字符]

需要专业的网站建设服务？