岳阳市网站建设_网站建设公司_数据备份_seo优化
2026/1/2 19:10:46 网站建设 项目流程

图像描述的快与慢:量化与预测视觉语言过程中人类信号的变化

图像属性与人类在描述图像时的行为之间存在复杂的关系。这种行为表现出丰富的变化,体现在诸如眼动以及人类开始描述图像的时间等信号中。尽管这种视觉语言变化信号极具价值,但在当前预训练模型的训练中却几乎被忽视,这促使我们进行更深入的探究。

本研究使用一个包含同步采集的眼动追踪数据的荷兰语图像描述语料库,探索了视觉语言信号变化的本质,并发现这些信号彼此相关。基于此结果,我们假设这种变化部分源于图像本身的属性,进而探索由预训练视觉编码器编码的图像表示能否捕捉这种变化。我们的结果表明,预训练模型在某种程度上(从微弱到中等程度)可以做到这一点,这表明这些模型缺乏对人类而言什么使得刺激变得复杂、以及什么导致了人类输出变化的认知偏差。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

公众号二维码

公众号二维码

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询