基于视觉语言表征学习的图像美学评估方法分析

2025.12.03点击:

摘要:阐述针对图像美学评估领域中存在的图像表征难以学习及模型泛化性欠缺的问题,研究提出一种基于视觉语言表征学习的图像美学评估新方法。分析发现,现有的方法大多只考虑了视觉信息,而用户评论包含了更丰富的语义,解释了人们标注评分的依据。所设计的算法利用视觉文本模型来学习图像美学评估,在训练阶段设置两个辅助训练任务,即将图像和文本特征在输入到跨模态Transformer前对齐,之后预测文本中被屏蔽的美学词汇。

关键词: 图像美学评估;视觉文本模型;跨模态Transformer;

专辑: 信息科技

专题: 计算机软件及计算机应用

分类号: TP391.41