山东大学教师主页李象贤 Meta-causal feature learning for out-of-distribution generalization 中文主页

李象贤

所属院部：低空科学与工程学院

访问次数：次

论文成果

返回中文主页

基于跨模态特权信息增强的图像分类方法

发布时间：2024-11-09

论文名称：

基于跨模态特权信息增强的图像分类方法
发表刊物：

软件学报（CCF-T1）
摘要：

图像分类算法的性能受限于视觉信息的多样性和背景噪声的影响,现有研究通常采用跨模态约束或异构特征对齐算法学习可判别力强的视觉表征.然而,模态异构带来的特征分布差异等问题限制了视觉表征的有效学习.针对该问题,本文提出一种基于跨模态语义信息推理和融合的图像分类框架 (CMIF),引入图像语义描述及统计先验知识作为特权信息,使用特权信息学习范式在模型训练阶段指导图像特征从视觉空间向语义空间映射,提出类感知的信息选择算法 (CIS)学习图像的跨模态增强表征.针对表征学习中的异构特征差异性问题,使用部分异构对齐算法 (PHA)实现视觉特征与特权信息中提取的语义特征的跨模态对齐.为进一步在语义空间中抑制视觉噪声带来的干扰,提出基于图融合的CIS算法选取重构语义表征中的关键信息,从而形成对视觉预测信息的有效补充.在跨模态分类数据集VireoFood-172和NUS-WIDE上的实验表明,CMIF能够学习鲁棒的图像语义特征,并且能够作为通用框架在基于卷积的ResNet-50和基于Transform架构的ViT图像分类模型上取得稳定的性能提升.
备注：

CCF T1，IF=2.3
第一作者：

Xiangxian LI
通讯作者：

Lei Meng*
全部作者：

Yuze Zheng,Haokai Ma,Zhuang Qi,Xiaoshuo Yan,Xiangxu Meng
论文类型：

期刊论文
是否译文：

否
发表时间：

2024-04
收录刊物：

EI
发布时间：

2024-11-09

上一条：Are We in The Zone? Exploring The Features and Method of Detecting Simultaneous Flow Experiences Based on EEG Signals

下一条：Personalized User Interface Elements Recommendation System