近日,海南大学计算机科学与技术学院人机物数据智能团队的李华副教授在国际顶级会议第33届ACM国际多媒体会议(The 33rd ACM International Conference on Multimedia,简称ACM MM 2025)上发表最新研究论文,题目为“FSCDiff: Frequency-Spatial Entangled Conditional Diffusion model for Underwater Salient Object Detection”。ACMMM是中国计算机学会(CCF)推荐的A类顶级国际学术会议,在全球范围内的多媒体和人工智能领域享有极高的学术声誉。
针对水下环境中因光线散射、低对比度导致的水下显著性目标检测(USOD)精度不足和边界偏移难题,该研究首次提出频域-空间耦合的条件扩散框架FSCDiff,主要创新点如下:
1. 该模型将USOD任务从传统的“像素级分类”范式转变为“掩码生成”范式,针对扩散模型条件特征表征不足的问题,设计了傅里叶-空间耦合增强模块(Dual-Domain Entanglement Enhancement Block),创新性地将RGB图像的傅里叶域振幅信息(反映纹理对比)与深度图的相位信息(反映结构边界)进行耦合学习,较传统纯空间建模方法显著提升复杂背景下的特征判别力,提高了模型检测精度。
2. 该论文首次尝试将扩散模型迭代中间结果的相关性应用于USOD任务中,并提出了稳定时间步掩膜预测策略(Stable Time-Step Mask Prediction),旨在有效抑制水下噪声干扰导致的边界偏移。

图一 FSCDiff模型集示意图
实验结果表明,FSCDiff模型在USOD10K与USOD数据集上与最先进的显著性目标检测方法相比时,在绝大多数指标上具有领先地位,实现了优异的性能。
该ACM MM论文的第一作者为海南大学计算机科学与技术学院李华副教授,共同一作为2023级研究生林高炜。
李华,现任海南大学计算机科学与技术学院副教授,博士/硕士生导师。海南省优青,海南省“南海新星”科技创新人才,海南省高层次人才D类。主要研究方向包括计算机视觉、图像处理、海洋环境感知、智慧农业、人工智能、深度学习等。主持/参与了包括国家自然科学基金、海南省自然科学基金等多项科研项目。担任IEEE旗下海洋工程领域核心期刊IEEE Journal of Oceanic Engineering编委,亚太信号与信息处理协会 图像、视频与多媒体(APSIPA IVM)技术委员会委员。担任国际学术会议IEEE DSS 2021的程序委员会副主席、以及IEEE TIP、IJCV、IEEE TMM、CVPR、ICCV、ICML、ACM MM等顶级期刊和会议的审稿专家。2021、2023年分别荣获IEEE杰出领导奖。2022年获IEEE Journal of Oceanic Engineering杰出审稿人奖。近五年,在计算机视觉领域以第一或通讯作者在ICCV、ICML、ACM MM、IEEE TMM等高水平国际期刊和会议上发表多篇SCI/EI文章。