国际计算机视觉顶级会议ICCV 2025录用空间应用中心科研成果
中国科学院空间应用工程与技术中心博士生王涵等人的最新研究成果《Cross-modal Ship Re-identification via Optical and SAR Imagery: A Novel Dataset and Method》近日被国际计算机视觉顶级会议ICCV(International Conference on Computer Vision)录用。该研究首次构建了面向低地球轨道(LEO)星座的跨模态船舶重识别基准数据集 HOSS ReID,并针对光学与合成孔径雷达(SAR)图像对齐提出基于Vision Transformer的跨模态重识别算法TransOSS,为全天候、高频次海上目标追踪提供了全新解决方案。
关于 ICCV:
ICCV是计算机视觉领域公认的顶级国际会议之一,被中国计算机学会(CCF)评为 A类会议。该会议由IEEE与CVF共同主办,每两年举办一次,涵盖计算机视觉与模式识别的各类核心方向。2025年10月该会议将于美国夏威夷檀香山召开,今年大会共收到了11239份有效投稿,最终录用率为24%。
研究背景:破解传统卫星跟踪瓶颈,推动智慧海洋监测升级
地面目标的遥感检测与跟踪是遥感领域的核心挑战,尤其舰船连续跟踪对海事搜救、海上执法及航运分析等应用至关重要。当前主流方法依赖地球静止轨道卫星或视频卫星:前者分辨率低且易受云雾等天气干扰,后者拍摄时长有限、覆盖范围狭窄,均难以满足海上目标实时追踪的实际需求。
本研究突破传统技术瓶颈,依托遥感与人工智能交叉融合,首次利用商业遥感星座中光学与SAR卫星协同成像,构建了遥感跨模态重识别的标准化研究框架,推动“高分辨率 + 高频重访 + 全天时观测”的舰船跟踪模式迈上新台阶。
图1:HOSS ReID数据集示例(左),舰船跟踪流程图(右)。
数据集亮点:跨模态、跨星座,多维挑战齐聚
HOSS ReID数据集是国际首个针对光学和SAR遥感图像中船舶跨模态重识别任务而构建的公开数据集。它涵盖了不同时间、不同卫星、不同视角下同一船舶的图像,从真实大场景中采集,成像时间跨度从数分钟至数天,覆盖苏伊士运河、巴拿马运河等高密度船舶区域。数据集具备跨模态、跨星座、多样性强、难度高等特点,为相关算法研究和评估提供了高质量基准数据平台。
方法创新:打造首个面向光学-SAR跨模态重识别网络TransOSS
针对光学与SAR之间成像机制的巨大差异,研究提出了基于Transformer架构的TransOSS,其具有双分支图像块嵌入、模态信息与尺寸信息提示等创新结构以及两阶段训练策略。实验结果显示,TransOSS在整体mAP指标上达57.4%、Rank-1准确率达65.9%,显著优于现有主流ReID方法,实现了跨模态舰船重识别任务的高性能基线。
图2:TransOSS网络结构图。
团队介绍与成果归属
本研究由中国科学院空间应用工程与技术中心工程信息中心研究生王涵、杨简、刘昱璇等人完成。团队长期致力于多模态学习、空间应用图像智能分析、空间场景目标感知等领域的研究。论文预印本、数据集和算法代码现已开放获取:https://arxiv.org/abs/2506.22027。
附件下载: