2021年10月11日至10月18日,IEEE国际计算机视觉大会(International Conference on Computer Vision,简称ICCV)在线召开。我校电子信息学院博士研究生樊斌在戴玉超教授、何明一教授指导下完成的两篇论文被ICCV 2021录用发表。被录用发表的两篇论文分别是“Inverting a Rolling Shutter Camera: Bring Rolling Shutter Images to High Framerate Global Shutter Video”和“SUNet: Symmetric Undistortion Network for Rolling Shutter Correction”,均由我校独立完成。
卷帘式快门相机通过控制芯片逐行曝光方式实现成像,具有帧速率高、成本低、功耗低等优点,占据了消费级摄像机市场的绝对主导地位。但是其动态成像机制会使得拍摄图像的不同行像素具有不同的曝光时间。当相机发生移动或者拍摄运动物体时,图像会出现倾斜、晃动、扭曲等几何失真。这不仅造成了摄影中成像质量的严重退化,而且极大制约了现有三维视觉方法在CMOS相机上的应用。这两篇论文都是致力于去除卷帘快门失真的新方法,研究工作具有广泛的应用前景。以上研究工作得到国家自然科学基金面上项目、科技部科技创新2030“新一代人工智能”重大研究计划子课题和深圳大疆创新合作项目等的资助。
第一项工作致力于通过卷积神经网络让卷帘快门相机不那么“卷”,即翻转卷帘快门相机成像流程:从卷帘快门图像到全局快门视频(比如从两张720像素高度的卷帘快门图像中估计出1440张虚拟的全局快门图像)。论文通过在数学模型上证明卷帘快门图像校正问题的内在几何性质,首次提出了一种几何感知的卷帘快门图像时间超分辨网络架构,不仅在卷帘快门图像校正和推理速度上优于当前国际最先进方法,而且还可以恢复出高帧率和高质量的全局快门视频。
第二项工作围绕卷帘快门图像校正与卷帘快门效应消除这一任务,旨在从输入的连续两帧卷帘快门图像中估计出与这两帧的中间曝光时刻相对应的全局快门图像,提出了一种对称的卷帘快门图像校正网络框架,设计了上下文感知的代价体和对称一致性约束,能够实现相邻帧图像信息的高效聚合和对齐,在相关数据集上取得了最优越的性能。
戴玉超教授是我校电子信息学院教授、博士生导师,国家级青年人才,陕西省信息获取与处理重点实验室主任及国际联合研究中心副主任。其主要研究方向是智能视觉感知、三维场景重建、多视角几何等,近年来在IEEE TPAMI、IJCV、ICCV、CVPR、NeurIPS、ECCV等国际期刊和会议上发表论文50余篇,获IEEE CVPR 2012最佳论文奖(大陆高校首次)、IEEE CVPR 2020最佳论文奖提名等多项国际学术奖项,担任CVPR、ICCV、ACM-MM等国际顶级会议领域主席(Area Chair)。何明一教授是我校电子信息学院教授、博士生导师,享受国务院政府特殊津贴的高层次专家,陕西省信息获取与处理重点实验室创建人和国际联合研究中心主任,对地观测研究中心主任及首席科学家,亚太信号与信息处理联合会副主席。
ICCV是计算机视觉领域三大国际顶级会议之一,在世界范围内每两年举办一届。ICCV会议创始于1987年,有着严苛的接收标准。2021年一共接收到约6236篇论文投稿,最终录用1617篇,录取率约为25.9%。
撰稿/刘奇 审核/侯俊