武汉大学夏桂松教授访谈
2019年1月3日,专委秘书处采访了武汉大学测绘遥感信息工程国家重点实验室博士生导师,2019年国家优秀青年科学基金获得者夏桂松教授。下面是采访实录。
夏老师,您好!您在计算机视觉、遥感图像分析与模式识别领域做出了很多高水平的研究工作,发表了一系列的高水平论文,并获得了2019年国家优秀青年基金资助。您能跟我们详细介绍一下您的研究经历,分享一下获得成功的经验,以及您取得这些成就的动力吗?
非常感谢专委会提供这样一个平台,让我们有机会分享自己的研究经历。我本科念的是电子信息、硕士做的是遥感图像处理,到巴黎读博士学的是应用数学和图像理解,目前主要从事计算机视觉和遥感领域的交叉研究,而综合来看,我更偏向定位自己是一个计算机视觉的从业人员。回顾个人的求学和工作经历,我其实一直聚焦在信息处理的交叉研究领域。回国工作以后,我加入了武汉大学测绘遥感信息工程国家重点实验室。武汉大学的测绘遥感有非常深厚的积累,在世界上处于领先地位。可能很多计算机视觉的学者不了解,我们核心方向之一的摄影测量和遥感,研究的就是如何通过远距离获取物体影像来量测物体几何和物理属性。从核心算法来看,多视几何与计算机视觉是我们的基础。两个领域从某种程度上可以说是“同出而异名”。特别是,最近十几年,随着对地观测技术的快速发展,成像分辨率迅速提高、遥感平台越来越多样、数据量呈指数增长,遥感信息处理的传统理论和方法受到很大的挑战,和计算机视觉、数据挖掘等领域的交叉也越来越深。由于之前在武汉大学学习6年,耳濡目染,我对这个交叉领域的发展可能更敏感。2013年起,通过逐步理清遥感图像解译和计算机视觉的交叉研究前沿和突破点,目前我们已经形成了计算视觉和摄影测量研究组(CAPTAIN),在图像结构建模、高分辨率遥感图像解译(主要包括目标检测、语义分割、变化分析)、无人系统信息处理等领域已经取得了一些成绩,初步解决了这个方向的一些问题。动力主要来自两方面:一方面,通过向不同领域的顶尖专家学习,尝试从不同的角度去思考、分析和解决问题,这本身就是一件比较好玩的事情;另一方面,我比较喜欢探索未知的过程,能在解决新问题的过程中找到成就感和归属感,同时也比较享受分享自己研究成果的喜悦。
您在结构纹理统计建模和分析方面研究的比较深,关于这一块您能谈谈该领域的一些研究现状和未来发展的一些方向和趋势么?
我很喜欢low-level视觉模式的建模和计算问题,一直坚持在做这方面的研究。在您说的这个方向上,我主要感兴趣的是如何从统计的角度处理、分析和理解在视觉上具有复杂几何结构模式的纹理现象,寻求和设计有效的数学工具为这一过程建模。在深度学习爆发以前,这方面的工作主要集中在对图像的局部结构统计建模上;深度学习出现以后,大家发现非线性的深度描述模型在这个问题上能取得前所未有的效果,特别是有GAN、BigGAN这些算法。个人认为未来在这个问题的研究上,大家还应该做更多的可解释性的工作,从原理上或统计上去理解这些视觉现象。当然,在应用上我们也面临很多挑战,比如怎么建模在空间上不平稳的多尺度纹理现象。
请问基于什么样的出发点,您决定采集和公布DOTA数据集呢?能跟大家分享一下这个数据库的采集过程,以及采集经验么?
首先我个人比较关注reproducible research。最初涉入遥感图像信息处理的时候,我发现一方面通用的测试数据集非常少,算法泛化能力没有办法得到充分的测试;另一方面这个任务上的很多工作没有公开测试的源码,如果想和别的算法比较需要大家自己实现,难度也不小。特别是当深度学习出现以后,遥感算法的研究明显缺乏大规模的公共标注数据。因此,2014年起,我们就决定建立一个公开数据集,并且提供相应的公共测试平台,其中就包括您说的DOTA,其实我们还有AID、GID等其他数据集。要构建这样的数据集和平台对我们小的研究团队来说并非易事,首先要深入了解问题需求,协调遥感数据资源,然后研发标注工具,同时也要有专业经验的标注人员;在财力、物力、人力上都是不小的挑战。但是,这其实是一个公益事业,做好了有利于整个行业的发展,我们希望也呼吁更多的企业或者行业单位能参与进来一起完成这个事情,推动遥感对地观测研究社区的发展。
您从2012年底至今一直工作于武汉大学测绘遥感信息工程国家重点实验室,能介绍一下您在此期间的工作经历吗,有哪些经历是您特别难忘的?
武汉大学测绘遥感信息工程国家重点实验室连续20年、4次科技部考评优秀。入职以来,我从副教授到教授,从硕导到博导,一晃就是7年,感受最深刻的应该是两方面:一是实验室浓厚的学术氛围和开放自由的学术环境。为开拓研究生的学术视野,实验室创立了GeoCaffee,坚持每个月邀请各个领域的专家来讲座,涉及的范围除了相关专业领域还包括文学、哲学等,覆盖范围非常广,目前应