李甲
for contributions to real-time automatic image annotation and image retrieval
北京航空航天大学计算机学院特聘研究员,2005年7月于清华大学电子工程系取得学士学位,2011年1月于中国科学院计算技术研究所取得博士学位。
北京航空航天大学李甲教授访谈
2020年2月15日,CCF CV《专委简报》“委员风采”栏目在线采访了北京航空航天大学博士生导师、2019年国家优秀青年科学基金获得者,李甲教授。下面是采访实录。
李老师,您好!首先,请您介绍一下您的个人学习和研究经历。
我是2001年从山东考到北京上大学,先后在清华、中科院计算所、新加坡南洋理工、北大、北航等五家高校和科研机构学习和工作,中间还去盛大公司创新院做了一年多的“盛斗士”,体验了工业界的生活。在多个单位的学习和工作经历,使我得到了很多锻炼的机会,也促使我习惯于从多个不同的视角思考问题。
您在视觉注意、显著性、图像视频计算与解析方面有很多的研究成果,能否跟大家分析一下这个领域目前的研究现状和未来发展趋势?
我从06年开始接触视觉注意和显著性计算这个领域,当时大家期望通过模拟人类视觉认知机理来突破部分计算机视觉任务的瓶颈,涌现了很多对眼动预测和显著物体分割的研究。但12年后深度学习的爆发,使得大家可以通过端到端的方式绕过对视觉认知机理的简单模拟,因此这个领域的发展逐渐出现了分化。
一方面,借助眼动仪开展眼动和视觉注意预测的研究有所减少,最主要的问题是说不明白通过这种方式预测出的视觉注意有什么用,而对视觉注意本身的研究也在逐渐开始探索人类视觉认知的底层生理机理。另一方面,得益于大量的代码和数据集开源,显著物体分割目前成为了研究热点,目前的趋势包括研究弱监督和无监督环境下的显著物体分割和共分割。这个领域现在的问题在于,缺少“非它不可”的杀手级应用。
除了注意力和视觉显著以外,我们也在积极探索新的道路,尝试了很多图像视频计算与解析的新任务。目前来看,“精益求精”和“见微知著”是两条可行的发展道路。 其中“精益求精”是指视觉认知粒度越来越细,细到样例级和部件级,“见微知著”是视觉认知既要适应充满噪声的真实大数据环境,又要理解万事万物的细微差别。这也是我们课题组未来将重点关注的两个方向。
您的所有研究中,您认为最有应用价值、最有前途的一项研究成果是什么?能否跟大家分享一下?
我们近期取得了一些与应用场景结合比较紧密的研究成果,包括近似车辆重识别、全景图像拼接、互联网图像视频分类、机载目标检测等,每项成果都或多或少的具有一定应用价值和发展前景。其中,与无人机应用场景相关的一些工作可能具有更好的应用价值和发展前景,因为这些工作既能体现出北航的航空航天特色,又能增强我们与其他课题组工作的区分度。
您申请了多项国内和国际专利,能否跟大家分享一下您对申请专利的认识和建议?
我在读博期间就养成了申请专利的习惯。当时高文老师团队对申请专利的要求很高,需要经过多位老师会议评估创新性和实用性才允许申请。因此当时申请的专利多数是以论文算法为基础进一步开发的应用系统,比如视频广告插入系统等,其中少数与华为公司合作研发的系统申请了国际专利。后来到北航之后,赵沁平老师团队非常鼓励将高水平工作申请专利,因此我们课题组内部制定了一个标准:值得投稿高水平刊物和会议的工作可以申请国内专利,其中部分开创性的高质量工作可以申请国际专利。个人认为,申请专利要变成一种科学研究的习惯动作,不要仅仅只对少数重点工作申请专利,而是要在自己的主战场上,对高水平的工作持续申请专利,形成系列的专利壁垒,方便在合适时机开展转化。
您曾于新加坡南洋理工大学、盛大创新院、北京大学等机构从事科研工作,请问最后为什么选择了北京航空航天大学呢?能否介绍下您作为“卓越百人”被引进到北京航空航天大学工作的经历?
选择北航的两个主要原因是:学校好,上升趋势明显,青蝇之飞,不过数武,附之骥尾,可致千里;离家近,只隔一条马路,以每天通勤节省1小时计,每年将多出1.5个月的8小时工作日。
做为卓越百人副教授进入北航后,有三件事情对我触动很大。第一,14年刚进校时,怀校长安排了一个项目申请工作,计算机学院抽调多名教师在会议室连续奋战24小时,从第一天中午12点干到第二天中午12点,从无到有地完成了申请书初稿和PPT初稿。并且,夜里2点时,学院领导给大家送来了KFC,说是刚开完一个会议,陪大家工作一小时,然后稍微休息下再去参加早上8点的另一个会议。第二,15年初参与重点项目申请,给一位青年老师和一位博士生打电话,问可否来开会讨论,答曰“刚到食堂打了饭”,于是就没有催促,没想到十分钟后两人就出现了,说是听到会议通知,没有吃饭就跑步回来。第三,17年给一位学生通过QQ发了个信息“在么