【CVPR 2018 最佳论文出炉】斯坦福等名校折桂,何恺明获年轻研究员奖

前沿资讯 Admin ⋅ 于 2个月前 ⋅ 334 阅读

来源:新智元@微信公众号
作者:新智元编辑部

作为计算机视觉和模式识别的顶级学术会议,每年的CVPR都汇聚了领域技术发展的前沿。而CVPR的最佳论文则更是备受瞩目,多有经典。

2018年的CVPR最佳论文,授予了来自斯坦福大学和加州大学伯克利分校著名教授Jitendra Malik和Silvio Savarese的Taskonomy: Disentangling Task Transfer Learning

下面,新智元将做简单的介绍。


最佳论文

最佳论文题目:Taskonomy: Disentangling Task Transfer Learning

论文地址:https://arxiv.org/pdf/1804.08328.pdf

file

作者来自斯坦福大学和加州大学伯克利分校,包括计算机视觉领域的著名教授Jitendra Malik和Silvio Savarese。

file

不同的视觉任务是相关的,还是毫不相关的?例如,曲面法线(surface normals)是否可以用来简化对图像深度的估计?显然是的,这意味着视觉任务之间存在一种结构。了解这种结构很有好处;它是迁移学习的底层概念,并为识别跨任务的冗余信息提供了一种原则性方法。例如,在相关任务之间无缝地重用监督,或者在一个系统上解决多个任务,而不增加复杂性。

在这篇论文中,作者提出一种完全计算的方法来建模视觉任务的空间结构。这是通过在一个潜在空间的26个2D,2.5D,3D和语义任务中找到(第一阶和更高阶)的迁移学习依赖关系来实现的。其产物是一个用于任务迁移学习(task transfer learning)的计算分类图(computational taxonomic map)。我们研究了这种结构的影响,并利用它们来减少对标记数据的需求。

例如,我们证明了,解决一组10个任务所需的标记数据池的总数可以减少大约2/3个(与独立训练相比),同时保持性能几乎一致。我们提供了一套用于计算和检测这种分类结构的工具,包括一个求解器,用户可以使用它为他们的用例设计有效的监督策略。

file

图1:计算任务分类法(taskonomy)发现的一个示例任务结构。
论文将这一方法分解为4个步骤:

第一步: 特定于任务的建模
第二步:迁移建模
第三步:使用层级分析法(AHP)进行序数标准化
第四部:计算全局分类

file
图2:任务词典。

最佳论文提名

file

Deep Learning of Graph Matching作者:Andrel Zanfir, Cristian Sminchisescu地址:http://openaccess.thecvf.com/content_cvpr_2018/Cam...
SPLATNet: Sparse Lattice Networks for Point Cloud Processing作者:Hang Su, Varun Jampani, Deqing Sun, Subhransu Maji, Evangelos Kalogerakis, Ming-Hsuan Yang, Jan Kautz地址:https://arxiv.org/pdf/1802.08275.pdf
CodeSLAM-learning a Compact, Optimisable Representation for Dense Visual SLAM作者:Michael Bloesch, Jan Czarnowski, Ronald Clark, Stefan Leutenegger, Andrew J. Davison地址:https://arxiv.org/pdf/1804.00874.pdf
Efficient Optimization for Rank-based Loss Functions 作者:Pritish Mohapatra, Michal Rolínek C.V. Jawahar, Vladimir Kolmogorov, M. Pawan Kumar地址:https://arxiv.org/pdf/1604.08269.pdf

最佳学生论文

论文:完全捕获:跟踪脸部、手部和身体的3D变形模型
Total Capture: A 3D Deformation Model for Tracking Faces, Hands, and Bodies
作者:Hanbyul Joo,Tomas Simon,Yaser Sheikh,均来自CMU
我们提出了一个统一的变形模型(deformation model),用于无标记地捕捉人体运动的多个尺度,包括面部表情、身体动作和手势。初始模型是通过局部缝合人体各个部分的模型产生的,我们称之为“弗兰肯斯坦”模型。这个模型可以通过单一的无缝模型完整地表达人体部位的移动,包括面部和手部。通过大规模捕捉穿着日常服装的人,我们优化了弗兰肯斯坦模型,创建了“亚当”模型。“亚当”是一个校准模型,与最初的模型享有相同的骨架层次结构(skeleton hierarchy),但可以表达头发和服装的几何形状,使其可以直接用于人们的日常生活中。最后,我们展示了使用这些模型进行全身运动追踪,同时捕捉大规模的身体动作以及社交群体的微妙脸部和手部动作。

file

论文地址:https://arxiv.org/pdf/1801.01615.pdf

经典论文:Longuest-Higgins奖

Longuet-Higgins 奖是 IEEE 计算机协会模式分析与机器智能(PAMI)技术委员会在每年的 CVPR 颁发的“计算机视觉基础贡献奖”,表彰十年前对计算机视觉研究产生了重大影响的 CVPR 论文。奖项以理论化学家和认知科学家 H. Christopher Longuet-Higgins 命名。

2018 年的Longuet-Higgins 奖被授予了P. Felzenszwalb等人在 2008 年发表的 CVPR 论文“A discriminatively trained, multiscale, deformable part model”。根据谷歌学术搜素引擎,这篇文章的被引次数高达 2075 次。

file
获得经典论文奖的作者上台领奖。图片来源:熊霖

A discriminatively trained, multiscale, deformable part model
作者:Pedro.Felzenszwalb(芝加哥大学),David.McAllester(芝加哥丰田技术研究所),Deva.Ramanan(UC Irvine)
本文介绍了一种用于目标检测的判别训练的多尺度可变形部件模型。我们的系统在平均精度上达到了2006 PASCAL 人体检测竞赛中最优结果的两倍,同样比2007 PASCAL目标检测比赛中20个类别中的10个的最优结果都要好。此系统非常依赖于可变形部件模型。随着可变形部件模型逐渐流行,它的价值并没有在类似PASCAL的较难的数据集上被展示。我们的系统还依赖于判别训练的新方法。我们将一种挖掘难例(Hard Negative Example)的间隔敏感方法与隐藏变量 SVM 结合在一起。隐藏SVM类似于隐藏条件随机场(Hidden CRF)问题,最终是一个非凸规划的训练问题。隐藏SVM是半凸规划问题,但是一旦将隐藏信息指明给正样本,则训练问题变为凸规划问题。我们相信我们的训练方法最终可以利用更多的隐藏信息,例如层次(grammar)模型以及包含隐式三维姿态的模型。

论文地址:

https://ieeexplore.ieee.org/document/4587597

何恺明获 PAMI 年轻研究员奖

另一个奖项是“PAMI 年轻研究员奖”(PAMI Young Researcher Award),这个奖项授予那些博士毕业不超过 7 年并在计算机视觉方面有卓越研究贡献的的年轻研究人员。PAMI 年轻研究员奖自 2013 年起颁发,继承了 2012 年IVC 的“杰出青年研究员奖”(Outstanding Young Researcher Award)。

2018 年的 PAMI 年轻研究员奖得主是德国蒂宾根大学的 Andreas Geiger 和Facebook 人工智能研究所(FAIR)的何恺明。

file

两位获奖者上台领奖。图片来源:熊霖

从以上多个奖项的获奖者来看,虽然华人学者在CVPR的论文提交数量和竞赛上有出色表现,但是获奖的比例并不算高。

大会的一些概况:论文数呈指数级增长,超6500人参会

根据大会主席 Bryan Morse 介绍,今年 CVPR 有 6512 人注册参会,这个数量简直惊人。投稿的论文数量也在呈指数级增长,投稿数量也超过了 3300 篇:

file

在 3309 篇有效投稿中,有 979 篇论文被接收,294 篇长文和短文,149 项赞助和展出,而赞助商费用也超过了 200 万美元。

file



推荐文章
CVPR 2018 | 阿里巴巴&浙大Poster论文:基于直推式无偏嵌入的零样本学习
CVPR 2018 论文解读集锦(190326 更新)

微信公众号: 极市平台(ID: extrememart )
每天推送最新CV干货

成为第一个点赞的人吧 :bowtie:
回复数量: 0
暂无回复~
您需要登陆以后才能留下评论!