ICCV2019 论文解读汇总(11-14 更新中)

论文速递 Admin ⋅ 于 4周前 ⋅ 2984 阅读

作为计算机视觉领域三大顶会之一,ICCV2019目前已公布了所有接收论文ID(会议接收论文1077篇,总提交4303篇,25%的接收率),相关报道:1077篇!ICCV2019接收结果公布,你中了吗?

此前我们也对CVPR2019的论文做了解读汇总:CVPR2019 | 论文解读汇总,而本帖是对ICCV2019顶会论文解读的实时跟进和整理,欢迎点击文末关注按钮,即可获取本帖最新更新消息。

最佳论文

ICCV 2019 最佳论文解读 | SinGAN:从单幅图像学习生成模型,可应用于多种图像处理操作
成果来自以色列理工学院 (Technion) 和谷歌研究院,论文中SinGAN只用一张图片训练,便可以捕捉图像中,各种图像块的内部分布 (internal distribution of patches) 。训练后,就能生成高质量、多样化的样本,但与原图带有相同的视觉内容

SinGAN:Learning a Generative Model from a Single Natural Image
用一张自然图片,学出一个生成模型
论文地址:https://arxiv.org/abs/1905.01164
源码地址:https://github.com/tamarott/SinGAN


Oral

4、ICCV 2019 Oral | 基于图嵌入的深度图匹配(已开源)
本文为上交研究团队独立完成已被ICCV2019会议录用为Oral的论文,这篇论文聚焦于计算机视觉领域一项历久弥新的问题:图匹配问题,提出了一种基于嵌入方法的深度图匹配算法PCA-GM,为图匹配、尤其是深度图匹配研究提供了全新的思路。

Learning Combinatorial Embedding Networks for Deep Graph Matching
论文链接:https://arxiv.org/abs/1904.00597
代码地址:https://github.com/rogerwwww/PCA-GM


3、ICCV 2019 Oral 论文:KAUST 提出大幅加深图卷积网络的新方法
本文介绍了来自阿卜杜拉国王科技大学一篇 Oral 论文。研究人员在 CNN 结构的启发下在图卷积网络中利用残差、稠密连接和膨胀卷积等结构成功将 GCN 的深度拓展到了 56 层,在增强模型训练稳定性的基础上大幅度提高了图卷积网络的性能

DeepGCNs: CanGCNsGoasDeepasCNNs?
论文链接:https://arxiv.org/pdf/1904.03751.pdf


2、ICCV 2019 Oral-期望最大化注意力网络 EMANet 详解
本文所提出的期望最大化注意力机制(EMA),摒弃了在全图上计算注意力图的流程,转而通过期望最大化(EM)算法迭代出一组紧凑的基,在这组基上运行注意力机制,从而大大降低了复杂度

Expectation-Maximization Attention Networks for Semantic Segmentation
论文地址:https://arxiv.org/abs/1907.13426
代码地址:https://github.com/XiaLiPKU/EMANet
解读视频:极市直播| 第 49 期-李夏:语义分割中的自注意力机制和低秩重建(ICCV Oral,已开源)


1、ICCV 2019 Oral | 三维"ZAO"脸: 单张图片估计人脸几何,效果堪比真实皮肤
相比于最近几天刷遍朋友圈的“ZAO-缝脸造戏“和 "DeepFake" ,今天我们提升一个维度,为给大家介绍如何从2D图片,"ZAO"出超逼真的3D人脸 .

Photo-Realistic Facial Details Synthesis from Single Image
论文链接:https://arxiv.org/abs/1903.10873
Github 链接: https://github.com/apchenstu/Facial_Details_Synthesis


其他接收论文

24、ICCV 2019 | 无需数据集的Student Networks
本文将对 ICCV2019 《Data-Free Learning of Student Networks》会议论文进行解读,实验结果表明,作者所提出的 DAFL 方法在 MNIST、CIFAR、CelebA 等数据集上具有很好的性能,相对于 KD 等方法具有更好的实用性。这篇论文在神经网络压缩领域有相当高的实用价值。

Data-Free Learning of Student Networks
论文地址:https://arxiv.org/pdf/1904.01186
开源地址:https://github.com/huawei-noah/DAFL


23、ICCV 2019 | 上科大、腾讯实现完美舞蹈动作迁移
这项研究使 AI 能够做到近乎完美的动作迁移,还可以实现实时变装,3D 建模等功能,可谓强大。这篇论文已经入选计算机视觉顶会 ICCV 2019。

Liquid Warping GAN: A Unified Framework for Human Motion Imitation,
Appearance Transfer and Novel View Synthesis

论文地址:https://arxiv.org/pdf/1909.12224.pdf
代码地址:https://github.com/svip-lab/impersonator


22、ICCV 2019 | 递归级联网络:基于无监督学习的医学图像配准
医学图像配准在医学图像处理任务中非常重要的,本文介绍的是微软的一篇ICCV2019论文,提出了一种深度递归级联的网络结构,应用于无监督端到端的医学图像配准.与其它方法相比,递归级联网络带来了显著的性能提升。

Motion Guided Attention for Video Salient Object Detection
论文地址:https://arxiv.org/pdf/1909.07061.pdf
代码地址:https://github.com/lhaof/Motion-Guided-Attention


21、ICCV 2019 | 港大提出视频显著物体检测算法MGA,大幅提升分割精度
本文解读了香港大学联合中山大学和深睿医疗人工智能实验室 ICCV2019 论文,该文提出了基于运动注意力的视频显著物体检测方法(MGA),比之前最好的算法在DAVIS和FBMS数据集上分别提升了4个和8个百分点!

GitHub 链接:https://github.com/microsoft/Recursive-Cascaded-Networks


20、ICCV2019 | Gaussian YOLOv3,更强的YOLOv3
本文中介绍的ICCV2019论文即Gaussian YOLOv3 通过高斯分布的特性,改进YOLOv3使得网络能够输出每个检测框的不确定性,从而提升了网络的精度。

Gaussian YOLOv3: An Accurate and Fast Object Detector Using Localization Uncertainty for Autonomous Driving
论文地址:https://arxiv.org/abs/1904.04620
Github 链接:https://github.com/jwchoi384/Gaussian_YOLOv3


19、ICCV 2019 | 针对不规则场景文字识别的对称约束矫正网络
本文作者提出了一种对称约束矫正网络(ScRN),该网络用文本中心线和一些几何属性进行约束,可以产生更加准确的控制点,进而提高对弯曲文本的识别精度。


18、ICCV 2019 丨微软亚洲研究院精选论文解读
本文将介绍入选 ICCV 2019、由微软亚洲研究院出品的5篇论文,内容涵盖医学图像配准、空间注意力机制以及图像深度估计等多个前沿主题。


17、ICCV 2019 |当前领域最佳, 旷视研究院提出基于互向导的半监督皮肤检测新方法
旷视研究院提出一种新的基于数据驱动的半监督的皮肤检测方法,用于实现人体图像的鲁棒皮肤检测。该网络可以半监督的方式训练,即不需要 groundtruth 的两个类型存在于一个训练数据样本之内。大量实验证明互向导、半监督损失以及多种训练策略的有效性。实验结果也表明本文方法是皮肤检测领域的当前最佳

Semi-supervised Skin Detection by Network with Mutual Guidance
论文地址:https://arxiv.org/abs/1908.01977


16、ICCV 2019 | 旷视研究院提出MetaPruning:基于元学习和AutoML的模型压缩新方法
本文提出一种用于通道剪裁的元学习方法——MetaPruning,其核心是最前沿的AutoML 算法,旨在打破传统通道剪裁需人工设定每层剪裁比例,再算法迭代决定裁剪哪些通道的过程,直接搜索最优的已剪裁网络各层通道数。它的主要算法是通过学习一个元网络 PruningNet,为不同的剪裁结构生成权重,极大程度加速最优剪裁网络的搜索过程

MetaPruning: Meta Learning for Automatic Neural Network Channel Pruning
论文地址:https://arxiv.org/abs/1903.10258
开源代码:https://github.com/megvii-model/MetaPruning


15、ICCV 2019 | 微软开源跨视图融合的3D人体姿态估计算法,大幅改进SOTA精度
本文大幅降低了3D姿态估计的误差,在H36M数据集上,MPJPE(关节点误差均值)从之前最好结果的52mm直降到26mm,可谓大幅改进,相信该算法必将成为该领域重要参考

论文地址:https://chunyuwang.netlify.com/img/ICCV_Cross_view_camera_ready.pdf
代码地址:https://github.com/microsoft/multiview-human-pose-estimation-pytorch


14、ICCV 2019 | 四小时搜索NN结构,厦大提出快速NAS检索方法
在本文中,作者提出了一种基于多项式分布估计快速 NAS 算法,它将搜索空间视为一个多项式分布,我们可以通过采样-分布估计来优化该分布,从而将 NAS 可以转换为分布估计/学习

论文地址:https://arxiv.org/abs/1905.07529
论文代码:https://github.com/tanglang96/MDENAS


13、ICCV 2019 | 基于医疗影像的早期诊断中不确定样本的检出
本文的目的是通过模型将上述问题解决,从而精确地将这些不确定数据检验出来,以建议患者通过随访检验来跟进疾病发展情况

12、ICCV 2019 | 旷视研究院提出新型矫正网络ScRN,优化场景文字识别性能
提出一个基于对称性约束的矫正网络 ScRN,用于场景文字识别。通过共享的 backbone,ScRN 显著提升文字识别性能的同时,所增加的计算量却可忽略不计

论文地址:https://arxiv.org/abs/1908.01957


11、ICCV 2019 | 时序动作提名,边界匹配网络详解(ActivityNet冠军方案)
本文的主要贡献是通过引入一种全新的时序提名评估机制以及高效的特征采样方式,来提升了BSN方法的性能和效率,这个采样方式之所以高效,是因为每次前向时采样矩阵是不变的,因此可以预先计算得到,实质上算是用空间换时间吧。

论文链接:https://arxiv.org/abs/1907.09702


10、ICCV 2019 | 北邮提出高阶注意力模型,大幅改进行人重识别SOTA精度
关于注意力模型的工作Mixed High-Order Attention Network for Person Re-Identification,来自北京邮电大学的学者提出一种高阶注意力模型,并将其应用于行人重识别建模,显著改进了现有SOTA模型的精度,这种新出的注意力模型,很显然也可以适用于其他视觉问题建模
论文地址:https://arxiv.org/abs/1908.05819
代码链接:https://github.com/chenbinghui1/MHN


9、锁定精彩!百度 ICCV 2019 提出小视频自动截取数据集TruNet
机器能在体育赛事、娱乐影视等视频中自动截取精彩小视频吗?前几天百度公布的一篇 ICCV 2019 的论文中提出了这个新CV问题,并且构建了业内首个该方向数据集TruNet。
这不同于传统的视频精彩片段检测和视频摘要问题,在这个问题中,最重要的是保持视频情节完整,百度在这篇文章中称这个问题为story-preserving long video truncation(也许可以翻译为故事完整的长视频截断),该问题需要一种算法来自动将长视频截断为多个简短且吸引人的子视频,每个子视频都包含不间断的故事

论文地址:https://arxiv.org/abs/1910.05899v1
数据集地址:https://ai.baidu.com/broad/download


8、ICCV 2019 提前看 | 三篇论文,解读神经网络压缩
一篇关于神经网络压缩领域的论文解读,通过对ICCV 2019中的三篇论文进行分析,读者可以了解目前的发展趋势。

7、ICCV 2019 | 旷视研究院 11 篇论文入选 ICCV 2019(含目标检测/Re-ID/文本检测/模型剪枝等)
旷视研究院 11 篇论文入选 ICCV 2019,入选内容涵盖目标检测、Re-ID、文本检测、模型剪枝等方向。

6、ICCV2019| LearningToPaint:一个绘画 AI
如何让机器像画家一样,用寥寥数笔创造出迷人的画作?使用深度强化学习方法,我们让 AI 学会用数百个笔画重现纹理丰富的自然图像,AI 的训练过程不需要人类绘画的经验或笔画轨迹数据。

Arxiv: https://arxiv.org/abs/1903.04411
Github: hzwer/LearningToPaint


5、ICCV2019|已开源,华为诺亚方舟实验室提出无需数据网络压缩技术
提出了在无数据情况下的网络蒸馏方法(DAFL),比之前的最好算法在MNIST上提升了6个百分点,并且使用resnet18在CIFAR-10和100上分别达到了92%和74%的准确率(无需训练数据)

论文地址:https://arxiv.org/pdf/1904.01186
开源地址:https://github.com/huawei-noah/DAFL


4、ICCV2019|基于全局类别表征的小样本学习

项目地址:https://tiangeluo.github.io/GlobalRepresentation.html
论文地址:https://arxiv.org/abs/1908.05257


3、ICCV2019|推理时间压缩三倍,诺亚方舟实验室开源针对GAN的剪枝算法
该论文首次提出针对GAN中生成网络的剪枝算法,在图像迁移任务中,可以在保持迁移效果的情况下,网络参数量和计算量压缩四倍以上,实测推理时间压缩三倍以上。

论文地址:https://arxiv.org/abs/1907.10804
开源地址:https://github.com/huawei-noah/GAN-pruning


2、ICCV2019|基于Anchor point的手势及人体3D姿态估计方法A2J
文章首次提出了将经典目标检测的anchor的概念应用到姿态估计任务中来,设计了一种简洁有效的方法,最终在包括三个手势姿态估计数据集(HANDS2019,ICVL,NYU)以及两个人体姿态估计数据集(ITOP,K2HPD)上取得了state-of-the-art的效果。

论文链接:https://arxiv.org/abs/1908.09999
GitHub: https://github.com/zhangboshen/A2J


1、ICCV 2019 | 基于语义连贯性的图像修复,全新的迭代 Coherent Attention 机制提升修复效果(含源码)
以往图像修复的工作没有考虑特征连续性从而导致修复色 彩或线条断层的问题,本文提出了一种全新的迭代 Coherent Attention 机制, 保证了生成特征连续性以及全局语义信息的一致性。

论文链接:https://arxiv.org/abs/1905.12384
代码链接:https://github.com/KumapowerLIU/CSA-inpainting



推荐阅读:
1987 ~2019 年历届 ICCV 最佳论文(Marr Prize Paper)汇总
ICCV 2017 论文解读集锦
CVPR2019 最全整理:全部论文下载,GitHub 源码汇总、直播视频、论文解读等

微信公众号: 极市平台(ID: extrememart )
每天推送最新CV干货

本帖已被设为精华帖!
本帖由 sophie 于 6天前 置顶
回复数量: 0
暂无回复~
您需要登陆以后才能留下评论!