论文推荐 | 图结构数据表征学习方法的综合分类法、香港理工最新 GAN 综述论文;

文章来源:机器之心

本周的重要论文包括香港理工大学的最新GAN综述论文以及。

目录:

* Machine Learning on Graphs: A Model and Comprehensive Taxonomy

* Generative Adversarial Networks (GANs): Challenges, Solutions, and Future Directions

* BLEURT: Learning Robust Metrics for Text Generation

* CONFIG: Controllable Neural Face Image Generation

* ArXiv Weekly Radiostation:CV精选论文


论文 1:Machine Learning on Graphs: A Model and Comprehensive Taxonomy

摘要:在本文中,来自斯坦福、南加州大学和 Google AI 的研究者提出了图结构数据表征学习方法的综合分类法,旨在统一几个不同的研究主体。具体而言,他们提出了图编码器-解码器模型(Graph Encoder Decoder Model, GraphEDM)框架,从而将常用的图半监督学习(如 GraphSage、GCN 和图注意力网络)和图表征无监督学习(如 DeepWalk 和 node2vec)算法泛化为一种统一的方法。为了阐明这种方法的通用性,研究者将 30 多种现有方法拟合添加进框架中。他们认为这种统一的观点既可以为理解方法背后的直觉提供坚实基础,也能促进该领域未来的研究。

file
GraphEDM 框架示意图。

file

图表征学习方法的分类。

推荐:对于领域内实践者来说,他们可以参考这种分类法,以更好地理解可用工具和应用,并轻松地找出解决给定问题的最佳方法。


论文 2:Generative Adversarial Networks (GANs): Challenges, Solutions, and Future Directions

摘要:在本文中,来自香港理工大学的研究者对 GAN 设计的进展以及解决 GAN 挑战的优化解决方案进行了全面综述性研究。他们首先指出每个 GAN 设计和优化方法存在的主要研究问题,然后提出新的分类法对相应解决方案进行结构化整理。基于这种新的分类法,研究者对每个解决方案提出的不同 GAN 变体以及它们之间的关系展开了详尽的讨论。最后,研究者根据得出的见解提出了这一快速发展领域中的有前途研究方向。
file
2014 至 2018 年,GAN 在图像生成领域展现出来的能力取得了长足进步。
file

GAN 的基本架构图。

file

本研究中提出的新的分类法。

推荐:**这篇 GAN 综述论文长达 41 页**,主要亮点是基于重新设计后的网络架构、新的目标函数和优化算法提出了 GAN 设计和优化方法的新分类法,并探讨了现有研究工作如何解决存在的挑战。


论文 3:BLEURT: Learning Robust Metrics for Text Generation

摘要:过去几年,文本生成取得了显著的进展。但是,评估指标却出现了滞后,这是因为 BLEU 和 ROUGE 等最流行的机器翻译自动评估方法可能与人类的判断关系不大。

在本文中,来自谷歌研究院的三位作者提出了 BLEURT,这是一种基于 BERT 的学习评估指标,它可以利用数千个可能存有偏见的训练样本来建模人类判断。该方法的关键点在于新型预训练方案使用数百万个样本来帮助模型实现泛化。实验表明,本研究提出的 BLEURT 在过去三年的 WMT 指标共享任务和 WebNLG 竞赛数据集上均取得了 SOTA 结果。与基于 BERT 的普通方法相比,BLEURT 即使在训练数据稀少且分布不均的情况下也能取得更好的结果。

file
在 WMT17 指标共享任务上的对比结果。

file

在 WMT18 指标共享任务上的对比结果。

file

在 WMT19 指标共享任务上的对比结果。

推荐:BLEURT 是一种基于推理的英文文本生成指标,由于它是端到端训练的,所以可以更加准确地建模人类评估。


论文 4:CONFIG: Controllable Neural Face Image Generation

摘要:在本文中,来自微软的研究者提出了一种神经人脸模型 ConfigNet,通过语义上有意义的方式控制输出图像的各个方面,从而朝着精细控制神经渲染迈出重要一步。ConfigNet 在真实面部图像和合成面部渲染上进行训练,该方法使用合成数据将潜在空间分解为与传统渲染 pipeline 输入相对应的元素,从而将头部姿势、面部神情、发型和光照等诸多方面分解。最后研究者提出了一种使用属性检测网络与用户研究相结合的评估标准,并实现了对输出图像属性的 SOTA 单独控制。

file

ConfigNet 学习 分解的潜在空间,其中每一部分对应不同的面部属性。

file
ConfigNet 具有真实图像编码器 E_R 和合成数据编码器 E_S,它们对真实人脸图像 I_R 和合成人脸图像 I_S 的参数θ进行编码。

file
ConfigNet(左)和 PupperGAN(右)方法的效果比较。

推荐:这种新型人脸图像合成方法使得对输出图像的控制达到了前所未有的高度。


ArXiv Weekly Radiostation

机器之心联合由楚航、罗若天发起的ArXiv Weekly Radiostation,在 7 Papers 的基础上,精选本周更多重要论文,包括CV领域10篇精选,详情如下:

本周 10 篇 CV 精选论文是:

1. Condensed Movies: Story Based Retrieval with Contextual Embeddings. (from Max Bain, Arsha Nagrani, Andrew Brown, Andrew Zisserman)

2. Effective Data Fusion with Generalized Vegetation Index: Evidence from Land Cover Segmentation in Agriculture. (from Hao Sheng, Xiao Chen, Jingyi Su, Ram Rajagopal, Andrew Ng)

3. Text Synopsis Generation for Egocentric Videos. (from Aidean Sharghi, Niels da Vitoria Lobo, Mubarak Shah)

4. Efficient convolutional neural networks with smaller filters for human activity recognition using wearable sensors. (from Yin Tang, Qi Teng, Lei Zhang, Fuhong Min, Jun He)

5. SurfelGAN: Synthesizing Realistic Sensor Data for Autonomous Driving. (from Zhenpei Yang, Yuning Chai, Dragomir Anguelov, Yin Zhou, Pei Sun, Dumitru Erhan, Sean Rafferty, Henrik Kretzschmar)

6. Self-Supervised Human Depth Estimation from Monocular Videos. (from Feitong Tan, Hao Zhu, Zhaopeng Cui, Siyu Zhu, Marc Pollefeys, Ping Tan)

7. On Vocabulary Reliance in Scene Text Recognition. (from Zhaoyi Wan, Jielei Zhang, Liang Zhang, Jiebo Luo, Cong Yao)

8. Enhancing Geometric Factors in Model Learning and Inference for Object Detection and Instance Segmentation. (from Zhaohui Zheng, Ping Wang, Dongwei Ren, Wei Liu, Rongguang Ye, Qinghua Hu, Wangmeng Zuo)

9. NTIRE 2020 Challenge on Real Image Denoising: Dataset, Methods and Results. (from Abdelrahman Abdelhamed, Mahmoud Afifi, Radu Timofte, Michael S. Brown, Yue Cao, Zhilu Zhang, Wangmeng Zuo, Xiaoling Zhang, Jiye Liu, Wendong Chen, Changyuan Wen, Meng Liu, Shuailin Lv, Yunchao Zhang, Zhihong Pan, Baopu Li, Teng Xi, Yanwen Fan, Xiyu Yu, Gang Zhang, Jingtuo Liu, Junyu Han, Errui Ding, Songhyun Yu, Bumjun Park, Jechang Jeong, Shuai Liu等)

10. Regression Forest-Based Atlas Localization and Direction Specific Atlas Generation for Pancreas Segmentation. (from Masahiro Oda, Natsuki Shimizu, Ken'ichi Karasawa, Yukitaka Nimura, Takayuki Kitasaka, Kazunari Misawa, Michitaka Fujiwara, Daniel Rueckert, Kensaku Mori)

微信公众号: 极市平台(ID: extrememart )
每天推送最新CV干货