论文推荐 | 首个综合开源的多媒体知识提取系统、贝叶斯深度学习综述

文章来源:机器之心@微信公众号

本周的重要论文包括 MIT 和香港科技大学学者的贝叶斯深度学习综述论文等。


目录:

1. GAIA: A Fine-grained Multimedia Knowledge Extraction System

2. A Survey on Bayesian Deep Learning

3. Deep Isometric Learning for Visual Recognition

4. Data Science: A Comprehensive Overview

5. Adaptive Graph Encoder for Attributed Graph Embedding

6. ArXiv Weekly Radiostation:CV更多精选论文


论文 1:GAIA: A Fine-grained Multimedia Knowledge Extraction System

摘要:在本文中,来自 UIUC、哥大等机构的研究者提出了首个综合开源的多媒体知识提取系统,该系统可基于不同的内容源和语言提取大量非结构化异构多媒体数据,并遵循丰富细粒度本体,创建出连贯且结构化的知识库、索引实体、关系和事件。

该研究提出的系统 GAIA 可实现复杂图 query 的无缝搜索,并检索出文本、图像和视频等多媒体证据。GAIA 在近期的 NIST TAC SM-KBP2019 评估中实现了顶级性能。

file

file

推荐:本文斩获 ACL 2020 最佳 Demo 论文奖。


论文 2:A Survey on Bayesian Deep Learning

摘要:一个全面的人工智能系统不仅需要通过视觉和听觉等不同的「感官」来感知环境,还需要对条件甚至因果关系以及相应的不确定性进行推理。在过去十年里,感知任务已经陆续取得重大进展,比如视觉目标识别以及使用深度学习模型的语音识别。但是,对于更高层次的推理,具有贝叶斯属性的概率图模型(Probabilistic Graphical Model, PGM)仍然更加强大和灵活。

近年来,作为一种统一的概率框架,贝叶斯深度学习(Bayesian Deep Learning, BDL)已经紧密结合了深度学习与贝叶斯模型。并且在这个通用框架中,借助深度学习感知文本或图像可以提升更高层次推理的性能。

在本文中,来自麻省理工学院和香港科技大学的两位研究者对贝叶斯深度学习进行了全面的介绍,综述了贝叶斯深度学习在推荐系统、主题模型和控制等方面的最新应用。此外,研究者还探讨了贝叶斯深度学习与神经网络贝叶斯处理等其他相关主题之间的关系和区别。

file

推荐:本文一作王灏(Hao Wang)为 MIT CSAIL 博士后研究员,论文已被 ACM Computing Surveys 接收。


论文 3:Deep Isometric Learning for Visual Recognition

摘要:初始化、归一化和残差连接(skip connection)被认为是训练深度卷积神经网络(ConvNet)并获得最优性能的三大必备技术。

最近,来自加州大学伯克利分校和圣迭戈分校的研究者发布一项研究,提出不使用归一化和残差连接的深度 ConvNet 在标准图像识别基准上也能实现优异的性能。其实现方式是:在初始化和训练期间,令卷积核具备近似保距性(near isometric);使用 ReLU 激活函数的变体,实现保距性。

研究人员进行了大量实验,结果表明此类近似保距网络与残差连接结合后,在 ImageNet 数据集上的性能与 ResNet 相当,在 COCO 数据集上的性能甚至超过 ResNet。

file

file

file

推荐:靠暴力土豪 trial and error 的方式寻找网络结构的风气,应该会很快过去。


论文 4:Data Science: A Comprehensive Overview

摘要:在本文中,来自悉尼科技大学的研究者对数据科学的基础知识进行了全面的综述,涵盖数据分析到数据科学的演变、数据科学的概念、数据科学时代的愿景、数据创新的主要挑战和发展方向、数据分析的本质、数据经济中的新型工业化和服务机遇、数据教育专业和能力、以及数据科学的未来。

file

file

file

推荐:这篇论文首次勾勒出了数据科学领域的全面视图,还提供了关于数据科学和分析的丰富观察、教训和思考。


论文 5:Adaptive Graph Encoder for Attributed Graph Embedding

摘要:在本文中,来自清华大学等机构的研究者提出了一种新颖的属性图嵌入框架自适应图编码器(Adaptive Graph Encoder, AGE)。该框架由两个模块组成,其一,为了更好地减轻节点特征中的高频噪声,AGE 首次应用了精心设计的拉普拉斯算子平滑滤波器;其二,AGE 采用的自适应编码器能够取得滤波后特征的迭代增强,以实现更好的节点嵌入。

在实验部分,研究者使用四个公共基准数据集进行实验,以验证 AGE 在节点聚类和链路预测任务上的效果。

file
AGE 框架图。

file
file

推荐:实验结果表明,AGE 在节点聚类和链路预测任务上始终优于当前 SOTA 图形嵌入方法。


ArXiv Weekly Radiostation

机器之心联合由楚航、罗若天发起的ArXiv Weekly Radiostation,在 7 Papers 的基础上,精选本周更多重要论文,包括CV领域各10篇精选,并提供音频形式的论文摘要简介,详情如下:


本周 10 篇 CV 精选论文是:

1. Long-term Human Motion Prediction with Scene Context.  (from Jitendra Malik)

2. 3D Shape Reconstruction from Vision and Touch.  (from Jitendra Malik)

3. LabelEnc: A New Intermediate Supervision Method for Object Detection.  (from Xiangyu Zhang, Jian Sun)

4. AutoAssign: Differentiable Label Assignment for Dense Object Detection.  (from Jian Sun)

5. End-to-end Interpretable Learning of Non-blind Image Deblurring.  (from Jian Sun, Jean Ponce)

6. Video Prediction via Example Guidance.  (from Xiaokang Yang, Trevor Darrell)

7. Human Trajectory Forecasting in Crowds: A Deep Learning Perspective.  (from Sven Kreiss)

8. Explainable Deep One-Class Classification.  (from Klaus-Robert Müller)

9. Dynamic Group Convolution for Accelerating Convolutional Neural Networks.  (from Matti Pietikäinen, Li Liu)

10. ThreeDWorld: A Platform for Interactive Multi-Modal Physical Simulation.  (from Joshua B. Tenenbaum)

微信公众号: 极市平台(ID: extrememart )
每天推送最新CV干货