论文推荐丨轮腿两用机器人;领域知识图谱综述

内容来源:机器之心微信公众号
参与:杜伟、楚航、罗若天

本周的重要论文包括佐治亚理工学院开发的轮腿两用机器人以及中国石油大学(华东)的领域知识图谱综述论文。

目录:

1. Using Manipulation to Enable Adaptive Ground Mobility

2. Graph Structure of Neural Networks

3. Survey on Domain Knowledge Graph Research

4. Unselfie: Translating Selfies to Neutral-pose Portraits in the Wild

5. NeRF in the Wild: Neural Radiance Fields for Unconstrained Photo Collections

6. Boundary Content Graph Neural Network for Temporal Action Proposal Generation

7. ArXiv Weekly Radiostation:NLP、CV、ML 更多精选论文


论文 1:Using Manipulation to Enable Adaptive Ground Mobility

摘要:在本文中,来自佐治亚理工学院和 GTRI 的研究者提出了一种依赖于操作的物理适应新方法。具体来说,研究者探索多用途操纵器如何促使陆上车辆大幅度改进它们其推进系统,从而优化各种地形环境中的性能。本研究着重于轮子和机械腿之间的物理切换。

他们提出了「可交换推进器」的设计理念,该理念将永磁体(permanent magnet)强大的粘附力与容易分离的几何特征相结合。设计的机器人可以使用其操纵器在轮动和腿动之间自由切换。

file

轮腿机器人展示

file

轮腿构造图

file

轮子模式和腿模式

推荐:实验结果说明了这种方法可以提升能源效率和多功能性。


论文 2:Graph Structure of Neural Networks

摘要:通常来说,常规神经消息传递算法在消息排列下是不变的,因此会忘记信息流如何在网络中传递。近日,阿姆斯特丹大学 ML 教授、高通技术副总裁韦灵思(Max Welling)团队通过研究图的局部对称性,提出了一种通用性更强的算法 。该算法在不同的边上使用不同的核,从而使得网络在局部图和全局图同构上呈现等变化,也因而更易于表达。

具体而言,研究者使用了初级范畴论,将许多显式等变神经网络形式化为自然图网络(Natural Graph Network, NGN),并表明它们的核正是两个函子(functor)之间的自然转换。

file

作为图卷积的消息传递过程

file

NGN 的性能优于 GCN,并且准确率相等表明该模型是完全等变的。

file

在大多数数据集上,该研究提出的局部等变方法性能不逊于全局等变方法。

推荐:研究者提供了一个自然网络的图实例,该网络使用等变消息网络参数化,在多个基准上实现了良好的性能。


论文 3:Survey on Domain Knowledge Graph Research

摘要:知识图谱由 Google 公司提出,作为增强其搜索功能的知识库,在近几年得到了迅速发展。随着知识图谱价值不断地被发掘,各类领域知识图谱也迅速建设起来。本文通过领域知识图谱和通用知识图谱的对比来清晰化领域知识图谱的定义,介绍了领域知识图谱的架构,并以医学知识图谱为例讲解了领域知识图谱的构建技术。最后,本文介绍了当前热门的领域知识图谱的发展状况和应用,对当前领域知识图谱状况进行了较为全面的总结。

file

知识图谱以文档中的实体作为知识单元。

file

领域知识图谱体系架构。

推荐:本文作者来自中国石油大学(华东)计算机科学与技术学院。


论文 4:Unselfie: Translating Selfies to Neutral-pose Portraits in the Wild

摘要:智能手机的出现,让摄影变成了一项大众艺术,也让越来越多的人爱上「自拍」。但自拍照常常存在构图问题,比如不自然的肩膀姿势、占据一小半镜头的手臂,或者极其诡异的视角。要想解决这个问题,可以选择随身携带三脚架或自拍杆,也可以选择随身携带一个朋友作为摄影师(该方法对单身狗极其不友好)。

近日,来自 Adobe 研究院、UC 伯克利、鲁汶大学的研究者开发了一种「自拍」变「他拍」的新技术,通过识别目标的姿势并生成身体的纹理,在给定的自拍背景中完善和合成人物

在这篇论文中,研究者提出了一种叫做 「Unselfie(非自拍)」的图片转换方法,能够将自拍照中的人物,转变为手臂、肩膀、躯干都比较放松舒展的「他拍图像」。它会把所有举起的手臂调整为向下,然后调整服装细节,最后填充好所有暴露出来的背景区域。

file

自拍转他拍效果展示。

file

三段式 pipeline。

file

研究者在 Amazon Mechanical Turk (AMT) 上对该方法以及 DPIG、VUNET 和 PATN 方法进行了用户研究。结果显示,该方法优于其他方法

推荐:除了用来修饰社交媒体上的自拍照,这项技术还有很多应用方式,如果你急需一张证件照,而无人能帮你拍摄,那这项技术就能派上用场。


论文 5:NeRF in the Wild: Neural Radiance Fields for Unconstrained Photo Collections

摘要:最近,来自谷歌的研究者们宣布了一项研究进展,或许能为「卧游」爱好者带来新的希望。话不多说,先来看看效果。目前,研究者已将 NeRF-W 应用于几个具有挑战性的自然文化地标照片集,这些生成的效果图在各项指标上均实现了新的 SOTA。NeRF-W 捕捉了低维潜在嵌入空间中的光线和光度后处理。在两个嵌入之间进行插值,可以平滑地捕获外观的变化,而不影响 3D 几何形状。

file

NeRF-W 模型架构。

file

NeRF-W 的渲染过程。

file
不同方法在 Phototourism 数据集上的定性实验结果。

推荐:研究者已将 NeRF-W 应用于几个具有挑战性的自然文化地标照片集,这些生成的效果图在各项指标上均实现了新的 SOTA。


论文 6:Boundary Content Graph Neural Network for Temporal Action Proposal Generation

摘要:时序动作提名生成 (Temporal action proposal generation) 任务需要从未处理的长视频中精确定位包含高质量动作内容的片段,该任务在视频理解中起着重要的作用。现有的方法多为先生成起止边界,再将起止边界组合成候选动作提名,然后再生成候选时序片段的内容置信度,这种处理方式忽略了边界预测与内容预测之间的联系。

为了解决这个问题,爱奇艺提出了Boundary Content Graph Neural Network (BC-GNN),通过图神经网络对边界和内容预测之间的关系进行建模,通过利用两者之间的内在联系生成更精确的时序边界和可靠的内容置信度分数

在 BC-GNN 中,将候选时序片段的内容(content)作为图的边(edge),将候选时序片段的边界(boundary,开始点和结束点)作为图的节点(node),然后设计了一种更新边和节点特征的推理方法,将更新之后的特征用来预测起始点概率和内容的置信度,最终生成高质量的 proposal。该方法最终在 ActivityNet-1.3 和 THUMOS14 这两个公开数据集的时序动作提名生成任务以及时序行为检测任务上均达到了领先水平。

file
BC-GNN 的整体框架图。

file

图构建模块。

file

研究者在两个通用的数据集上的效果均达到领先水平。

推荐:该方法最终在 ActivityNet-1.3 和 THUMOS14 这两个公开数据集的时序动作提名生成任务以及时序行为检测任务上均达到了领先水平。


论文精选

本周 10 篇 CV 精选论文:

1. Learning Long-term Visual Dynamics with Region Proposal Interaction Networks.  (from Jitendra Malik)

2. Disentangling Human Error from the Ground Truth in Segmentation of Medical Images.  (from Frederik Barkhof, Daniel C. Alexander)

3. End-to-end Birds-eye-view Flow Estimation for Autonomous Driving.  (from Wolfram Burgard)

4. CaSPR: Learning Canonical Spatiotemporal Point Cloud Representations.  (from Leonidas J. Guibas)

5. Weakly-Supervised Semantic Segmentation via Sub-category Exploration.  (from Ming-Hsuan Yang)

6. Mixup-CAM: Weakly-supervised Semantic Segmentation via Uncertainty Regularization.  (from Ming-Hsuan Yang)

7. Learning to Factorize and Relight a City.  (from Alexei A. Efros, Noah Snavely)

8. Open-Edit: Open-Domain Image Manipulation with Open-Vocabulary Instructions.  (from Xiaogang Wang)

9. AR-Net: Adaptive Frame Resolution for Efficient Action Recognition.  (from Aude Oliva, Kate Saenko)

10. Noisy Student Training using Body Language Dataset Improves Facial Expression Recognition.  (from Vikas Kumar)

本周 10 篇 ML 精选论文:

1. Bloom Origami Assays: Practical Group Testing.  (from Bernhard Scholkopf)

2. A Survey on Concept Factorization: From Shallow to Deep Representation Learning.  (from Yan Zhang, Shuicheng Yan)

3. Whole MILC: generalizing learned dynamics across tasks, datasets, and populations.  (from Vince D. Calhoun)

4. Generative Ensemble-Regression: Learning Stochastic Dynamics from Discrete Particle Ensemble Observations.  (from George Em Karniadakis)

5. Learning-based Computer-aided Prescription Model for Parkinson's Disease: A Data-driven Perspective.  (from Yang Gao, Dinggang Shen)

6. Communication-Efficient and Distributed Learning Over Wireless Networks: Principles and Applications.  (from Mérouane Debbah)

7. Graph Wasserstein Correlation Analysis for Movie Retrieval.  (from Tong Zhang, Jian Yang)

8. The Strategic Perceptron.  (from Avrim Blum)

9. Robust Reinforcement Learning using Adversarial Populations.  (from Pieter Abbeel, Alexandre Bayen)

10. Privacy Enhancing Machine Learning via Removal of Unwanted Dependencies.  (from Sun-Yuan Kung)

大叔