论文推荐 | 2019 安卓手机 AI 性能评测;视频架构学习新方法;自动驾驶论文综述

在本周的论文中,大家可以了解到 2019 年安卓手机的 AI 性能测评;兼具运行速度和准确率的视频架构学习新方法 Tiny Video 模型。此外,读者还可以看到有关自动驾驶的论文综述和来自网飞公司的,在二元分类任务表现出良好准确率的 Hammock 模型


目录:

1、AI Benchmark: All About Deep Learning on Smartphones in 2019
2、A Survey of Deep Learning Techniques for Autonomous Driving
3、Tiny Video Networks
4、Gradient Boosted Decision Tree Neural Network


论文 1:AI Benchmark: All About Deep Learning on Smartphones in 2019

作者:Andrey Ignatov、Radu Timofte、Andrei Kulik 等
论文链接:https://arxiv.org/abs/1910.06663v1

摘要:过去两年,移动 AI 加速器的性能一直在快速提升,每出现一代新的系统级芯片(Soc),性能就会提升近两倍。当前的第四代移动 NPU 性能已经接近不久前英伟达推出的 CUDA 兼容显卡性能,并且加之以移动深度学习框架性能的提升,第四代 NPU 甚至可以在移动设备端上运行复杂和深度 AI 模型。在本文中,来自苏黎世联邦理工学院、谷歌研究院和华为、高通、三星、联发科、紫光展锐等多家移动端芯片厂商的研究者评估并对比了高通、海思、三星、联发科和紫光展锐为 AI 推理提供硬件加速的芯片组的性能结果。此外,他们还探讨了安卓 ML pipeline 近来的变化,概述了深度学习模型在移动端设备上的部署情况。

file

图 1:移动端 AI 加速器的性能演变。

file

移动设备 AI 性能排行榜。

推荐:瑞士苏黎世联邦理工学院去年开发了一款名为「AI Benchmark」的应用,对多款搭载深度学习加速芯片的移动设备进行基准测试。最近,AI Benchmark 已经更新到了 3.0,研究者也发布了最新的测试结果。据论文数据显示,麒麟 990(5G 版)的 AI 性能远超高通骁龙 855+,性能甚至接近常见云服务 GPU 英伟达 Tesla K80 的四分之三。


论文 2:A Survey of Deep Learning Techniques for Autonomous Driving

作者:Sorin Grigorescu、Bogdan Trasnea、Tiberiu Cocias、Gigel Macesanu
论文链接:https://arxiv.org/abs/1910.07738v1

摘要:过去十年,得益于深度学习和人工智能领域的发展,自动驾驶汽车技术的进步越来越快。本篇论文概述了自动驾驶领域当前的 SOTA 深度学习技术。研究者首先展现了基于 AI 的自动驾驶架构、卷积和循环神经网络以及深度强化学习范式。这些方法论为驾驶场景感知、路径规划、行为仲裁和运动控制算法奠定了基础。研究者还探究了模块化感知规划-行动管道和端到端系统,其中前者各模块通过深度学习方法构建,后者直接将感知信息映射到操纵指令。此外,他们还对自动驾驶 AI 架构设计过程中遇到的挑战,如安全、训练数据源和计算硬件等自动驾驶 AI 架构设计过程中遇到的挑战提出了应对方法。

推荐:这是一篇有关自动驾驶深度学习技术的概述论文,介绍并比较了当前自动驾驶领域的深度学习和 AI 方法,使读者深入了解它们的优势和不足,并有助于做出更好的设计选择。


论文 3:Tiny Video Networks

作者:AJ Piergiovanni、Anelia Angelova、Michael S. Ryoo
论文链接:https://arxiv.org/abs/1910.06961v1

摘要:视频理解是一个富有挑战性的问题,对现实世界自动智能体的性能产生重大影响。然而,到目前为止,相关解决方案依然是计算密集型,并且在强大的 GPU 中,最快的算法对每个视频片段也需要运行半秒多的时间。在本文中,研究者提出一种新颖的视频架构学习方法——Tiny Video 网络(Tiny Video Network),这种网络可以自动设计高效的视频理解模型。实验表明,这种 tiny video 模型的性能表现非常好,在 CPU 和标准 GPU 上针对单个视频的运行速度分别为 37 毫秒和 10 毫秒。

file

Tiny Video Network(TVN)在单个 CPU 和标准 GPU 上的运行速度。

file

在 Moments-in-Time(MiT)数据集上,Tiny Video Network(TVN)与其他视频理解模型的 CPU 运行速度和模型准确率对比。

推荐:在这篇论文中,来自 Robotics at Google 团队的三位研究者提出了一种自动学习 Tiny Video 网络架构的新方法,这些视频模型兼具运行速度和准确率的优势。运行速度较当前视频模型快了几百倍,并且参数更少。这些模型既可以用于实时机器人应用中,也可以在移动端设备上运行。


论文 4:Gradient Boosted Decision Tree Neural Network

作者:Mohammad Saberian、Pablo Delgado、Yves Raimond
论文链接:https://arxiv.org/abs/1910.09340

摘要:在本文中,研究者提出了一种方法来构建类似于决策树集合的神经网络。他们首先展示了如何将学习到的决策树集合转换为拥有单隐层和输入变换的单个神经网络。然后,他们释放了这个网络的部分特质,例如用于训练近似等效决策树集合的阈值和激活函数。最终得出的模型 Hammock 极其简单:一个完全连接的双层神经网络,其中输入得到了量子化和独热编码。在大小数据集上的实验表明,这种简单的方法能够实现与梯度增强决策树相当的性能。

file

图 1:左:决策树;中:决策树等效网络;右:Hammock 模型。

file

表 1:Hammock 模型与其他方法(如 XGBoost 等)在不同数据集上表现出的准确率对比。

推荐:来自网飞公司的三位研究者提出了一种类似于决策树的 Hammock 模型,该模型在 6 个 UCI 数据集(Statlog、Letter、Optical Digits、Poker、Shuttle 和 Pen Digits)上的多类分类性能以及在网飞公司内部数据集(Netflix Internal)上的二元分类任务都表现出了良好的准确率。


参与:杜伟
来源:机器之心@微信公众号(ID:almosthuman2014)

推荐阅读:
ICCV 2019 提前看 | 三篇论文,解读神经网络压缩
最强汇总 | 计算机科学顶会最佳论文汇总 since 1996( AAAI/ CVPR / ICCV/ ACL/ CHI/CIKM 等)
最前沿:视觉推理(Visual Reasoning),神经网络也可以有逻辑
冠军方案 | 第二届中国 “高分杯” 美丽乡村大赛(遥感图像)第一名总结

微信公众号: 极市平台(ID: extrememart )
每天推送最新CV干货