论文推荐 | 周志华深度森林新论文;谷歌目标检测新 SOTA

本周论文推荐:既有周志华有关深度森林的新论文和Jeffery Dean机器学习进展研究综述,也有一种新的 EfficientDet 目标检测器、实现了新的 SOTA 水平。

目录:

1、Multi-label Learning with Deep Forest

2、The Deep Learning Revolution and Its Implications for Computer Architecture and Chip Design

3、CenterMask : Real-Time Anchor-Free Instance Segmentation

4、EfficientDet: Scalable and Efficient Object Detection



论文 1:Multi-label Learning with Deep Forest

摘要:在多标签学习领域,每个势力都和多个表现相关联,因此最重要的任务是如何让构建的模型学到标签关系。深度神经网络通常会联合嵌入特征和标签信息到一个隐式空间,用于发掘表现关系。然而,这一方法能够成功是因为对模型深度的准确选择。深度森林是近来基于集成树模型的深度学习框架,不依赖反向传播。研究者采用了深度森林算法用于解决多标签问题。因此,他们设计了 MLDF 方法,包括两个机制:重复利用度量感知特征和度量感知层增长。度量感知特征重复利用机制能够根据置信度重新使用之前层使用过的好的特征。而度量感知层增长机制则保证 MLDF 会根据性能瓶颈逐渐提升模型的复杂度。MLDF 同时解决了两个问题:一个是控制模型复杂度以减少过拟合问题,另一个是根据用户需求优化性能评价,因为在多标签学习评价中有很多不同的度量标准。实验说明,研究者提出的方法不仅在基准测试的 6 个评价标准上胜过了其他方法,还具有多标签学习中标签关系发掘和其他不错的特性。

file
▲图 1:多标签深度森林算法(NLDF)。每个层集成两个不同的森林(上部的黑色和下部的蓝色)。

file
▲度量感知特性重复利用的算法图示。

file
▲度量感知层增长的图示。

推荐:近日,南大周志华等人首次提出使用深度森林方法解决多标签学习任务。该方法在 9 个基准数据集、6 个多标签度量指标上实现了最优性能。



论文 2:The Deep Learning Revolution and Its Implications for Computer Architecture and Chip Design

摘要:过去十年我们见证了机器学习的显著进步,特别是基于深度学习的神经网络。机器学习社区也一直在尝试构建新模型,用于完成具有挑战性的工作,包括使用强化学习,通过和环境进行交互的方式完成难度较大的任务,如下围棋、玩电子游戏等。机器学习对算力的需求无疑是庞大的,从计算机视觉到自然语言处理,更大的模型和更多的数据往往能够取得更好的性能。在摩尔定律时代,硬件进步带来的算力增长尚且能够满足机器学习的需求,但当摩尔定律被榨干后,怎样让硬件中的算力资源被机器学习模型充分利用成了下一个需要探讨的问题。

file
▲摩尔定律和后摩尔定律时代的计算需求增长态势,其中自 1985 年至 2003 年,通用 CPU 性能每 1.5 年提升一倍;自 2003 年至 2010 年,通用 CPU 性能每 2 年提升一倍;而 2010 年以后,通用 CPU 性能预计每 20 年才能提升一倍。

file
▲AlexNet、GoogleNet、AlphaZero 等重要的机器学习网络架构以及它们的计算需求增长态势。

file
▲自 2009 年以来,机器学习相关 Arxiv 论文发表数量的增长态势(蓝)和摩尔定律增长率(红)。

推荐:深度学习和硬件怎样结合?Jeff Dean 长文介绍了后摩尔定律时代的机器学习研究进展,以及他对未来发展趋势的预测判断。



论文 3:CenterMask : Real-Time Anchor-Free Instance Segmentation

摘要:在本文中,来自韩国电子通讯研究院(ETRI)的两位研究者提出了一种简单却高效的无锚点实例分割方法,被称为 CenterMask,该方法将一个新颖的空间注意力导向 mask(SAG-Mask)添加进 anchor-free 单级目标检测器中(FCOS),后者与 Mask R-CNN 相同。通 SAG-Mask 分支嵌入到 FCOS 目标检测器中,它可以利用空间注意力地图来每个框上预测分割掩码,从而有助于分割掩码。此外,研究者还展示了一种性能提升的 VoVNetV2,它有以下两种有效策略:添加残差连减弱接以缓解更大 VoVNet 的饱和问题;利用有效的挤压-激励(effective Squeeze-Excitation,eSE)处理原始 SE 的信息损失问题。借助于 SAG-Mask 和 VoVNetV2,研究者设计了分别针对大模型和小模型的 CenterMask 和 CenterMask-Lite。其中 CenterMask 的性能优于当前所有的 SOTA 模型,并且速度较这些模型更快;CenterMask-Lite 也实现了 33.4% 的 mask AP 和 38.0% 的 box AP 结果,并在 Titan Xp 显卡上以 35fps 的速度分别超出了当前 SOTA 模型 2.6% 和 7.0% 的 AP gain。研究者希望 CenterMask 和 VoVNetV2 可以分别作为各种视觉任务上实时实例分割和骨干网络的可靠基线。

file
▲CenterMask 架构。

file
▲CenterMask 与其他方法在 COCO tes-dev2017 数据集上的实例分割和检测性能对比。

推荐:论文作者称「CenterMask 的性能优于当前所有的 SOTA 模型,并且速度较这些模型更快」,分割精度也打败了先前所有的 State-of-the-art!



论文 4:EfficientDet: Scalable and Efficient Object Detection

摘要:在计算机视觉领域,模型效率已经变得越来越重要。在本文中,研究者系统地研究了用于目标检测的各种神经网络架构设计选择,并提出了一些关键的优化措施来提升效率。首先,他们提出了一种加权双向特征金字塔网络(weighted bi-directional feature pyramid network,BiFPN),该网络可以轻松快速地进行多尺度特征融合;其次,他们提出了一种复合缩放方法,该方法可以同时对所有骨干、特征网络和框/类预测网络的分辨率、深度和宽度进行统一缩放。基于这些优化,研究者开发了一类新的目标检测器,他们称之为 EfficientDet。在广泛的资源限制条件下,该检测器始终比现有技术获得更高数量级的效率。具体而言,在没有附属条件的情况下,EfficientDet-D7 在 52M 参数和 326B FLOPS1 的 COCO 数据集上实现了 51.0 mAP 的 SOTA 水平,体积缩小了 4 倍,使用的 FLOPS 减少了 9.3 倍,但仍比先前最佳的检测器还要准确(+0.3% mAP)。

推荐:本文探讨了计算机视觉领域的模型效率问题,分别提出了加权双向特征金字塔网络和复合缩放方法,进而开发了一种新的 EfficientDet 目标检测器,实现了新的 SOTA 水平。


参与:杜伟、一鸣
来源:机器之心@微信公众号


推荐阅读:
论文推荐 | 最新的 SOTA 论文、计算机视觉领域的综述和回顾论文
论文推荐 | 李飞飞、吴恩达新论文;Adobe 用 GAN 生成动画
论文推荐|谷歌推出视觉领域的基准 VTAB;最优学习论文 85% 规则

file
△ 关注极市平台
获得最新CV干货

微信公众号: 极市平台(ID: extrememart )
每天推送最新CV干货