• 问答
  • 技术
  • 实践
  • 资源

  • 0

    关注
  • 0

    获赞
  • 0

    精选文章
近期动态
  • 专栏文章
  • 社区提问
【Arxiv】 GKAT: Graph Kernel Attention Transformers 为线性注意力加上图结构先验

来源 | LMissher 线性注意力: 线性注意力是self-attention的一个优化流派,能将复杂度从 优化到 。具体的,注意力机制可以表示为: 其中 ,, 是通过输入线性变换得到的。线性注意力的思想是利用矩阵乘法的结合率...

  • 0
  • 0
  • 1.6k
基于 OneFlow 实现量化感知训练

来源 | GiantPandaCV 本文介绍了量化感知训练的原理,并基于OneFlow实现了一个量化感知训练Demo,并介绍了在具体实现中的各种细节。希望对想学习量化感知训练的读者有用,本文仅做学习交流。 0x0. 前言 这篇文章主要...

  • 0
  • 0
  • 1.5k
解读​YOLOX: Exceeding YOLO Series in 2021

来源|AI公园 1. YOLOX 1.1 YOLOX-DarkNet53 YOLOv3 baseline  以Darknet53作为Baseline,给大家介绍如何一步一步过渡到现在的YOLOX-DarkNet53。YOLOv3是以Darknet53为主干,后面再加上SPP。我们对训练策略进行了一些...

  • 1
  • 0
  • 3.3k
python + opencv + dlib 实现实时唇色变换 | 虚拟上妆

来源|AI算法与图像处理 大家好,今天跟大家分享一个利用python + opencv + dlib 实现一个带滑动条控制的唇色变换案例! 大致内容包括: 1、demo展示 2、思路剖析 3、算法实现 一、demo效果展示 demo已经上传到视频...

  • 0
  • 0
  • 2.0k
透过 Transformer 重新看 OCRNet

来源|RainBowSecret 最近基于Transformer结构设计的骨干网络在视觉的很多任务上都取得了很好的结果,我们在这里也透过Transformer结构重新梳理一下我们的OCRNet[1]和Transformer[2]的联系,本文讨论的内容大部分也都...

  • 0
  • 0
  • 2.3k
即插即用丨 Triplet Attention 机制让 Channel 和 Spatial 交互更加丰富(附开源代码)

作者丨ChaucerG 来源丨AI人工智能初学者 论文下载地址和代码开源地址:https://github.com/LandskapeAI/triplet-attentionhttps://arxiv.org/abs/2010.03045 在本文中研究了轻量且有效的注意力机制,并提出了Triplet...

  • 0
  • 0
  • 2.5k
浅谈混合精度训练

作者丨Dreaming.O@知乎 来源丨https://zhuanlan.zhihu.com/p/103685761 本文主要记录下在学习和实际试用混合精度过程中的一些心得总结和建议。 0x01. 前言: 以前一直看到不少混合精度加速模型训练的工作,受限于手上...

  • 0
  • 0
  • 2.1k
拿到 2021年灰飞烟灭的算法岗 offer 的大佬们,简历上都有什么?

经历一 作者丨SleepyBag 末流 985 硕士,本科普通 211,目前 3 算法意向书,字节,快手,猿辅导。 对于末流 985 来说,应该也算还可以的结果。感觉也有资格说一下自己的经验。 我的简历没有提问里面说的那么牛逼。首...

  • 0
  • 0
  • 2.9k
训练轮数降至 1/10、性能却更好,商汤等提出升级版 DETR 目标检测器

作者丨Synced 来源丨机器之心 论文链接:https://arxiv.org/abs/2010.04159 DETR收敛慢、计算复杂度高的固有缺陷催生了可变形DETR 当今的目标检测器大多使用了人工设计的组件,如锚框生成、基于规则的训练目标分配、...

  • 0
  • 0
  • 1.4k
PyTorch 的动态图

作者丨Gemfield@@知乎 来源丨https://zhuanlan.zhihu.com/p/61765561 、https://zhuanlan.zhihu.com/p/65822256 PyTorch的动态图(上) 背景 PyTorch的动态图框架主要是由torch/csrc/autograd/下的代码实现的。这个...

  • 1
  • 0
  • 1.8k
Im2Col+GEMM 的改进方法 MEC,一种更加高效的卷积计算策略

作者丨BBuf@知乎 来源丨https://zhuanlan.zhihu.com/p/264554159 国庆闲在家里偶然看到了这篇对Im2Col+GEMM实现卷积进行改进的文章,然后去读了读顺便实现了一下,并在本文给出了一个测试结果。从结果来看,这个算法...

  • 0
  • 0
  • 2.8k
基于深度学习的单目深度估计综述

来源丨点云PCL Monocular Depth Estimation Based On Deep Learning: An Overview 原作者:Chaoqiang Zhao, Qiyu Sun, Chongzhen Zhang 翻译:particle 论文摘要 深度信息对于自动驾驶系统的感知和估计自身位姿是十...

  • 0
  • 0
  • 3.0k
一文看懂目标检测边界框概率分布

来源|曲終人不散丶@知乎,https://zhuanlan.zhihu.com/p/151398233 众所周知,CNN的有监督学习通常是建立在给定训练数据集之上的,数据集的标签(也称为GT),决定了人类期望模型学习的样子。它通过损失函数、优化器...

  • 0
  • 0
  • 2.3k
基于深度模型的 Out of Distribution (OOD) 检测相关方法介绍

作者|kinredon,https://zhuanlan.zhihu.com/p/102870562 本文已获作者授权,不得二次转载 最近看了一些Out of Distribution(OOD) detection方面的论文,本文旨在介绍在深度学习背景下的 OOD detection 的相关方法...

  • 0
  • 0
  • 2.0k
人体姿态估计 (Human Pose Estimation) 常用方法总结

来源|Poeroz,https://zhuanlan.zhihu.com/p/104917833 本文已获作者授权,不得二次转载 前言 上学期搬砖期间做了一些pose estimation相关的工作,但一直没有系统的整理过相关方法。近日疫情当头封闭在家,闲暇之余...

  • 0
  • 0
  • 4.5k
超全的机器学习算法岗面试与提问总结

来源|狗皮膏药@知乎 就自己的经验总结一些准备机器学习算法岗位求职的粗浅经验,简要地分享一下。一个完整的机器学习工程师的面试过程主要有以下这些环节:自我介绍、项目介绍、算法推导和解释、数据结构与算法题(...

  • 1
  • 0
  • 2.4k
深度学习代码和实验管理的「奇技淫巧」

深度学习模型结构变化程度大,参数多,那么如何高效的进行代码和实验管理?对此,本文整理了一些有价值的观点。 经验总结一 作者:武博文https://www.zhihu.com/question/269707221/answer/470576066 git管理代码是...

  • 0
  • 0
  • 2.2k
提高 3D CNN 时空融合分析效率的秘诀|CVPR2020

来源|微软研究院AI头条 极市导读:时空融合(Spatiotemporal fusion)是三维卷积神经网络(3D CNNs)的关键要素,它决定了网络前馈过程中每一层如何提取、融合空间信号和时间信号。目前已有的时空融合分析方法囿于...

  • 0
  • 0
  • 2.2k
原地踏步还是 “第二春”?知乎热议:如何评价 DETR,基于 Transformer 的目标检测新思路

来源|机器之心\&知乎 编辑|极市平台 DETR简介 近年来,Transformer 成为了深度学习领域非常受欢迎的一种架构,它依赖于一种简单但却十分强大的机制——注意力机制,使得 AI 模型有选择地聚焦于输入的某些部分...

  • 0
  • 0
  • 5.6k
Self-Supervised Learning 的近期发展综述(2018–2020)

来源|https://medium.com/@kelispinor/簡介-self-supervised-learning-的近期發展-2018-2020-a3872662727d 编辑|Fei Ding@知乎&极市平台 本文仅作学术分享,著作权归作者所有。如侵权,请联系后台删文处理。...

  • 0
  • 0
  • 2.7k
视觉注意力机制 | Non-local 模块与 Self-attention 的之间的关系与区别?

来源|AI算法修炼营 什么是视觉中的注意力机制? 计算机视觉(computer vision)中的注意力机制(attention)的基本思想就是想让系统学会注意力——能够忽略无关信息而关注重点信息。近几年来,深度学习与视觉注意力机...

  • 0
  • 0
  • 3.3k
在小目标检测上另辟蹊径的 SNIP

作者:BBuf 1. 前言 相信大家都或多或少的熟悉一些检测器,不知道你是否思考过这样一个问题?FPN的多特征图融合方式一定是最好的吗?如果你看过ASFF这篇论文的话,你应该知道这篇论文的出发点就是如何对不同尺度的特...

  • 0
  • 0
  • 3.0k
旷视提出 DRConv:动态区域感知卷积,提升分类 / 检测 / 分割性能

本文授权转自知乎作者张凯,https://zhuanlan.zhihu.com/p/136998353​。未经作者许可,不得二次转载 背景 《Dynamic Region-Aware Convolution》是2020年旷视在arXiv上的新论文,该论文实际上是在动态卷积(local形...

  • 0
  • 0
  • 3.5k
从生成注意力模型出发,解决视频处理中动作-上下文混淆关键问题|CVPR2020

来源:微软研究院AI头条 极市导读:爆发式增长的海量热门视频正在对视频处理技术提出更高的要求,弱监督学习因此越来越重要。针对弱监督动作定位中的关键问题,微软亚洲研究院提出了一种新的思路,从特征表示的角度...

  • 0
  • 0
  • 2.3k
从 800 个 GPU 训练几十天到单个 GPU 几小时,看神经架构搜索如何进化

来源|机器之心 神经架构搜索(NAS)取代了人类「第二阶」的调参工作,使我们能以两层黑箱的方式寻找最优神经网络。这一模式如果能物美价廉地应用,自然是很诱人,要知道「800 个 GPU 训练 28 天」基本不是个人承受...

  • 0
  • 0
  • 1.8k
CVPR2020 | 3D 目标检测新框架:3DSSD

来源:3D视觉工坊@微信公众号 论文地址:https://arxiv.org/pdf/2002.10187.pdf 代码地址:https://github.com/tomztyang/3DSSD 前言 cvpr2020的研究工作,于2020/4/9日开源,如下图所示,目前被接收的文章有在K...

  • 1
  • 1
  • 3.7k
加载更多
他的关注
他关注的
关注他的
    的专业名片

    • NaN

      关注
    • NaN

      获赞
    • NaN

      精选文章
    所获殊荣

    扫描二维码,进入极市社区
    找到更多CV大咖

    他的专栏