• 问答
  • 技术
  • 实践
  • 资源

  • 0

    关注
  • 0

    获赞
  • 0

    精选文章
近期动态
  • 专栏文章
  • 社区提问
深度了解自监督学习,就看这篇解读 !微软首创:运用在 image 领域的 BERT

作者丨科技猛兽 来源丨极市平台 编辑丨极市平台 本文目录 1 BERT 方法回顾 2 BERT 可以直接用在视觉任务上吗? 3 BEiT 原理分析 3.1 将图片表示为 image patches 3.2 将图片表示为 visual tokens 3.2.1 变分自编...

  • 0
  • 0
  • 57
NBNet:抛开复杂的网络结构设计,旷世&快手提出子空间注意力模块用于图像降噪

作者丨小小刘 审稿丨邓富城 编辑丨极市平台 本文对旷视科技2021年关于图像去噪的新作"NBNet: Noise Basis Learning for Image Denoising with Subspace Projection"进行解读。 论文地址:https://arxiv.org/abs/2012...

  • 0
  • 0
  • 81
一位算法工程师从 30+ 场秋招面试中总结出的超强面经—文本检测与 GAN 篇(含答案)

作者:灯会 作者灯会为21届中部985研究生,七月份将入职某互联网大厂cv算法工程师。在去年灰飞烟灭的算法求职季中,经过几十场不同公司以及不同部门的面试中积累出了CV总复习系列,此为文本检测与GAN篇。 1.LSTM(长...

  • 0
  • 0
  • 117
自监督学习超详细解读 :SimCLR 系列

作者丨科技猛兽 编辑丨极市平台 本文目录 1 SimCLR 原理分析 (ICML 2020)1.1 数据增强1.2 通过Encoder获取图片表征1.3 预测头1.4 相似图片输出更接近1.5 对下游任务Fine-tune 2 SimCLR v2原理分析 (NIPS 2020)2.1...

  • 0
  • 0
  • 93
COCO 新记录:60.6AP,微软提出采用注意力机制进行检测头统一的 Dynamic Head

作者丨happy 来源丨极市平台 编辑丨极市平台 60.6AP@COCO:COCO新记录,微软提出采用注意力机制进行检测头统一的Dynamic Head paper: https://arxiv.org/abs/2106.08322 code: https://github.com/microsoft/Dynamic...

  • 0
  • 0
  • 282
图像处理知多少?准大厂算法工程师 30+ 场秋招后总结的面经问题详解

作者丨灯会 来源丨极市平台 编辑丨极市平台 CV总复习--传统图像处理篇 作者:灯会 作者灯会为21届中部985研究生,七月份将入职某互联网大厂cv算法工程师。在去年灰飞烟灭的算法求职季中,经过几十场不同公司以及不同...

  • 0
  • 0
  • 217
ICLR 最佳论文 “彩票假设”:如何通过彩票假设构建轻量化模型 (上)

作者丨科技猛兽 编辑丨极市平台 本文目录 1 10分钟解读彩票假设的原理 (ICLR 2019) (来自MIT CSAIL 的Jonathan Frankle 和 Michael Carbin) 1.1 Lottery Ticket原理分析 1.1.1 10分钟了解彩票假设的原理 1.1.2 全连...

  • 0
  • 0
  • 280
深度学习六十问!一位算法工程师经历 30+ 场 CV 面试后总结的常见问题合集下(含答案)

作者丨灯会 来源丨极市平台​ 编辑丨极市平台 作者灯会为21届中部985研究生,七月份将入职某互联网大厂cv算法工程师。在去年灰飞烟灭的算法求职季中,经过几十场不同公司以及不同部门的面试中积累出了CV总复习系列,...

  • 2
  • 1
  • 554
YOLOS|你仅需要看一个序列

作者丨happy 审稿丨邓富城 ​编辑丨极市平台 本文首发于极市平台,转载须经授权。 paper: https://arxiv.org/abs/2106.00666 code: https://github.com/hustvl/YOLOS 本文是华科&地平线关于Transformer的迁移学习...

  • 0
  • 0
  • 377
超越 PVT、Swin,南大开源高效 Transformer:REST​

作者丨happy 来源丨AIWalker 编辑丨极市平台 paper: https://arxiv.org/abs/2105.13677 code: https://github.com/wofmanaf/ResT 本文是南京大学提出的一种高效Transformer架构:ResT,它采用了类似ResNet的设计思想...

  • 0
  • 0
  • 300
NTIRE 2021 冠军方案:华硕和台湾大学提出深度引导影像重照明方案-MBNet

作者丨杨皓翔、陈韦廷(华硕电脑、台湾大学) ​编辑丨极市平台 华硕和台湾大学提出MBNet获NTIRE 2021 深度引导影像重照明冠军 论文链接:https://arxiv.org/abs/2105.00690 NTIRE 比赛报告链接:https://arxiv.org/a...

  • 0
  • 0
  • 252
一位算法工程师从 30+ 场秋招面试中总结出的超强面经—深度学习基础上篇(含答案)

作者丨灯会 来源丨极市平台 编辑丨极市平台​ 作者灯会为21届中部985研究生,凭借自己整理的面经,去年在腾讯优图暑期实习,七月份将入职百度cv算法工程师。在去年灰飞烟灭的算法求职季中,经过30+场不同公司以及不同...

  • 1
  • 0
  • 262
超越 Swin Transformer!谷歌提出了收敛更快、鲁棒性更强、性能更强的 NesT

作者丨happy 审稿丨邓富城 编辑丨极市平台 本文首发于极市平台,转载须经授权且注明来源 本文是谷歌&罗格斯大学的研究员在Vision Transformer的一次尝试,对ViT领域的分层结构设计进行了反思与探索,提出了一种...

  • 0
  • 0
  • 389
CVPR2021 之 Saliency Map 生成方法 Group-CAM

作者丨孙裕道 审稿丨邓富城​ 编辑丨极市平台 引言 当前解释深度卷积神经网络越来越引起了AI研究者的关注,因为它有助于理解深度神经网络的内部机制和做出特定决策的原因。在计算机视觉领域,可视化和理解深层网络最...

  • 1
  • 0
  • 296
AAAI-2021 杰出论文 | 多视图立体几何三维重建与自监督学习的碰撞

导读 目标读者:对多视图立体几何(Multi-view stereo, MVS)感兴趣或有一定了解的人。 论文作者:深圳中科院先进技术研究院以及华南理工大学的研究团队。 论文:https://www.aaai.org/AAAI21Papers/AAAI-2549.XuH.p...

  • 0
  • 0
  • 309
基于点云的自动驾驶 3D 目标检测和分类方法

作者丨Z 审稿丨邓富城 编辑丨极市平台 参考论文:Point-Cloud based 3D Object Detection and Classification Methods for Self-Driving Applications: A Survey and Taxonomy Abstract 在深度学习技术的影响下,自动...

  • 0
  • 0
  • 318
一位算法工程师从 30+ 场秋招面试中总结出的超强面经—语义分割篇(含答案)

作者丨灯会 来源丨极市平台 编辑丨极市平台 作者灯会为21届中部985研究生,七月份将入职某互联网大厂cv算法工程师。在去年灰飞烟灭的算法求职季中,经过几十场不同公司以及不同部门的面试中积累出了CV总复习系列,此...

  • 1
  • 0
  • 406
CV 面试问题详解宝典--目标检测篇

作者丨灯会 来源丨极市平台 编辑丨极市平台 本文为极市平台原创,转载须经授权并注明来源 作者灯会为21届中部985研究生,七月份将入职某互联网大厂cv算法工程师。在去年灰飞烟灭的算法求职季中,经过几十场不同公司...

  • 2
  • 0
  • 716
搞懂 Vision Transformer 原理和代码,看这篇技术综述就够了(十一)

​作者丨科技猛兽 编辑丨极市平台 本文目录 25 IQT:基于 Transformer 的感知图像质量评价 (来自LG,NTIRE 2021冠军方案) 25.1 IQT原理分析 26 Transformer+图像质量评价:TRIP (来自NORCE Norwegian Research Cent...

  • 1
  • 0
  • 514
Vision MLP 超详细解读 (原理分析 + 代码解读)

作者|科技猛兽 审稿丨邓富城 编辑丨极市平台 本系列已授权极市平台,未经允许不得二次转载 本文目录 1 MLP-Mixer: An all-MLP Architecture for Vision (来自Google Research, Brain Team,ViT作者团队) 1.1 MLP-Mi...

  • 0
  • 0
  • 622
4 种 YOLO 目标检测的 C++ 和 Python 两种版本实现

作者丨nihate 审稿丨邓富城 编辑丨极市平台 2020年,新出了几个新版本的YOLO目标检测,在微信朋友圈里转发的最多的有YOLOv4,Yolo-Fastest,YOLObile以及百度提出的PP-YOLO。在此之前,我已经在github发布过YOLOv4,...

  • 1
  • 0
  • 1.4k
TPAMI2021:基于视频的面部微表情分析综述与微-宏表情仓库发布

作者丨孙国荃 编辑丨极市平台 微表情不同于传统的面部表情,它是一种自发的、短暂的面部表情,能够揭示人们试图隐藏的真实情感。因此,微表情可以对诸多应用提供重要的信息,例如:测谎,刑事侦查等。微表情的短暂的...

  • 0
  • 0
  • 336
结构重参数化技术:进可暴力提性能,退可无损做压缩

作者丨科技猛兽 编辑丨极市平台 本文介绍的2篇论文都来自清华大学丁贵广老师团队和旷视科技。 模型参数主要指的是学得的参数(learnable params) 和其他在训练过程中得到的参数,如batch norm (BN) 累积得到的均值和...

  • 0
  • 0
  • 348
TPAMI 2021 :基于 event stream 的步态识别,准确率高达 90%!

作者丨张贤同学 审稿丨邓富城 编辑丨极市平台 这是我们发表在 TPAMI 2021 上的一篇论文,论文题目:Event-Stream Representation for Human Gaits Identification Using Deep Neural Networks。这篇论文主要是基于 e...

  • 1
  • 0
  • 341
CVPR2021: 任何网络都能山寨!新型黑盒对抗攻击模拟未知网络进行攻击

作者丨马晨 清华大学 审稿丨邓富城 编辑丨极市平台 一.介绍 最近几年,元学习风生水起,这阵风也刮到了对抗攻击领域。本文解读对抗攻击与元学习联姻的两篇典型的论文(本文分为上下两篇,此为上篇),希望对后来的研究...

  • 0
  • 0
  • 371
MLP 再添新砖,Facebook 入局!ResMLP:完全建立在 MLP 上的图像分类架构

​作者丨happy 审稿丨邓富城 编辑丨极市平台 paper: https://arxiv.org/abs/2105.03404 code1: https://github.com/lucidrains/res-mlp-pytorch(第三方) code2: https://github.com/facebookresearch/deit(大概开源...

  • 0
  • 0
  • 853
加载更多
的专业名片

  • NaN

    关注
  • NaN

    获赞
  • NaN

    精选文章
所获殊荣

扫描二维码,进入极市社区
找到更多CV大咖

他的专栏