• 问答
  • 技术
  • 实践
  • 资源

  • 0

    关注
  • 0

    获赞
  • 0

    精选文章
近期动态
  • 专栏文章
  • 社区提问
CVPR2021 论文大盘点:全景分割论文汇总(共 16 篇)

从 CVPR2021 公布结果开始,极市就一直对最新的 CVPR2021 进行分类汇总,共分为33个大类,包含检测、分割、估计、跟踪、医学影像、文本、人脸、图像视频检索、图像处理、三维视觉等多个方向。所有关于CVPR的论文整理...

  • 0
  • 0
  • 161
Deepsort + Yolo 实现行人检测和轨迹追踪

Deepsort + Yolo 实现行人检测和轨迹追踪 作者 | 李秋键 来源 | AI科技大本营 编辑 | 极市平台 本项目通过采用深度学习方法实现YOLO算法行人检测和deepsort算法对人员定位的和轨迹跟踪。 引言 行人检测是近年来计算...

  • 0
  • 0
  • 2.2k
实践教程 | 模型量化与落地部署总结

实践教程 | 模型量化与落地部署总结 作者 | Zheng@知乎(已授权) 来源 | https://zhuanlan.zhihu.com/p/415168643 编辑 | 极市平台 摘要: 首先,本文对模型落地量化方法和原理的资料进行了总结和整理;其次,对主...

  • 0
  • 0
  • 1.9k
基于 opencv 实现模块化图像处理管道

作者 | 小白 来源 | 小白学视觉 编辑 | 极市平台 在这篇文章中,我们将学习如何为图像处理实现一个简单的模块化管道,我们将使用 OpenCV 进行图像处理和操作,并使用 Python 生成器进行管道步骤。 图像处理管道是...

  • 0
  • 0
  • 478
人脸识别模型的动手实践!

作者 | 宋志龙 来源 | Datawhale成员 编辑 | 极市平台 人脸识别已经成为生活中越来越常见的技术,其中最关键的问题就是安全,而活体检测技术又是保证人脸识别安全性的一个重要手段,本文将向大家简单介绍活体检测,...

  • 0
  • 0
  • 1.5k
CVPR 2021 论文盘点 | 去阴影、去反光、去高光、去伪影篇

来源 | OpenCV中文网 编辑 | 极市平台 本篇文章继续总结CVPR 2021 底层图像处理相关论文,方向包含去阴影、去反光、去高光、去伪影等。共计 11 篇。 高光检测与去除 A Multi-Task Network for Joint Specular High...

  • 1
  • 0
  • 2.7k
一文读懂 PyTorch 中 Dataset 与 DataLoader

作者 | Chenllliang@知乎(已授权) 来源 | https://zhuanlan.zhihu.com/p/105578087 编辑 | 极市平台 深度时代,数据为王。 PyTorch 为我们提供的两个 Dataset 和 DataLoader 类分别负责可被 Pytorch 使用的数据集...

  • 2
  • 0
  • 1.6k
​ICCV 2021 丨 Oriented R-CNN:面向旋转目标检测的 R-CNN

作者丨谢星星 来源丨中国图象图形学学会CSIG 编辑丨极市平台 原文链接:https://arxiv.org/abs/2108.05699 原文代码链接: https://github.com/jbwang1997/OBBDetection 谢星星 , 程塨 , 王家宝 , 姚西文 , 韩军伟...

  • 0
  • 0
  • 874
吊打 IPT,ETH 学者将 SwinTransformer 应用图像超分,图像降噪、JPEG 压缩伪影移除,性能大幅提升

作者丨happy 编辑丨极市平台 原文链接:https://arxiv.org/abs/2108.10257 code:https://github.com/JingyunLiang/SwinIR 期待已久的SwinIR终于刊出来了,它是ETH团队在Transformer+low-level方面的最新力作,大幅...

  • 0
  • 0
  • 1.1k
深入浅出 Yolo 系列之 Yolox 核心基础完整讲解

作者丨江大白 编辑丨极市平台 在Yolov4、Yolov5刚出来时,大白就写过关于Yolov3、Yolov4、Yolov5的文章,并且做了一些讲解的视频,反响都还不错。 而从2015年的Yolov1,2016年Yolov2,2018年的Yolov3,再到2020年的Y...

  • 5
  • 1
  • 5.0k
Transformer 向轻量型迈进!微软与中科院提出两路并行的 Mobile-Former

作者丨happy 编辑丨极市平台 VisionTransformer向轻量型迈进,微软与中科院提出两路并行的Mobile-Former 已有的Transformer对标的CNN主要是ResNet系列,鲜少有对标端侧轻量模型的Transformer。本文则从轻量模型角度...

  • 1
  • 1
  • 1.4k
更深和更宽的 Transformer,哪个更好?NUS 团队:宽面的宽!更高效的参数部署框架 WideNet

作者丨小马 编辑丨极市平台 写在前面 Transformer-based结构最近在各项任务上取得了惊人的成果。为了进一步提高Transformer的有效性和效率,在现有的工作中主要有两种思路:(1)扩大可训练参数范围;(2)通过参数共享实...

  • 0
  • 0
  • 469
深度探讨 CrossFormer 如何解决跨尺度问题

作者丨FlyEgle ​编辑丨极市平台 论文名称: CROSSFORMER: A VERSATILE VISION TRANSFORMER BASED ON CROSS-SCALE ATTENTION 论文链接: https://arxiv.org/pdf/2108.00154.pdf 论文代码:https://github.com/cheerss/C...

  • 1
  • 0
  • 1.2k
ICCV2021 Oral-RS Loss-拒绝调参、简化训练、显著提点,检测分割任务中的新损失函数——RS Loss

​作者丨小马 编辑丨极市平台 写在前面 目标检测和实例分割往往是一个multi-task的任务,其中包含了诸如classification,box regression和mask prediction等多个子任务,因此对于这类任务的损失函数往往是多个子任务...

  • 0
  • 0
  • 949
ICCV 2021|“白嫖” 性能的 MixMo,一种新的数据增强 or 模型融合方法

作者丨小马 编辑丨极市平台 写在前面 最近的工作提出的不用额外计算的集成方法,大多是在一个网络中同时设置不同的subnet。训练时。每个subnet只学习分类多个输入数据中的其中一个。然而,如何更好地混合这些多个输...

  • 0
  • 0
  • 845
还在魔改 Transformer 结构吗?微软&中山大学开源超强的图片位置编码,涨点显著

写在前面 由于Transformer对于序列数据进行并行操作,所以序列的位置信息就被忽略了。因此,相对位置编码(Relative position encoding, RPE)是Transformer获取输入序列位置信息的重要方法,RPE在自然语言处理任务中...

  • 0
  • 0
  • 763
CNN 终于杀回来了!京东 AI 提出最强 ResNet 变体 CoTNet:即插即用的视觉识别模块

作者丨happy 编辑丨极市平台 paper: https://arxiv.org/abs/2107.12292 code: https://github.com/JDAI-CV/CoTNet 本文是京东AI研究院梅涛团队在自注意力机制方面的探索,不同于现有注意力机制仅采用局部或者全局方...

  • 1
  • 0
  • 1.5k
# ICCV2021 Oral-MDETR:图灵奖得主 Yann LeCun 的团队&Facebook 提出端到端多模态理解的目标检测器

作者丨小马 编辑丨极市平台 写在前面 目前,多模态推理模型大多都依赖于预先训练好的目标检测器来从图像中提取proposal。然而检测器只能检测出固定类别的目标,这使得模型很难适应自由文本中视觉concept的长尾分布,...

  • 0
  • 0
  • 640
大概是全网最详细的何恺明团队顶作 MoCo 系列解读!(上)

作者丨科技猛兽 编辑丨极市平台 本文目录 1 MoCo v1 1.1 自监督学习的 Pretext Task 1.2 自监督学习的 Contrastive loss 1.3 MoCo v1 之前的做法 1.4 MoCo v1 的做法 1.5 MoCo v1 FAQ 1.6 MoCo v1 实验 1.7 MoCo v1...

  • 0
  • 0
  • 1.9k
无需额外参数的注意力模块!中大开源 SimAM:10 行代码快速实现解析解

作者丨happy 编辑丨极市平台 code: https://github.com/ZjjConan/SimAM 本文是中山大学在注意力机制方面的尝试,从神经科学理论出发,构建了一种能量函数挖掘神经元重要性,并对此推导出了解析解以加速计算。通过Ima...

  • 0
  • 0
  • 1.3k
ICCV2021 最全整理:论文分类汇总 / 代码 / 项目 / 论文解读(更新中)【计算机视觉】

计算机视觉三大顶会之一ICCV2021接收结果已经公布,本次ICCV共计 6236 篇有效提交论文,其中有 1617 篇论文被接收,接收率为25.9%。 接收论文ID:https://docs.google.com/spreadsheets/u/1/d/e/2PACX-1vRfaTmsNweua...

  • 0
  • 0
  • 4.9k
视觉解析器 ViP:牛津大学&字节跳动提出 Visual Parser,显式建模高级语义信息

作者丨小马 编辑丨极市平台 写在前面 人类视觉系统能够从场景中捕获part-whole(部分-整体)的信息。在part信息方面,人类视觉系统能够将场景中的人、动物、水果、蔬菜等高级语义信息从整张图片中区分出来。在whole...

  • 0
  • 0
  • 910
视觉解析器 ViP:牛津大学&字节跳动提出 Visual Parser,显式建模高级语义信息

作者丨小马 编辑丨极市平台 写在前面 人类视觉系统能够从场景中捕获part-whole(部分-整体)的信息。在part信息方面,人类视觉系统能够将场景中的人、动物、水果、蔬菜等高级语义信息从整张图片中区分出来。在whole...

  • 0
  • 0
  • 470
视觉解析器 ViP:牛津大学&字节跳动提出 Visual Parser,显式建模高级语义信息

作者丨小马 编辑丨极市平台 写在前面 人类视觉系统能够从场景中捕获part-whole(部分-整体)的信息。在part信息方面,人类视觉系统能够将场景中的人、动物、水果、蔬菜等高级语义信息从整张图片中区分出来。在whole...

  • 0
  • 0
  • 738
搞懂 Vision Transformer 原理和代码,看这篇技术综述就够了(十四)

作者丨科技猛兽 编辑丨极市平台 本文目录 31 T2T-ViT:在ImageNet上从头训练视觉Transformer (来自新加坡国立大学冯佳时团队,依图科技颜水成团队) 31.1 T2T-ViT原理分析 31.2 T2T-ViT代码解读 32 VOLO刷新CV多项...

  • 0
  • 0
  • 1.5k
霸榜 COCO 和 Cityscapes!新的通道和空间注意力建模结构 Polarized Self-Attention

作者丨小马 编辑丨极市平台 【写在前面】 注意力机制是一个被广泛应用在各种CV任务中的方法。注意力机制根据施加的维度大致可以分为两类:通道注意力和空间注意力。对于通道注意力机制,代表性的工作有SENet[2]、ECA...

  • 0
  • 0
  • 995
加载更多
的专业名片

  • NaN

    关注
  • NaN

    获赞
  • NaN

    精选文章
所获殊荣

扫描二维码,进入极市社区
找到更多CV大咖

他的专栏