• 问答
  • 技术
  • 实践
  • 资源
技术讨论
在目标检测中如何解决小目标的问题?

作者丨Nabil MADALI 来源丨AI公园 编辑丨极市平台 在深度学习目标检测中,特别是人脸检测中,由于分辨率低、图像模糊、信息少、噪声多,小目标和小人脸的检测一直是一个实用和常见的难点问题。然而,在过去几年的发...

技术讨论
  • 0
  • 0
  • 23
谷歌最新提出无需卷积、注意力 ,纯 MLP 构成的视觉架构!网友:MLP is All You Need ?

作者丨三金、琰琰 来源丨AI科技评论 编辑丨极市平台 近日,谷歌大脑团队新出了一篇论文,题目为 《MLP-Mixer: An all-MLP Architecture for Vision 》 ,这篇论文是原视觉Transformer(ViT)团队的一个纯MLP架构的尝...

技术讨论
  • 0
  • 0
  • 41
算法工程师技术路线图

来源:字节@zhihu 天地大观,志存高远 前言 这是一份写给公司算法组同事们的技术路线图,其目的主要是为大家在技术路线的成长方面提供一些方向指引,配套一些自我考核项,可以带着实践进行学习,加深理解和掌握。...

技术讨论 #其他#面经#工具
  • 0
  • 1
  • 869
YOLOv4 详细分析 | 细数当前最佳检测框架小细节

来源丨3D视觉工坊 编辑丨极市平台 前段时间,突然发布的YOLOv4成了计算机视觉领域一大热点新闻。这个目标检测任务的SOTA模型究竟有何创新?这篇解读文章为你一一拆解。 目标检测在近几年开始发展成熟,但即便如此,...

技术讨论
  • 0
  • 0
  • 42
实操教程|怎样制作目标检测的训练样本图像?

作者丨MrSpart 来源丨https://blog.csdn.net/MrSpart/article/details/116137943 编辑丨极市平台 【 看到这个题目相信不少人第一感觉是小题大作、故弄玄虚。不过还请先稍微按捺一下胸中的不快,在脑中给出下面这几个...

技术讨论
  • 0
  • 0
  • 80
极市社区

未来极市社区会出个技术专家认证吗,因为对学生来说,看着高大上的证书是一个加分项。

技术讨论
  • 2
  • 3
  • 577
干货|一文透彻理解:图像卷积、边缘提取和滤波去噪

作者丨程序员阿德@知乎(已授权) 来源丨程序员阿德 编辑丨极市平台 目录 图像卷积 图像梯度 边缘提取 1. Prewitt算子 2. Sobel算子 3. Laplacian算子 平滑去噪 1. 高斯滤波 2. 均值滤波 3. 中值滤波 一、图像卷积...

技术讨论 #图像分割
  • 1
  • 0
  • 254
最强无监督行人重识别方法 Cluster Contrast ReID,精度超越有监督算法

作者丨朝言@知乎(已授权) 来源丨https://zhuanlan.zhihu.com/p/368633180 编辑丨极市平台 介绍 在行人重识别领域,如何获取海量标注数据,提高实际场景的重识别能力是工业界非常关注的一个问题。通常在学术界上公...

技术讨论
  • 0
  • 0
  • 116
搞懂 Vision Transformer 原理和代码,看这篇技术综述就够了(十)

作者丨happy 来源丨极市平台 编辑丨极市平台 本文目录 21 LV-ViT: 56M参数训练视觉Transformer (来自 新加坡国立大学冯佳时组 ,字节跳动) 21.1 LV-ViT原理分析 22 通过抑制过度平滑来改进视觉Transformer训练 (来...

技术讨论
  • 0
  • 0
  • 107
Meta-DETR | 图像级 “元” 学习提升目标检测精度

来源:原创 Edison_G 计算机视觉研究院 作者:Edison_G One-shot目标检测旨在通过几个标注的样本来检测新的目标。之前的工作已经证明了元学习是一个很有前途的解决方案,它们中的大多数基本上是通过解决在区域上的...

技术讨论 #目标检测#论文
  • 0
  • 0
  • 379
ViT-int8 on TVM:提速 4.6 倍,比 TRT 快 1.5 倍

作者丨火柴天堂 来源丨https://zhuanlan.zhihu.com/p/365686106 编辑丨极市平台 TL;DR 5个步骤教你在TVM里优化ViT的int8实现,提速4.6倍,比TRT快1.5倍。 背景知识:ViT模型及其速度 Transformer 模型在 NLP 领域得...

技术讨论
  • 0
  • 0
  • 45
热门的目标检测开源方案盘点 (附论文 + 代码下载)

以下文章来源于AI约读社 ,作者南山 [ 在2020年中,目标检测领域出现了许多优秀的工作,今天我们来聊一聊在当前热门的五大目标检测开源方案。 1、**五大改进,二十多项技巧实验,堪称最强目标检测万花筒:**YOLOv4&a...

技术讨论 #论文#其他#目标检测
  • 0
  • 0
  • 831
干货分享|冠军方案解读-AIWIN 大赛口罩识别赛题

正文:本次AIWIN大赛已经落幕,获奖名单已于前日公布,我们邀请到了口罩识别赛题的冠军来做方案解读。 首先感谢比赛方举办这个比赛,Openvino在CPU上的加速效果很明显,非常适合CPU环境下的算法部署,通过这个比赛熟...

技术讨论
  • 2
  • 0
  • 1.4k
yolov5 部署到 iPhone 或终端实践全过程

来源:计算机视觉研究院 计算机视觉研究院专栏 作者:Edison_G 期待已久的检测经典又来来了一波强袭——yolov5。其实yolov5没有完整的文件,现在最重要的应该是把yolov4弄清楚,在目标检测领域中受益匪浅,可以在...

技术讨论 #论文#其他
  • 0
  • 0
  • 691
LSNet: Anchor-free 新玩法,一个 head 统一目标检测,实例分割,姿态估计三种任务

作者丨小马哥@知乎(已授权) 来源丨https://zhuanlan.zhihu.com/p/366651996 编辑丨极市平台 论文: Location-Sensitive Visual Recognition with Cross-IOU Loss​arxiv.org 代码: LSNet​github.com 文章认为,目...

技术讨论
  • 0
  • 0
  • 62
LSNet: Anchor-free 新玩法,一个 head 统一目标检测,实例分割,姿态估计三种任务

作者丨小马哥@知乎(已授权) 来源丨https://zhuanlan.zhihu.com/p/366651996 编辑丨极市平台 论文: Location-Sensitive Visual Recognition with Cross-IOU Loss​arxiv.org 代码: LSNet​github.com 文章认为,目...

技术讨论
  • 0
  • 0
  • 40
一文梳理水下检测方法

作者丨南山 来源丨AI约读社 编辑丨极市平台 水下目标检测旨在对水下场景中的物体进行定位和识别。这项研究由于在海洋学、水下导航等领域的广泛应用而引起了持续的关注。但是,由于复杂的水下环境和光照条件,这仍然...

技术讨论
  • 0
  • 0
  • 53
PyTorch 中模型的可复现性

作者丨pprp 来源丨GiantPandaCV 编辑丨极市平台 PyTorch中模型的可复现性 在深度学习模型的训练过程中,难免引入随机因素,这就会对模型的可复现性产生不好的影响。但是对于研究人员来讲,模型的可复现性是很重要的...

技术讨论
  • 0
  • 0
  • 160
风起云涌新英杰 天下齐聚 AIWIN

话说天下无大事,质变引潮流,在人工智能的江湖中,一切以实力说话。而被科技江湖津津乐道的未来第一武道赛AIWIN大赛在经历了风起云涌的三届之后,即将在万众瞩目之下正式启动第四届!回想前三届,多少科技新秀通过A...

技术讨论
  • 3
  • 0
  • 242
对比学习(Contrastive Learning):研究进展精要

作者丨张俊林@知乎(已授权) 来源丨https://zhuanlan.zhihu.com/p/367290573 编辑丨极市平台 对比学习(Contrastive Learning)最近一年比较火,各路大神比如Hinton、Yann LeCun、Kaiming He及一流研究机构比如Facebo...

技术讨论
  • 0
  • 0
  • 98
灵活而简单 DSRL 框架,提高网络精度的同时不引入额外的计算量,CVPR2020

作者丨Z 审稿丨邓富城 编辑丨极市平台 深度学习网络模型的性能和网络的大小有着密切的关系,大型网络在性能上一般比小型网络模型更好,显而易见,大型网络推理运行时消耗的算力要求比较高,而算力代表“金钱”!。本文...

技术讨论 #CVPR
  • 0
  • 0
  • 59
实操教程|我的 PyTorch 模型比内存还大,怎么训练呀?

作者丨McGL 来源丨PyVision 编辑丨极市平台 随着深度学习的飞速发展,模型越来越臃肿,哦不,先进,运行SOTA模型的主要困难之一就是怎么把它塞到 GPU 上,毕竟,你无法训练一个设备装不下的模型。改善这个问题的技术...

技术讨论
  • 0
  • 0
  • 75
最全 Normalization!建议收藏,面试必问!

作者丨灿视 来源丨百面AI 编辑丨极市平台 1. 对数据部分做归一化 主要且常用的归一化操作有BN,LN,IN,GN,示意图如图所示。 图中的蓝色部分,表示需要归一化的部分。其中两维 $C$ 和 $N$ 分别表示channel和batch s...

技术讨论
  • 1
  • 0
  • 64
搞懂 Vision Transformer 原理和代码,看这篇技术综述就够了(九)

作者丨科技猛兽 来源丨极市平台 编辑丨极市平台 本文目录 19 LeViT: 用于快速推理的视觉Transformer (来自 Facebook,DeiT 一作 Hugo Touvron 挂名) 19.1 LeViT原理分析 20 ViT-Lite: 紧凑型视觉Transformer,更小...

技术讨论 #论文
  • 0
  • 0
  • 76
一篇综述带你全面了解迁移学习的领域泛化 (Domain Generalization)

作者丨王晋东不在家 来源丨https://zhuanlan.zhihu.com/p/354740610 编辑丨极市平台 领域泛化 (Domain Generalization, DG) 是近几年非常热门的一个研究方向。它研究的问题是从若干个具有不同数据分布的数据集(领域...

技术讨论 #论文
  • 0
  • 0
  • 71
ICLR 2021 | Group-Supervised Learning: 通过可控的解耦表征学习模拟人脑想象力

作者丨葛云皓 Andy@知乎(已授权) 来源丨https://zhuanlan.zhihu.com/p/364895887 编辑丨极市平台 本文主要介绍我们被 ICLR 2021 会议录用的一篇文章:Zero-shot Synthesis with Group-Supervised Learning。 项目...

技术讨论 #会议#论文
  • 0
  • 0
  • 44
加载更多