• 问答
  • 技术
  • 实践
  • 资源
  • 推荐
在目标检测中如何解决小目标的问题?

作者丨Nabil MADALI 来源丨AI公园 编辑丨极市平台 在深度学习目标检测中,特别是人脸检测中,由于分辨率低、图像模糊、信息少、噪声多,小目标和小人脸的检测一直是一个实用和常见的难点问题。然而,在过去几年的发...

技术讨论
  • 0
  • 0
  • 23
谷歌最新提出无需卷积、注意力 ,纯 MLP 构成的视觉架构!网友:MLP is All You Need ?

作者丨三金、琰琰 来源丨AI科技评论 编辑丨极市平台 近日,谷歌大脑团队新出了一篇论文,题目为 《MLP-Mixer: An all-MLP Architecture for Vision 》 ,这篇论文是原视觉Transformer(ViT)团队的一个纯MLP架构的尝...

技术讨论
  • 0
  • 0
  • 41
新手想问一下,关于怎么使用训练任务

本人新手一名,刚刚开始使用极市平台,写好代码后,发现不知道怎么训练,看了文档,还是不知道训练任务的“执行命令”是什么,是不是只能写示例的bash /project/train/src_repo/start_train.sh,这个文件“start_train....

问答
  • 0
  • 4
  • 71
image caption

求有image captionwith transformer完整的可运行的代码?

问答 #视频理解
  • 0
  • 0
  • 13
这样检测是不是更准! | 深度 Stereo 结构网络用于目标检测(附源码)

来源:原创 计算机视觉研究院 作者:Edison_G 目前自动驾驶愈演愈烈,技术也越来越成熟,从不可能上路到现在大家抢着去感受该新技术,未来电车是趋势,该领域的技术会是研究者关注的热点的话题。今日,我们“计算机...

专栏 #目标检测#论文#其他
  • 1
  • 0
  • 644
快速上手笔记,PyTorch 模型训练实用教程(附代码)

前言 自 2017 年 1 月 PyTorch 推出以来,其热度持续上升,一度有赶超 TensorFlow 的趋势。PyTorch 能在短时间内被众多研究人员和工程师接受并推崇是因为其有着诸多优点,如采用 Python 语言、动态图机制、网络构建...

书籍教程
  • 25
  • 107
  • 5.6k
深度学习图像标注工具汇总

对于监督学习算法而言,数据决定了任务的上限,而算法只是在不断逼近这个上限。世界上最遥远的距离就是我们用同一个模型,但是却有不同的任务。但是数据标注是个耗时耗力的工作,CSDN博主chaibubble介绍以下几个图像...

工具
  • 14
  • 103
  • 6.7k
PyTorch trick 集锦

来源:z.defying@知乎专栏 Github链接:https://github.com/zxdefying/pytorch_tricks 目录: 指定GPU编号 查看模型每层输出详情 梯度裁剪 扩展单张图片维度 one hot编码 防止验证模型时爆显存 学习率衰减 冻结某些...

代码模型
  • 5
  • 1
  • 4.5k
YOLOv4 详细分析 | 细数当前最佳检测框架小细节(附论文及源码下载)

来源:原创 Edison_G 计算机视觉研究院 论文地址:https://arxiv.org/abs/2001.07710 前段时间,突然发布的YOLOv4成了计算机视觉领域一大热点新闻。这个目标检测任务的SOTA模型究竟有何创新?这篇解读文章为你一一拆...

#论文#其他
  • 2
  • 0
  • 732
算法工程师技术路线图

来源:字节@zhihu 天地大观,志存高远 前言 这是一份写给公司算法组同事们的技术路线图,其目的主要是为大家在技术路线的成长方面提供一些方向指引,配套一些自我考核项,可以带着实践进行学习,加深理解和掌握。...

技术讨论 #其他#面经#工具
  • 0
  • 1
  • 869
YOLOv4 详细分析 | 细数当前最佳检测框架小细节

来源丨3D视觉工坊 编辑丨极市平台 前段时间,突然发布的YOLOv4成了计算机视觉领域一大热点新闻。这个目标检测任务的SOTA模型究竟有何创新?这篇解读文章为你一一拆解。 目标检测在近几年开始发展成熟,但即便如此,...

技术讨论
  • 0
  • 0
  • 42
高通比赛构建训练镜像出错

1.使用 FROM 基础镜像时,不可以选择官方开发文档中别的版本的,例如使用以下tensorflow2.0的镜像命令,假设我更换成以下的基础镜像,在构建训练镜像时会自动给我替换成比赛初始选择的镜像导致出错。 uhub.service.u...

问答 #算法竞赛
  • 1
  • 0
  • 33
实操教程|怎样制作目标检测的训练样本图像?

作者丨MrSpart 来源丨https://blog.csdn.net/MrSpart/article/details/116137943 编辑丨极市平台 【 看到这个题目相信不少人第一感觉是小题大作、故弄玄虚。不过还请先稍微按捺一下胸中的不快,在脑中给出下面这几个...

技术讨论
  • 0
  • 0
  • 80
构建训练镜像出错

1.使用 FROM 基础镜像时,不可以选择官方开发文档中别的版本的,例如使用以下tensorflow2.0的镜像命令,假设我更换成以下的基础镜像,在构建训练镜像时会自动给我替换成比赛初始选择的镜像导致出错。 uhub.service.u...

问答
  • 0
  • 1
  • 62
极市社区

未来极市社区会出个技术专家认证吗,因为对学生来说,看着高大上的证书是一个加分项。

技术讨论
  • 2
  • 3
  • 577
在线开发环境总是掉线

这个环境很不稳定,请问怎么解决啊?

问答
  • 0
  • 0
  • 83
干货|一文透彻理解:图像卷积、边缘提取和滤波去噪

作者丨程序员阿德@知乎(已授权) 来源丨程序员阿德 编辑丨极市平台 目录 图像卷积 图像梯度 边缘提取 1. Prewitt算子 2. Sobel算子 3. Laplacian算子 平滑去噪 1. 高斯滤波 2. 均值滤波 3. 中值滤波 一、图像卷积...

技术讨论 #图像分割
  • 1
  • 0
  • 254
最强无监督行人重识别方法 Cluster Contrast ReID,精度超越有监督算法

作者丨朝言@知乎(已授权) 来源丨https://zhuanlan.zhihu.com/p/368633180 编辑丨极市平台 介绍 在行人重识别领域,如何获取海量标注数据,提高实际场景的重识别能力是工业界非常关注的一个问题。通常在学术界上公...

技术讨论
  • 0
  • 0
  • 116
【华为】诺亚方舟 AI Theory Lab,招实习生 / 暑期实习 (base:香港 / 深圳)

base 香港/深圳 。 研究方向:bilevel optimization,大模型训练,interpretable AI。 充足华为云计算资源,专业的论文写作指导,mentor有很多ideas。感兴趣的发简历或者私聊我了解详情。 简历发 [hide] zhoufengwei...

求职内推
  • 0
  • 0
  • 659
【商汤科技】多模态组招校招生和实习生数名(base:上海、北京任选)

工作地址:北京、上海 主要工作内容及岗位要求如下: 工作内容: (1)CV/NLP算法开发,具体包含分类/检测/问答/图文检索等相关方向; (2)模型分析与迭代,BERT/GPT/CLIP/ConViT/CeiT等Transformer结构在CV领域的...

求职内推
  • 0
  • 0
  • 419
CVPR2021 | 动态滤波器卷积新高度,加州大学默塞德分校 Ming-Hsuan Yang 团队提出解耦动态滤波器网络

作者丨happy 审稿丨邓富城 编辑丨极市平台 paper: https://arxiv.org/abs/2104.14107 code: https://thefoxofsky.github.io/project_pages/ddf 本文是加州大学默塞德分校Ming-Hsuan Yang团队在动态滤波器卷积方面的...

论文速递
  • 0
  • 0
  • 93
搞懂 Vision Transformer 原理和代码,看这篇技术综述就够了(十)

作者丨happy 来源丨极市平台 编辑丨极市平台 本文目录 21 LV-ViT: 56M参数训练视觉Transformer (来自 新加坡国立大学冯佳时组 ,字节跳动) 21.1 LV-ViT原理分析 22 通过抑制过度平滑来改进视觉Transformer训练 (来...

技术讨论
  • 0
  • 0
  • 107
Meta-DETR | 图像级 “元” 学习提升目标检测精度

来源:原创 Edison_G 计算机视觉研究院 作者:Edison_G One-shot目标检测旨在通过几个标注的样本来检测新的目标。之前的工作已经证明了元学习是一个很有前途的解决方案,它们中的大多数基本上是通过解决在区域上的...

技术讨论 #目标检测#论文
  • 0
  • 0
  • 379
ViT-int8 on TVM:提速 4.6 倍,比 TRT 快 1.5 倍

作者丨火柴天堂 来源丨https://zhuanlan.zhihu.com/p/365686106 编辑丨极市平台 TL;DR 5个步骤教你在TVM里优化ViT的int8实现,提速4.6倍,比TRT快1.5倍。 背景知识:ViT模型及其速度 Transformer 模型在 NLP 领域得...

技术讨论
  • 0
  • 0
  • 45
热门的目标检测开源方案盘点 (附论文 + 代码下载)

以下文章来源于AI约读社 ,作者南山 [ 在2020年中,目标检测领域出现了许多优秀的工作,今天我们来聊一聊在当前热门的五大目标检测开源方案。 1、**五大改进,二十多项技巧实验,堪称最强目标检测万花筒:**YOLOv4&a...

技术讨论 #论文#其他#目标检测
  • 0
  • 0
  • 831
干货分享|冠军方案解读-AIWIN 大赛口罩识别赛题

正文:本次AIWIN大赛已经落幕,获奖名单已于前日公布,我们邀请到了口罩识别赛题的冠军来做方案解读。 首先感谢比赛方举办这个比赛,Openvino在CPU上的加速效果很明显,非常适合CPU环境下的算法部署,通过这个比赛熟...

技术讨论
  • 2
  • 0
  • 1.4k
加载更多