• 问答
  • 技术
  • 实践
  • 资源
近期精选
安全帽数据集

安全帽佩戴检测数据集 安全帽(安全帽)佩戴检测数据集(SHWD)。并提供预训练的模型。 介绍 SHWD提供了用于安全帽佩戴和人头检测的数据集。它包括7581张图像,其中带有9044张人类安全头盔的佩戴物(正)和111514件...

数据集
  • 1
  • 0
  • 3.0k
【电子书】李沐大神《动手学深度学习》

人工智能机器学习深度学习领域重磅教科图书,多位Amazon科学家巨作《动手学深度学习》 作者简介 阿斯顿·张 亚马逊应用科学家,美国伊利诺伊大学香槟分校计算机科学博士 李沐 亚马逊首席(principal)科学家,美国卡...

书籍教程
  • 8
  • 107
  • 5.7k
多目标追踪 MOTR:首个完全基于端到端 Transformer 的多目标追踪模型,简单高效

_公众号:将门创投 多目标追踪是自动驾驶、安防和视频行为分析领域的重要研究领域,其主要挑战在于为追踪目标建立时域模型。本文的MOTR架构提出了一种称为Track Query的全新概念,每个Track Query将为一个目标的进行...

技术讨论
  • 2
  • 0
  • 2.5k
综述:目标检测二十年(2001-2021)

作者:派派星 来源:CVHub 编辑:极市平台 引言 目标检测领域发展至今已有二十余载,从早期的传统方法到如今的深度学习方法,精度越来越高的同时速度也越来越快,这得益于深度学习等相关技术的不断发展。本文将对目...

技术讨论 #目标检测
  • 4
  • 0
  • 3.4k
用 YOLO v5+DeepSORT,打造实时多目标跟踪模型

来源 | AI有道 目标跟踪 (Object Tracking) 是机器视觉领域的重要课题,根据跟踪目标的数量,可分为单目标跟踪 (Single Object Tracking,简称 SOT) 和多目标跟踪 (Multi Object Tracking,简称 MOT)。 多目标跟踪往...

技术讨论
  • 1
  • 0
  • 3.3k
从 CVPR 2021 的论文看计算机视觉的现状

来源 | deephub 计算机视觉(Computer Vision, CV)是人工智能领域的一个领域,致力于让计算机能够像人类一样识别和处理图像和视频中的物体。以前,计算机视觉只能在有限的能力下工作。但由于深度学习的进步,该领域近...

技术讨论
  • 0
  • 0
  • 3.4k
GAN 万字长文综述

作者:我爱馒头 来源:https://zhuanlan.zhihu.com/p/58812258 前阵子学习GAN的过程发现现在的GAN综述文章大都是2016年Ian Goodfellow或者自动化所王飞跃老师那篇。可是在深度学习,GAN领域,其进展都是以月来计算的...

技术讨论
  • 2
  • 0
  • 5.9k
PyTorch 零基础入门 GAN 模型之基础篇

来源 | 知乎 背景介绍 近年来,各种生成模型及其应用广泛地出现在大家的视野范围内,像最近非常火爆的 Alias-Free GAN 更是从一个全新的视角,为生成模型领域中新的发展方向打下了坚实的理论基础。但是现在来看,无...

技术讨论
  • 1
  • 0
  • 1.4k
卷积神经网络(CNN)详解

来源 | AI有道 CNN 一共分为输入,卷积,池化,拉直,softmax,输出 卷积由互关运算(用Filter完成)和激活函数 Filter CNN常用于图像识别,在深度学习中我们不可能直接将图片输入进去,向量是机器学习的通行证,我...

技术讨论
  • 0
  • 0
  • 2.1k
Pytorch 的 nn.DataParallel 详细解析

作者丨初识CV@知乎(已授权) 来源丨https://zhuanlan.zhihu.com/p/393857045 编辑丨极市平台 前言 pytorch中的GPU操作默认是异步的,当调用一个使用GPU的函数时,这些操作会在特定设备上排队但不一定在稍后执行。这...

技术讨论
  • 0
  • 1
  • 1.6k
时至今日,深度学习领域有哪些值得追踪的前沿研究?

来源 | 知乎 回答一: 其实自从2018年三大佬靠深度学习拿了图灵奖之后,基本宣告深度学习容易解决的问题做的差不多了,这两年这个领域没有太大的突破,因为剩下的问题都是硬核问题,想要比较好的解决很困难,这个可...

技术讨论
  • 1
  • 1
  • 1.7k
用于小目标检测的一个简单高效的网络

导读 以Tiny YOLOV3的速度达到YOLOV3的效果。 论文链接:https://pan.baidu.com/s/1lagEjkRbGpfVVxQERnO09w 提取码: 1. 介绍 本文提出一种专门用于检测小目标的框架,框架结构如下图:我们探...

技术讨论
  • 1
  • 0
  • 2.7k
2021年,作为算法工程师的你们会在 CV 业务落地上用 Transformer 吗?

来源 | 知乎 众所周知,Transformer 已经日常在CV学术领域“杀疯了”,那么在工业领域情况如何呢? 回答一: 时至今日,ImageNet的结论已经不可信了,各种trick实在太多,混在里面无法分辨是trick调得好还是网络结构真...

技术讨论
  • 0
  • 0
  • 3.1k
解读​YOLOX: Exceeding YOLO Series in 2021

来源|AI公园 1. YOLOX 1.1 YOLOX-DarkNet53 YOLOv3 baseline  以Darknet53作为Baseline,给大家介绍如何一步一步过渡到现在的YOLOX-DarkNet53。YOLOv3是以Darknet53为主干,后面再加上SPP。我们对训练策略进行了一些...

  • 1
  • 0
  • 2.7k
ICCV 2021 Oral | 重新思考人群计数和定位:一个纯粹基于点的框架

来源|CVer计算机视觉 人群计数新范式!本文提出P2PNet:一个纯粹基于点的框架,可来直接预测人群数量和人群个体的位置,并提出一个新的度量标准,称为密度归一化平均精度 (nAP),代码即将开源! ICCV 2021 论文和代...

技术讨论
  • 0
  • 0
  • 1.7k
归纳偏置多余了?靠 “数据堆砌” 火拼 Transformer,MLP 架构可有胜算?

来源|AI科技评论 前段时间,一场关于MLP与Transformer的较量在学术圈闹得沸沸扬扬。 起因是,谷歌在《MLP-Mixer: An all-MLP Architecture for Vision》论文中提出,无需卷积模块和注意力机制,纯MLP架构也可以达到...

技术讨论
  • 0
  • 0
  • 1.9k
自监督学习新思路!基于蒸馏损失的自监督学习算法 | CVPR 2021

来源|AI 科技评论 今天给大家介绍一篇被 CVPR 2021 收录的关于自监督的文章——S2-BNN [1],论文作者来自 CMU,HKUST 和 IIAI。这篇论文探讨了如果网络规模在非常小的情况下(比如efficient networks或者binary neural...

技术讨论
  • 0
  • 0
  • 1.5k
实时检测 17 个人体关键点,谷歌 SOTA 姿态检测模型,手机端也能运行(附项目地址)

机器之心 近日,来自谷歌的研究者更新了用于实时姿态检测的项目,该项目包含 3 种 SOTA 模型,其中 MoveNet 模型可检测人体 17 个关键点、并以 50+ fps 在电脑和手机端运行;BlazePose 可检测人体 33 个关键点;Pose...

技术讨论 #姿态估计
  • 0
  • 0
  • 1.4k
一个新的深度学习模型,将图像分割带到边缘设备

来源|biendata 由 DarwinAI 和滑铁卢大学的人工智能研究人员设计的一种新的神经网络架构,将使低功耗、低算力计算设备执行图像分割任务成为可能。 图像分割是确定图像中目标物体的边界和区域的过程。人类可以毫不费...

  • 0
  • 0
  • 2.0k
python + opencv + dlib 实现实时唇色变换 | 虚拟上妆

来源|AI算法与图像处理 大家好,今天跟大家分享一个利用python + opencv + dlib 实现一个带滑动条控制的唇色变换案例! 大致内容包括: 1、demo展示 2、思路剖析 3、算法实现 一、demo效果展示 demo已经上传到视频...

  • 0
  • 0
  • 1.6k
深度学习实现场景字符识别模型|代码干货

出品|AI科技大本营 # 前言 # 文字是人从日常交流中语音中演化出来,用来记录信息的重要工具。文字对于人类意义非凡,以中国为例,中国地大物博,各个地方的口音都不统一,但是人们使用同一套书写体系,使得即使远隔...

  • 0
  • 0
  • 1.5k
透过 Transformer 重新看 OCRNet

来源|RainBowSecret 最近基于Transformer结构设计的骨干网络在视觉的很多任务上都取得了很好的结果,我们在这里也透过Transformer结构重新梳理一下我们的OCRNet[1]和Transformer[2]的联系,本文讨论的内容大部分也都...

  • 0
  • 0
  • 1.8k
YOLO 也玩「吃鸡」,人形目标精准识别!神秘团队用 AI 打造游戏作弊利器

来源:AI算法与图像处理 【导读】科技树被点歪?好好的AI不去做CV,反而去搞游戏外挂。结果,不仅表现出众,还很难被发现,堪称物理外挂界的「SOTA」。不过,好孩子可不要学哦。 FPS第一人称射击类游戏自诞生以就有...

技术讨论
  • 0
  • 0
  • 2.8k
吊打一切现有版本的 YOLO!旷视重磅开源 YOLOX:新一代目标检测性能速度担当!

作者丨happy 编辑丨极市平台 YOLOX paper: https://arxiv.org/abs/2107.08430 code: https://github.com/Megvii-BaseDetection/YOLOX 本文是旷视科技在目标检测方面的最新技术总结,同时也是CVPR2021自动驾驶竞赛冠...

技术讨论
  • 0
  • 0
  • 4.0k
transformer 中: self-attention 部分是否需要进行 mask?

来源| 空字符 1 Transformer中的掩码 由于在实现多头注意力时需要考虑到各种情况下的掩码,因此在这里需要先对这部分内容进行介绍。在Transformer中,主要有两个地方会用到掩码这一机制。第1个地方就是在上一篇文章...

  • 0
  • 0
  • 1.7k
UC 伯克利华人一作:卷积让视觉 Transformer 性能更强,ImageNet 继续刷点!

来源 | arXiv | AI有道 Convolutional stem is all you need! Facebook AI和UC伯克利联手,探究视觉Transformer优化不稳定的本质原因,只需把patchify stem替换成convolutional stem,视觉Transformer就会性能更强,...

  • 0
  • 0
  • 1.7k
加载更多