• 问答
  • 技术
  • 实践
  • 资源

  • 0

    关注
  • 0

    获赞
  • 0

    精选文章
近期动态
  • 专栏文章
  • 社区提问
参数量下降 85%,性能全面超越 ViT:全新图像分类方法 ViR

机器之心 机器之心 ViT 还不够完美?来自华东师范大学等机构的研究者提出了全新的图像分类方法 ViR,在模型和计算复杂性方面都优于 ViT。 近一年来,视觉 Transformer(ViT)在图像任务上大放光芒,比如在图像分类、...

  • 1
  • 0
  • 1.9k
2022 年 1 月推荐阅读的四篇深度学习论文

P**nHub兄弟网站 DeepHub IMBA DeepHub IMBA 自举元学习到深度学习的时间序列预测,外推与泛化之间的关系与 Ridge Rider 探索多样化最优 ‘Bootstrapped Meta-Learning’ Flennerhag et al. (2021) | 📝  https://arxi...

  • 0
  • 0
  • 356
Transformer 已成新霸主?FAIR 等重新设计纯卷积 ConvNet,性能反超

机器之心 机器之心 编辑:陈萍、小舟 来自 FAIR 、UC 伯克利的研究者重新检查了设计空间并测试了纯 ConvNet 所能达到的极限,表明卷积神经网络的性能不亚于视觉 Transformer。 视觉识别的快速发展始于 Vision trans...

  • 1
  • 0
  • 1.6k
资源分享 | PyTea:不用运行代码,静态分析 pytorch 模型的错误

CV技术指南 前言本文介绍一个Pytorch模型的静态分析器 PyTea,它不需要运行代码,即可在几秒钟之内扫描分析出模型中的张量形状错误。文末附使用方法。 本文转载自机器之心 编辑:CV技术指南 张量形状不匹配是深度神...

  • 1
  • 0
  • 1.3k
SMU 激活函数 | 超越 ReLU、GELU、Leaky ReLU 让 ShuffleNetv2 提升 6.22%

AI算法与图像处理 AI算法与图像处理 选择一个好的激活函数可以对提高网络性能产生重要的影响。Handcrafted Activation是神经网络模型中最常见的选择。尽管ReLU有一些严重的缺点,但由于其简单性,ReLU成为深度学习...

  • 1
  • 0
  • 2.1k
比较全面的 L1 和 L2 正则化的解释

石头 深度学习初学者 深度学习初学者 前言 前段时间写了一篇文章《深入理解线性回归算法(二):正则项的详细分析》,文章提到L1是通过稀疏参数(减少参数的数量)来降低复杂度,L2是通过减小参数值的大小来降低复...

  • 1
  • 0
  • 1.5k
SSD 的 torchvision 版本实现详解

原创 AI小将 机器学习算法工程师 机器学习算法工程师 之前的文章目标检测算法之SSD已经详细介绍了SSD检测算法的原理以及实现,不过里面只给出了inference的代码,这个更新版基于SSD的torchvision版本从代码实现的角...

  • 1
  • 1
  • 1.3k
如何使用 OpenCV 开发虚拟键盘

AI算法与图像处理 AI算法与图像处理 介绍 OpenCV 是最流行的计算机视觉任务库,它是用于机器学习、图像处理等的跨平台开源库,用于开发实时计算机视觉应用程序。 CVzone 是一个计算机视觉包,它使用 OpenCV 和 Me...

  • 1
  • 1
  • 1.3k
有 bug!用 Pytorch Lightning 重构代码速度更慢,修复后速度倍增

有bug!用Pytorch Lightning重构代码速度更慢,修复后速度倍增 视学算法 视学算法 微信号 visualAlgorithm 选自Medium 作者:Florian Ernst 用了 Lightning 训练速度反而更慢,你遇到过这种情况吗? PyTorch Lightn...

  • 0
  • 0
  • 1.3k
"对抗变换"提高对抗样本的可迁移性【CVPR 2021 港中文】

原创 孙裕道 我爱计算机视觉 1 引言 该论文发表于CVPR2021,主要是关于黑盒攻击中对抗样本可迁移性的研究。论文的创新点很新颖,虽然论文代码没有开源,但是自己实现起来也相对简单。 论文作者借助对抗训练的思想...

  • 0
  • 0
  • 1.3k
这个 GAN 没见过猪,却能把狗变成猪

来源 | 深度学习工坊 不用成千上万张目标图片训练,就能让GAN生成你想要的图片,有可能吗?还真有可能!来自特拉维夫大学和英伟达的研究人员成功地盲训出领域自适应的图像生成模型——StyleGAN-NADA。也就是只需用简单...

  • 0
  • 0
  • 2.5k
BEBLID:增强的高效局部图像特征描述符

来源 | 3D视觉工坊 BEBLID全称是Boosted Efficient Binary Local Image Descriptor,多项实验证明能够提高图像匹配精度,同时减少执行时间。 # Comment or uncomment to use ORB or BEBLIDdescriptor = cv.xfeatures...

  • 0
  • 0
  • 2.3k
PyTorch 零基础入门 GAN 模型之基础篇

来源 | 知乎 背景介绍 近年来,各种生成模型及其应用广泛地出现在大家的视野范围内,像最近非常火爆的 Alias-Free GAN 更是从一个全新的视角,为生成模型领域中新的发展方向打下了坚实的理论基础。但是现在来看,无...

  • 3
  • 0
  • 2.2k
卷积神经网络(CNN)详解

来源 | AI有道 CNN 一共分为输入,卷积,池化,拉直,softmax,输出 卷积由互关运算(用Filter完成)和激活函数 Filter CNN常用于图像识别,在深度学习中我们不可能直接将图片输入进去,向量是机器学习的通行证,我...

  • 0
  • 0
  • 2.8k
时间序列预测的 7 种 Python 工具包,总有一款适合你!

欢迎关注 Python与数据挖掘 @知乎 专注Python、数据分析、数据挖掘、好玩工具! 时间序列问题是数据科学中最难解决的问题之一。传统的处理方法如 ARIMA、SARIMA 等,虽然是很好,但在处理具有非线性特性或非平稳时...

  • 1
  • 0
  • 3.5k
思谋科技 招聘算法工程师(深圳 / 上海 / 北京 / 香港 / 苏州 / 杭州)( 校招 / 社招)

工作地点:深圳/上海/北京/香港/苏州/杭州 主要方向:机器学习、传统机器视觉、深度学习(分类、检测、分割、OCR、3D、SR)、网络压缩(蒸馏、量化、NAS)等方向 技术类 1、计算机视觉研究员/工程师 (工业AI方向) 岗位职...

  • 0
  • 0
  • 2.0k
CVPR2021|神经网络如何进行深度估计?

作者丨王玉旺 来源丨微软研究院AI头条 编辑丨极市平台 与深度神经网络相比,人类的视觉拥有更强的泛化能力,所以能够胜任各项视觉任务。结合人类视觉系统“通过观察结构信息获得感知能力”的特点,微软亚洲研究院的研...

  • 0
  • 0
  • 988
干货 | 盘点卷积神经网络中 6 种经典卷积操作

作者丨gloomyfish 来源丨OpenCV学堂 深度学习的模型大致可以分为两类,一类是卷积神经网络,另外一类循环神经网络,在计算机视觉领域应用最多的就是卷积神经网络(CNN)。CNN在图像分类、对象检测、语义分割等经典的...

  • 0
  • 0
  • 588
最新综述:基于深度学习方式的单目物体姿态估计与跟踪

作者丨Tom Hardy 来源丨3D视觉工坊 原文:Deep Learning on Monocular Object Pose Detection and Tracking: A Comprehensive Overview 作者:中国人民大学、清华大学、北京交通大学 摘要 目标姿态检测与跟踪在自...

  • 1
  • 0
  • 1.3k
干货 | 利用像机图像通过卷积神经网络实时进行水稻检测(致敬袁老)

来源:原创 Edison_G 计算机视觉研究院 作者:Edison_G 小农户在全球粮食供应中发挥着重要作用。随着智能手机越来越普及,它们使小农能够以非常低的低成本收集图像。在此感谢袁隆平先生的贡献,让我们衣食无忧! 一...

  • 0
  • 0
  • 1.6k
基于梯度和对数尺度的农业机器人农作物和杂草语义分割主动学习 | 2020 IEEE

来源: 泡泡机器人SLAM 2020 IEEE International Conference on Robotics and Automation (ICRA) 摘要 带注释的数据集对于监督学习是必不可少的。然而,标注大型数据集是一项乏味且耗时的任务。本文研究语义分割背景...

  • 0
  • 0
  • 1.7k
纹理表面缺陷图像数据集(DAGM 数据集)

德国DAGM 2007的数据集(各类纹理的表面缺陷图像数据集) 总共十类图像,有训练集和测试集,几种样例如下(含不少无缺陷的图片): 大小:2.74G 网盘下载地址:链接: https://pan.baidu.com/s/1aHs-kQwKPv1Os2Uvm7Mk3g...

  • 0
  • 0
  • 1.6k
霸榜多个 CV 任务,开源仅两天,微软分层 ViT 模型收获近 2k star

来源:机器之心 屠榜各大 CV 任务的微软 Swin Transformer,近日开源了代码和预训练模型。 自 2017 年 6 月谷歌提出 Transformer 以来,它便逐渐成为了自然语言处理领域的主流模型。最近一段时间,Transformer 更是...

  • 0
  • 0
  • 1.8k
PyTorch 的指标度量库 | TorchMetrics

来源:ronghuaiyang 作者:PyTorch Lightning team编译:ronghuaiyang 导读 非常简单实用的PyTorch模型的分布式指标度量库,配合PyTorch Lighting实用更加方便。 找出你需要评估的指标是深度学习的关键。有各种各样...

  • 0
  • 0
  • 2.1k
CVPR2021:推广到开放世界的在线自适应深度视觉里程计

来源:原创 Amber 计算机视觉工坊 Generalizing to the Open World Deep Visual Odometry with Online Adaptation **CVPR2021:推广到开放世界的在线自适应深度视觉里程计** 【摘要】 近些年,基于学习的视觉里程计...

  • 0
  • 0
  • 2.2k
美团视频算法实习生招聘

工作内容: 在指导下实现视频监控中的目标检测、跟踪、分割,动作姿态识别,行为分析,人与物交互等相关算法; 协助完成部分算法和系统的工程实现、数据分析等工作; 在公开数据集上持续优化算法,成绩优异且创新较...

  • 0
  • 0
  • 1.7k
加载更多
他的关注
他关注的
关注他的
    的专业名片

    • NaN

      关注
    • NaN

      获赞
    • NaN

      精选文章
    所获殊荣

    扫描二维码,进入极市社区
    找到更多CV大咖

    他的专栏