• 问答
  • 技术
  • 实践
  • 资源

  • 0

    关注
  • 0

    获赞
  • 0

    精选文章
近期动态
  • 专栏文章
  • 社区提问
超准确人脸检测 (带关键点) YOLO5Face C++ 工程详细记录

作者丨DefTruth 编辑丨极市平台 1. YOLO5Face简介 Github:https://github.com/deepcam-cn/yolov5-face ArXiv 2021:https://arxiv.org/abs/2105.1293 C++ 实现:https://github.com/DefTruth/YOLO5Face.lite.ai.too...

  • 0
  • 0
  • 191
模型压缩经典解读:隐私保护模型压缩技术 Nasty Teacher,无惧模型 “被蒸馏”!

作者丨科技猛兽 编辑丨极市平台 目录 1 避免模型被蒸馏,加强知识产权保护的 Nasty Teacher (ICLR 2021) (来自加利福尼亚大学) 1.1 Nasty Teacher 原理分析 随着深度学习技术的发展,深度神经网络 (CNN) 已经被成功...

  • 0
  • 0
  • 78
深入思考:算法工程师的落地能力具体指什么,如何提升自己的落地能力?

很多计算机视觉公司都是以算法起家,虽然技术能力强劲,但往往容易忽视工程能力。随着越来越多公司面临落地瓶颈,产业界对AI技术的实用导向愈发重视。因此,不论是对于算法工程师,还是即将进入工业界的人工智能研究...

  • 0
  • 0
  • 197
何恺明编年史

作者丨smarter 来源丨smarter 编辑丨极市平台 荣誉 别人的荣誉都是在某某大厂工作,拿过什么大奖,而何恺明的荣誉是best,best,best ......,裂开了 研究兴趣 据我观察,何恺明的研究兴趣大致分成这么几个阶段: 传...

  • 1
  • 0
  • 1.6k
复数神经网络及其 PyTorch 实现

作者丨科技猛兽 编辑丨极市平台 摘要:实数网络在图像领域取得极大成功,但在音频中,信号特征大多数是复数,如频谱等。简单分离实部虚部,或者考虑幅度和相位角都丢失了复数原本的关系。论文按照复数计算的定义,设...

  • 2
  • 0
  • 334
搞懂 Vision Transformer 原理和代码,看这篇技术综述就够了(二十一)

作者丨科技猛兽 编辑丨极市平台 本文目录 41 Pyramid TNT:使用金字塔结构改进的 TNT Baseline (来自北京华为诺亚方舟实验室) 40.1 TNT 回顾 41.2 Pyramid TNT 原理分析 41.3 Pyramid TNT 代码解读 Transformer 是 G...

  • 1
  • 0
  • 1.0k
全网最全-网络模型低比特量化

作者丨ZOMI酱@知乎(已授权) 来源丨https://zhuanlan.zhihu.com/p/453992336 编辑丨极市平台 1.1 神经网络模型量化概述 随着深度学习的发展,神经网络被广泛应用于各种领域,模型性能的提高同时也引入了巨大的参数...

  • 0
  • 0
  • 258
ConvNet 卷土重来,压过 Transformer!FAIR 重新设计纯 ConvNet 的新架构

作者丨happy 编辑丨极市平台 论文链接:https://arxiv.org/pdf/2201.03545.pdf 代码链接:https://github.com/facebookresearch/ConvNeXt “文艺复兴”,ConvNet卷土重来,压过Transformer。本文是FAIR的Zhuang Liu(De...

  • 2
  • 0
  • 859
模型压缩经典解读:解决训练数据问题,无需数据的神经网络压缩技术(四)

作者丨科技猛兽 编辑丨极市平台 目录 1 更加鲁棒和多样化的无训练数据模型压缩技术 (ICASSP 2021) (来自东北大学)1.1 RDSKD 原理分析 1.1.1 DAFL 方法回顾:通过 GAN 生成无标注的训练图片 1.1.2 更加鲁棒和多样化的...

  • 0
  • 0
  • 254
PyTorch 之 Checkpoint 机制解析

作者丨Lart 编辑丨极市平台 PyTorch 提供了一种非常方便的节省显存的方式,就是 Checkpoint 机制。这篇文章的目的在于更透彻的了解其内在的机制。 Checkpoint 机制 该技术的核心是一种使用时间换空间的策略。在现有...

  • 0
  • 0
  • 272
盘点我跳过的科研天坑,进坑就是半年白干

作者丨白鹡鸰&小轶 来源丨夕小瑶的卖萌屋 编辑丨极市平台 去年白鹡鸰花了两个月,刷了八千篇Arxiv,结果发现很多论文存在一些比较“基本”的常见问题: 研究问题和问题假设存在严重的漏洞,或者缺少充分的相关工作...

  • 0
  • 0
  • 415
多模态预训练模型综述

作者丨小小梦想@知乎(已转载) 来源丨https://zhuanlan.zhihu.com/p/435697429​ 编辑丨极市平台 前言 2021年诺贝尔生理学、医学奖揭晓,获奖者是戴维·朱利叶斯(DavidJulius)和阿代姆·帕塔博蒂安(Ardem Patapouti...

  • 0
  • 0
  • 367
算法工程师在岗 3年小结:模型策略、工作思路以及个人成长

作者丨机智的叉烧@知乎(已授权) 来源丨https://zhuanlan.zhihu.com/p/453800419 编辑丨极市平台 导读:掐指一算,还剩几个月就工作3年了(含实习),时间过得挺快的,对自己的成长和思路进行了总结,我会分几个角...

  • 0
  • 0
  • 440
LeCun 新作,一张卡就能训!方差正则,抛弃 L1 正则,稀疏编码器不再崩溃

来源丨新智元 编辑丨极市平台 论文:https://arxiv.org/abs/2112.09214 开源代码:https://github.com/kevtimova/deep-sparse 神经网络中有一类学习特别受研究人员的青睐,那就是自监督学习(self-supervised learni...

  • 1
  • 0
  • 2.7k
清华大学提出 DAT | DCN+Swin Transformer 会碰撞出怎样的火花???

作者丨ChaucerG 来源丨集智书童 编辑丨极市平台 最近,Transformer在各种视觉任务上都表现出了卓越的表现。有时Transformer模型比CNN模型具有更高的表现能力。然而,单纯扩大感受野也会引起一些问题。一方面,在ViT...

  • 0
  • 0
  • 350
2021年过去,谁是 YOLO 系列的最强王者?YOLO 系列的最高精度 YOLOR 是怎样炼成的

作者丨C位君 来源丨每日CV 编辑丨极市平台 图表数据来源: EfficientDet: https://arxiv.org/pdf/2011.08036.pdf YOLOv3: https://arxiv.org/pdf/2011.08036.pdf YOLOv4: https://github.com/AlexeyAB/darknet YOLOv...

  • 0
  • 0
  • 517
医学图像数据读取及预处理方法总结

作者丨李慕清@知乎 ​来源丨https://zhuanlan.zhihu.com/p/112176670 编辑丨极市平台 本文仅供学术参考,如有侵权请联系小编删文。 这两天又重新回顾了一下医学图像数据的读取和预处理方法,在这里总结一下。 基于深...

  • 1
  • 0
  • 1.9k
CNN、Transformer、MLP 架构的经验性分析

作者丨pprp 来源丨GiantPandaCV 编辑丨极市平台 ViT的兴起挑战了CNN的地位,随之而来的是MLP系列方法。三种架构各有特点,为了公平地比较几种架构,本文提出了统一化的框架SPACH来对比,得到了具有一定insight的结论...

  • 0
  • 0
  • 187
搞懂 Vision Transformer 原理和代码,看这篇技术综述就够了(二十一)

作者丨科技猛兽 编辑丨极市平台 专栏目录:https://zhuanlan.zhihu.com/p/348593638) 本文目录 40 EDT:用于底层视觉的高效图像处理 Transformer (来自 港中文,思谋科技) 40.1 EDT 原理分析 40.2 EDT 代码解读 Tran...

  • 0
  • 0
  • 339
告别 Heatmap!人体姿态估计表征新方法 SimDR

作者丨Tau 编辑丨极市平台 2D Heatmap-based方法由于其优秀的精度表现,过去多年中都是姿态估计领域的主宰,不过今年以来,陆续出现了很多优秀的工作,都在尝试丢弃用Heatmap进行特征表示:前有基于transformer的Tok...

  • 0
  • 0
  • 393
初探 Video Transformer(二):谷歌开源更全面、高效的无卷积视频分类模型 ViViT

作者丨FlyEgle ​编辑丨极市平台 ViViT: A Video Vision Transformer paper: https://arxiv.org/abs/2103.15691 code(Unoffical): model2:https://github.com/rishikksh20/ViViT-pytorch model4: https://github.c...

  • 0
  • 0
  • 345
性能大幅提升!消除图像复原中的 “misalignment”

作者丨happy 来源丨AIWalker 编辑丨极市平台 论文链接:https://arxiv.org/pdf/2112.04491.pdf 代码链接:https://github.com/megvii-research/tlsc "misalignment"之处必有大发现。CNN训练与测试图像分辨率不一致引...

  • 0
  • 0
  • 342
让 Dropout 在图像超分领域重焕光彩!

作者丨happy 来源丨AIWalker 编辑丨极市平台 论文链接:https://arxiv.org/pdf/2112.12089.pdf 本文是 X-Pixel 团队关于dropout在图像超分中应用的探索。Dropout不适用于low-level任务已成为常识性认知,却鲜少有学...

  • 0
  • 0
  • 341
用沐神的方法阅读 PyTorch FX 论文

作者丨BBuf 来源丨GiantPandaCV 编辑丨极市平台 torch.fx对于PyTorch来说确实是一个比较好的工作,因为它消除了一些动态图和静态图的Gap。比如在图改写方面,torch.fx让PyTorch想做一些其它静态图框架的算子融合优化...

  • 0
  • 0
  • 300
升级版 NanoDet-Plus 来了!简单辅助模块加速训练收敛,精度大幅提升!

作者丨RangiLyu@知乎(已授权) 来源丨https://zhuanlan.zhihu.com/p/449912627 编辑丨极市平台 先上性能对比: 与上一代NanoDet相比,在仅增加1毫秒多的延时的情况下,精度提升了30\%。与YOLOv5-n, YOLOX-Nano等其...

  • 1
  • 0
  • 756
神经网络加上注意力机制,为什么精度反而下降?

作者丨pprp 来源丨GiantPandaCV 编辑丨极市平台 因为之前写过Attention+YOLOv3的文章,做过相关实验,所以被问过很多问题,举几个典型的问题: 我应该在哪里添加注意力模块? 我应该使用那种注意力模块? 为什么我...

  • 0
  • 0
  • 464
加载更多
他的关注
他关注的
关注他的
查看更多
的专业名片

  • NaN

    关注
  • NaN

    获赞
  • NaN

    精选文章
所获殊荣

扫描二维码,进入极市社区
找到更多CV大咖

他的专栏