• 问答
  • 技术
  • 实践
  • 资源
  • 推荐
加油站巡检算法需求

一、背景描述 1、项目背景:加油站客户有巡检需求,需要识别在‘加油现场’巡检业务中的四个部分内容用于管理端二次确认,分别涵盖:灭火器箱、防火毯、灭火器、灭火器压力值情况检查。 2、项目算法要达到的目的:识别...

项目需求
  • 0
  • 4
  • 127
铁路车厢号识别算法需求

一、背景描述 1、项目背景:铁路客户存在解决人工记录/读取/录入车厢号的需求,希望通过对抓拍的车箱图片进行处理,自动检测集装箱的编号,减少对人工的依赖,提高小效率。 2、项目算法要达到的目的:执法仪拍摄车厢...

项目需求
  • 0
  • 6
  • 202
深度了解自监督学习,就看这篇解读 !微软首创:运用在 image 领域的 BERT

作者丨科技猛兽 来源丨极市平台 编辑丨极市平台 本文目录 1 BERT 方法回顾 2 BERT 可以直接用在视觉任务上吗? 3 BEiT 原理分析 3.1 将图片表示为 image patches 3.2 将图片表示为 visual tokens 3.2.1 变分自编...

技术讨论
  • 0
  • 0
  • 55
详细解读 Google 新作 | 教你 How to train 自己的 Transfomer 模型?

作者丨ChaucerG 来源丨集智书童 编辑丨极市平台 1 简介 Vision Transformers(Vision transformer, ViT)在图像分类、目标检测和语义分割等视觉应用中得到了具有竞争力得性能。 与卷积神经网络相比,当在较小的训练数...

技术讨论
  • 0
  • 0
  • 61
实时的目标检测与识别简单应用(实战)

来源: 计算机视觉研究院作者:Edison_G 最近总是有很多入门的朋友问我,我进入计算机视觉这个领域难不难?是不是要学习很多知识?到底哪个方向比较好? 一、问题来源 最近总是有很多入门的朋友问我,我进入计算机视...

技术讨论
  • 0
  • 0
  • 954
CVPR 2021 | CoCosNet v2 解锁 “高配版” 图像翻译

作者丨张博、陈栋 来源丨微软研究院AI头条 编辑丨极市平台 编者按:针对图像翻译(image translation)任务,微软亚洲研究院的研究员们曾在 CVPR 2020 发表的论文中提出了 CoCosNet 算法,解决了图像生成过程中风格...

技术讨论
  • 0
  • 0
  • 61
NBNet:抛开复杂的网络结构设计,旷世&快手提出子空间注意力模块用于图像降噪

作者丨小小刘 审稿丨邓富城 编辑丨极市平台 本文对旷视科技2021年关于图像去噪的新作"NBNet: Noise Basis Learning for Image Denoising with Subspace Projection"进行解读。 论文地址:https://arxiv.org/abs/2012...

技术讨论
  • 0
  • 0
  • 81
ECCV 2020 论文大盘点-目标检测篇

来源:我爱计算机视觉 本文盘点ECCV 2020 与目标检测相关的研究,包含目标检测新范式、密集目标检测、点云目标检测、少样本目标检测、水下目标检测、域适应目标检测、弱监督目标检测、训练策略等,总计 42 篇,其中...

论文速递
  • 3
  • 0
  • 2.3k
快速上手笔记,PyTorch 模型训练实用教程(附代码)

前言 自 2017 年 1 月 PyTorch 推出以来,其热度持续上升,一度有赶超 TensorFlow 的趋势。PyTorch 能在短时间内被众多研究人员和工程师接受并推崇是因为其有着诸多优点,如采用 Python 语言、动态图机制、网络构建...

书籍教程
  • 26
  • 107
  • 6.7k
2021 下半年会议论文投稿时间小结与历年接收率回顾(持续更新中)

作者丨Mark@知乎(已授权) 来源丨https://zhuanlan.zhihu.com/p/380572588 编辑丨极市平台 翻开日历,发现今年已经过半,在上半年中有非常多并且不错的会议值得投稿, 比如ICML, ACL, IJCAI, KDD, SIGIR, UAI, ICCV,...

技术讨论
  • 1
  • 0
  • 92
发 SCI 很难,但我总结的这套方法帮我读研期间发了 5 篇 SCI,所有的方法和技巧都在这里了

准备发表SCI论文或者将要发表SCI论文的朋友,要死死撑住,一定要把它看完,并尝试去实践它。 之所以能发那几篇论文,跟我研究方向、导师指导方式和自己努力都有关系。我把读研时候写论文的心得总结成下面几部分: ——...

书籍教程
  • 18
  • 85
  • 8.4k
使用 Python+OpenCV+Keras 实现基于车牌的无口罩车辆驾驶员的惩罚生成

作者丨磐怼怼 来源丨深度学习与计算机视觉 编辑丨极市平台 介绍 我们知道,在当前形势下,我们正在逐步稳定地克服大流行病的情况,而且情况每天都在改善。但是,众所周知,即使已经开始接种疫苗,彻底根除该病毒仍需...

技术讨论
  • 0
  • 0
  • 66
有哪些简便好用的解凸优化的工具箱或者包?

比如说现在要求解一个LASSO回归问题,有没有可以直接输入优化的目标式子就能够解出来的工具箱呢?比方说直接输入min(sum((y-Ax)^2)+lambda*nrom(A,1))就能求解出参数A? zhihu 我简单介绍几个凸优化的工具包: Welco...

问答
  • 0
  • 0
  • 432
深度学习中 Attention 与全连接层的区别何在?

既然Attention是为了关注某些局部信息,那些不就相当于连上一层在关注的部分权重更大的全连接层吗,二者的区别何在? zhihu 正如你所说的,Attention的最终输出可以看成是一个“在关注部分权重更大的全连接层”。但是...

问答
  • 0
  • 0
  • 918
一文看尽深度学习中的各种注意力机制

作者丨派派星 来源丨CVHub ​编辑丨极市平台 导读 视觉注意力机制是人类视觉所特有的一种大脑信号处理机制,而深度学习中的注意力机制正是借鉴了人类视觉的注意力思维方式。一般来说,人类在观察外界环境时会迅速的扫...

技术讨论
  • 0
  • 0
  • 86
一个小问题:深度学习模型如何处理大小可变的输入

作者丨郭必扬 来源丨SimpleAI 编辑丨极市平台 对于大小可变的输入,深度学习模型如何处理? 前几天在学习花书的时候,和小伙伴们讨论了“CNN如何处理可变大小的输入”这个问题。进一步引申到“对于大小可变的输入,深度...

技术讨论
  • 0
  • 0
  • 79
极市直播丨朱思语:基于深度学习的视觉稠密建图和定位

| 极市线上分享  第83期 | 随着深度学习的快速发展,视觉稠密建图和定位技术从传统的基于手工特征点的检测、匹配加之数值优化,发展到现在的基于深度神经网络的特征检测、匹配和学习优化(Learning to Optimize),近...

技术直播
  • 0
  • 0
  • 86
极市直播丨严彬:CVPR 2021-LightTrack:基于网络结构搜索的超轻量级跟踪模型设计

| 极市线上分享  第82期 | 近年来,视频目标跟踪取得了飞速的发展,然而当前性能最优越的跟踪模型的计算量和参数量都过于巨大,以至于无法在真实应用中部署。 在这次分享中,我们邀请到了大连理工大学信通学院IIAU-L...

技术直播
  • 0
  • 0
  • 83
极市直播|第 81 期-CSIG-广东省 CVPR2021 论文在线学术报告会

| 极市线上分享  第81期 | CSIG-广东省CVPR2021论文在线学术报告会于2021年5月8日成功召开。本次学术报告会由中国图象图形学学会(CSIG)和人工智能与数字经济广东省实验室(琶洲实验室)共同主办,广东省图象图形学...

技术直播
  • 0
  • 0
  • 90
极市直播丨张新宇:CVPR 2021-​Alpha Refine:通过精确的边界框估计提高跟踪性能

| 极市线上分享  第80期 | 目标跟踪任务要求跟踪器在视频的每一帧中以边界框的形式尽可能精确地预测目标的位置。现有的许多跟踪器能非常出色地确定目标的大致位置,但预测的边界框往往不够精准。这在很大程度上是由...

技术直播
  • 0
  • 0
  • 62
极市直播丨陈鑫:CVPR 2021-​TransT: 基于 Transformer 的高性能单目标跟踪算法

| 极市线上分享  第79期 | 相关运算在视觉目标跟踪算法中发挥了重要作用。在跟踪过程中,相关运算通过简单的相似性比较,来完成模板和搜索区域特征的交互,输出一张相似度图来确定目标的位置。然而,相关运算本身是...

技术直播
  • 0
  • 0
  • 89
极市直播丨田春伟:​基于卷积神经网络的图像复原研究

| 极市线上分享  第78期 | 一直以来,为让大家更好地了解学界业界优秀的论文和工作,极市已邀请了超过90位技术大咖嘉宾,并完成了77期极市线上直播分享。往期分享请前往bbs.cvmart.net/topics/149或直接阅读原文,也...

技术直播
  • 0
  • 0
  • 87
极市直播丨邓欣:TIP 2021-多曝光图像融合及超分辨的联合实现方法

| 极市线上分享 第77期 | 一直以来,为让大家更好地了解学界业界优秀的论文和工作,极市已邀请了超过90位技术大咖嘉宾,并完成了76期极市线上直播分享。往期分享请前往http://bbs.cvmart.net/topics/149,也欢迎各位...

技术直播
  • 0
  • 0
  • 77
一位算法工程师从 30+ 场秋招面试中总结出的超强面经—文本检测与 GAN 篇(含答案)

作者:灯会 作者灯会为21届中部985研究生,七月份将入职某互联网大厂cv算法工程师。在去年灰飞烟灭的算法求职季中,经过几十场不同公司以及不同部门的面试中积累出了CV总复习系列,此为文本检测与GAN篇。 1.LSTM(长...

技术讨论
  • 0
  • 0
  • 117
【卷积系列】HetConv | 用异构卷积训练深度网络,提升效率且不损失精度!

作者:派派星 来源:CVHub 简介 论文链接:https://arxiv.org/pdf/1903.04120.pdf 代码链接:https://github.com/CVHuber/Convolution/blob/main/HetConv 背景 近年来,卷积神经网络(CNN)在视觉领域取得了卓越的成...

技术讨论
  • 0
  • 0
  • 1.0k
面试官:“简述 Xception 中的深度可分离卷积”

作者丨BJWang 来源丨灿视学长 编辑丨极市平台 Xception 网络 大家好,小编又来啦。在前面的文章中呢我们介绍了关于 Inception 的系列网络,在 2017 年谷歌也是在 Inception- $V 3$ 的基础上推出 Xception,在性能上...

技术讨论
  • 0
  • 0
  • 88
加载更多