• 问答
  • 技术
  • 实践
  • 资源
  • 推荐
【Attention 九层塔】注意力机制的九重理解

​作者丨电光幻影炼金术@知乎(已授权) 来源丨https://zhuanlan.zhihu.com/p/362366192 编辑丨极市平台 Attention现在已经火爆了整个AI领域,不管是机器视觉还是自然语言处理,都离不开Attention、transformer或者BE...

技术讨论
  • 0
  • 0
  • 3
MaskedFace-Net | 新冠疫情中的口罩检测(附论文及源代码)

来源:原创 Edison_G 计算机视觉研究院 作者:Edison_G 戴口罩似乎是限制covid-19传播的一种解决方案。在这种情况下,有效的识别系统被期望用于检查人在被管制的区域是否戴口罩。因此,对于训练深度学习模型来检测...

  • 0
  • 0
  • 234
7 个提升 PyTorch 性能的技巧

作者丨William Falcon 来源丨AI公园 编辑丨极市平台 一些小细节,确实可以提升速度。 在过去的10个月里,在PyTorch Lightning工作期间,团队和我已经接触过许多结构PyTorch代码的风格,我们已经发现了一些人们无意中...

技术讨论
  • 1
  • 0
  • 84
【已截止招募】睡岗识别算法需求

睡岗识别算法需求 具体需求: a)是否设备是否位移(设备消失、设备移动超过镜头成像范围三分之一) b)通过固定摄像头拍摄设备情况,与数据标注进行比对,识别该设备是否产生位移情况 具体场景为: 在厂区的办公场景...

项目需求
  • 0
  • 2
  • 69
219 个 opencv 常用函数汇总

作者丨AmosLLc 来源丨新机器视觉 编辑丨极市平台 1、cvLoadImage:将图像文件加载至内存; 2、cvNamedWindow:在屏幕上创建一个窗口; 3、cvShowImage:在一个已创建好的窗口中显示图像; 4、cvWaitKey:使程序暂停...

技术讨论
  • 0
  • 0
  • 22
保姆级教程:图解 Transformer

来源:Jack-Cui 公众号:JackCui-AI,分享技术,乐享生活。 一、前言 大家好,我是 Jack。 本文是图解 AI 算法系列教程的第二篇,今天的主角是 Transformer。 Transformer 可以做很多有趣而又有意义的事情。 比如我...

技术讨论 #其他
  • 1
  • 0
  • 1.2k
CVPR2021 (Oral) 商汤、港中文实现单目人脸重建新突破: 基于生成网络的渲染器!几何形状更精准!渲染效果更真实!

作者丨CV君 来源丨我爱计算机视觉 编辑丨极市平台 近日,商汤-港中文联合实验室提出基于风格化对抗生成器的人脸渲染器,用于取代传统图形学基于栅格化的渲染器来进行3D模型的重建。该方法构建了一种从输入3D模型到生...

技术讨论
  • 0
  • 0
  • 44
工服识别算法需求

需求详情: a)识别镜头下方人员是否穿着工服 具体场景为: 通过抽帧识别画面中图像中的人员是否穿着工服工裤,当识别未穿工衣工裤,后台识别后进行报警。 性能指标: a)识别精确率:90%以上 交付文件: 1.工服识别...

项目需求
  • 0
  • 1
  • 68
多人同时出入识别算法需求

具体需求: a) 玻璃门内部顶部安装摄像头,拍摄玻璃门内人头数量;当区域内人数大于等于2时进行报警 b)当两人及两人以上出现在玻璃门内则视为尾随违规行为,当两人同时进入玻璃门,则及进行报警,形式通过图片抽帧...

项目需求
  • 1
  • 1
  • 54
请问一下,start_train.sh 是什么文件?

模型类型的时候,要用到“bash /project/train/src_repo/start_train.sh”,我想问一下这个文件是什么?大概是要怎么写的?

问答
  • 0
  • 0
  • 25
阿里巴巴数据技术及产品部- 招聘全职 (社招 / 校招),地点杭州

【团队介绍】 阿里巴巴数据技术及产品部定位于阿里集团数据中台,承担阿里全域大数据的建设、挖掘与应用的职责,为阿里生态内外的业务、用户、中小企业提供全链路、全渠道的数据服务。作为阿里大数据战略的核心践行...

求职内推
  • 0
  • 0
  • 51
【报名已截止】电子卷宗内容定位算法需求

具体需求 算法可自动定位电子卷宗中的指纹,印章,手写签名 指纹定位准确率在92%以上:指纹大小不一,颜色深浅不一,个别情况扫描后是黑色的或者有缺失;仅针对红色指纹(不含黑色指纹)、完整指纹(不含缺失指纹)...

项目需求
  • 4
  • 1
  • 2.4k
设备位移与睡岗识别算法需求

项目需求一:设备位移识别算法需求 具体需求: a)是否设备是否位移(设备消失、设备移动超过镜头成像范围三分之一) b)通过固定摄像头拍摄设备情况,与数据标注进行比对,识别该设备是否产生位移情况 具体场景为:...

项目需求
  • 0
  • 3
  • 567
视觉轮廓识别及定位

项目任务需: 木头的轮廓识别及定位,木头横放(倒放)搁置于料台,识别木头前后两端横截面轮廓与纵截面轮廓,得出尺寸结果及置于坐标系中的位置,共需识别三个面,即左右两端的横截面(图1、图2),及从上往下俯拍...

问答
  • 0
  • 0
  • 33
视觉轮廓识别,及坐标系定位需求

问答
  • 0
  • 0
  • 30
电梯通道堵塞识别算法需求

需求详情: a) 根据工厂内常见堵塞物例如货物等进行标注(手推叉车、已打包货物、未打包货物、木板),当识别画面指定区域有堵塞物即报警 具体场景为:办公室和居民楼,消防通道堵塞情况,根据工厂内常见堵塞物例如...

项目需求
  • 0
  • 0
  • 50
李航老师《统计学习方法》及相关资源的最全汇总 (附打包下载)

编辑 | Will 出品 | 字节AI 李航:毕业于日本京都大学电气电子工程系,日本东京大学获得计算机科学博士学位。1990年至2001年就职于日本NEC 公司中央研究所,任研究员,2001年至2012年就职于微软亚洲研究院,任高级...

书籍教程
  • 1
  • 0
  • 1.1k
CV 知识库-新版极市社区上线啦(4.25-4.30)!开发者福利同步跟上~

活动时间:4.23-4.30 求吐槽,求建议,求祝愿~( 听见你的声音,本内容下回帖即可) 参与方式:本内容下直接发表回复 / 评论 在活动专题帖下留言(包括:发现bug、或 使用体验、或 优化建议、或 祝福祝愿等);完成...

专栏
  • 3
  • 45
  • 906
基于 Pytorch 对 YOLOV5 进行简易实现

来源:原创 呼啦圈正在输入中 GiantPandaCV 【GiantPandaCV导语】这篇文章主要针对于YOLOV5-Pytorch版本的网络结构代码进行实现,简化代码的理解并简化配置文件,进一步梳理一些YOLOV5四种网络结构,在这个过程中对...

技术讨论 #目标检测#其他
  • 0
  • 0
  • 721
pytorch 必须掌握的的 4 种学习率衰减策略

作者丨机器学习入坑者@知乎(已授权) 来源丨https://zhuanlan.zhihu.com/p/93624972 编辑丨极市平台 梯度下降算法需要我们指定一个学习率作为权重更新步幅的控制因子,常用的学习率有0.01、0.001以及0.0001等,学习...

技术讨论
  • 0
  • 0
  • 69
神仙打架丨 NTIRE2021 视频超分挑战双赛道方案

作者丨Wangsy 审稿丨邓富城 编辑丨极市平台 本文首发于极市平台,未经允许禁止转载。 论文链接:https://arxiv.org/pdf/2104.14852.pdf 比赛链接:https://competitions.codalab.org/competitions/28051 译者言:NTI...

技术讨论
  • 0
  • 0
  • 46
在目标检测中如何解决小目标的问题?

作者丨Nabil MADALI 来源丨AI公园 编辑丨极市平台 在深度学习目标检测中,特别是人脸检测中,由于分辨率低、图像模糊、信息少、噪声多,小目标和小人脸的检测一直是一个实用和常见的难点问题。然而,在过去几年的发...

技术讨论
  • 0
  • 0
  • 81
谷歌最新提出无需卷积、注意力 ,纯 MLP 构成的视觉架构!网友:MLP is All You Need ?

作者丨三金、琰琰 来源丨AI科技评论 编辑丨极市平台 近日,谷歌大脑团队新出了一篇论文,题目为 《MLP-Mixer: An all-MLP Architecture for Vision 》 ,这篇论文是原视觉Transformer(ViT)团队的一个纯MLP架构的尝...

技术讨论
  • 0
  • 0
  • 137
新手想问一下,关于怎么使用训练任务

本人新手一名,刚刚开始使用极市平台,写好代码后,发现不知道怎么训练,看了文档,还是不知道训练任务的“执行命令”是什么,是不是只能写示例的bash /project/train/src_repo/start_train.sh,这个文件“start_train....

问答
  • 0
  • 4
  • 114
image caption

求有image captionwith transformer完整的可运行的代码?

问答 #视频理解
  • 0
  • 0
  • 27
这样检测是不是更准! | 深度 Stereo 结构网络用于目标检测(附源码)

来源:原创 计算机视觉研究院 作者:Edison_G 目前自动驾驶愈演愈烈,技术也越来越成熟,从不可能上路到现在大家抢着去感受该新技术,未来电车是趋势,该领域的技术会是研究者关注的热点的话题。今日,我们“计算机...

专栏 #目标检测#论文#其他
  • 1
  • 0
  • 708
加载更多