• 问答
  • 技术
  • 实践
  • 资源
极市直播|ICCV'21 Oral-包文韬:开放世界动作识别新基准,DEAR:首个大规模视频动作识别的证据学习新模型

| 极市线上分享  第85期 |

视频动作识别,是为了识别视频中所呈现的人物动作类型。然而在真实的开放世界中,视频动作千姿百态,目前基于深度学习的动作识别模型,无法识别的新出现的动作类型。这一问题在开集识别(OSR)领域已有不少研究工作,然而现有的研究主要基于图像数据进行研究,忽略了视频的时空动态特性对OSR方法的影响。

在这次分享中,我们邀请到了来自美国罗切斯特理工大学计算与信息科学系三年级在读博士生包文韬,为我们介绍他的工作:

Evidential Deep Learning for Open Set Action Recognition

本文利用最新的深度证据学习理论(Evidential Deep Learning),针对视频数据特点,提出一种基于证据的不确定性方法来识别新出现的动作,主要包括证据不确定性矫正(Evidential Uncertainty Calibration)、证据特征的去偏好优化(Evidence Debiasing)。实验证实,我们的方法能够显著提高目前主流的动作识别模型的OSR能力,代码和预训练模型将在近期开源。值得指出的是,本文涉及的深度证据不确定性理论,在图像分类、目标检测、语义分割等许多基础视觉任务上,均有广阔的研究前景。

01 直播信息

主题深度证据学习在开集视频动作识别中的应用

02 嘉宾介绍

包文韬

美国罗切斯特理工大学计算与信息科学系,三年级在读博士生,指导老师为Yu Kong教授、Qi Yu教授。研究方向为计算机视觉与机器学习,具体包括三维目标检测、深度学习不确定性、视频理解与可解释性。

03 关于分享

分享大纲

  1. 开集识别问题与视频应用

  2. 深度学习的不确定性

  3. 提出的DEAR模型

  4. 实验结果和分析

  5. 总结与讨论

➤论文

1.Evidential Deep Learning for Open Set Action Recognition

链接地址:https://arxiv.org/abs/2107.10161

04 直播回放

直播地址:http://live.bilibili.com/3344545
PPT: https://pan.baidu.com/s/1_vJ_a1ANXR1J1WC8K_xq9g
密码: j7wi

往期回顾

极市平台专注分享计算机视觉前沿资讯和技术干货,特邀请行业内专业牛人嘉宾为大家分享视觉领域内的干货及经验,目前已成功举办82期线上分享。近期在线分享可点击以下标题查看:

……

更多往期分享请浏览:极市计算机视觉技术分享集锦(http://bbs.cvmart.net/topics/149/cvshare)。

在"极市平台"公众号后台回复期数或者分享嘉宾名字,即可获取极市平台对应期在线分享资料。

关于极市平台

极市(Extreme Mart) 是深圳极视角科技有限公司旗下AI开发者生态,面向计算机视觉算法工程师,为开发者提供算法开发环境、真实数据项目实战、自动测试、加速工具、算法封装等全方位平台技术与工程支持,同时提供技术干货、大咖分享、社区交流、竞赛活动等丰富的内容与服务。官网:http://www.cvmart.net

  • 1
  • 0
  • 252
收藏
暂无评论
Admin
大咖

极市平台

  • 18,361

    关注
  • 1,123

    获赞
  • 131

    精选文章
近期动态
  • 极市社区管理员,分享计算机视觉各个方向视觉干货,欢迎关注
文章专栏
  • 极市平台