CVPR2020 线上分享 | 满分论文FineGym:面向细粒度动作分析的高质量数据集与现有方法分析

作为计算机视觉领域的三大国际顶会之一,CVPR 每年都会吸引全球领域众多专业人士参与。如 2019 年,CVPR 注册参会人数高达 9227 人,突破历届记录。其中,来自国内的参会人数就达到 1044 位,仅次于大会举办地美国(4743 位)。

CVPR 2020 原定于 6 月 16 日至 20 日在华盛顿州西雅图的华盛顿州会议中心举行,但是当前全球疫情势态严峻,越来越多的国际 AI 顶会开始转向线上,CVPR 也不例外。

虽然无法去现场交流,但这无法阻挡我们学习的热情。

为向读者们分享更多 CVPR 优质内容,在 CVPR 2020 开幕之前,机器之心将策划多期线上分享。这是机器之心 CVPR 2020 线上分享的第四期,我们邀请到香港中文大学多媒体实验室博士邵典为我们分享满分论文《FineGym: A Hierarchical Video Dataset for Fine-grained Action Understanding》。


讲师自述

邵典,女,香港中文大学多媒体实验室博士三年级在读。师从林达华和汤晓鸥教授,目前的研究方向是视频理解和动作分析。本科毕业于北京大学信息科学技术学院智能科学系,欢迎学弟学妹们认亲。

非典型 PhD,CV 圈小透明,曾长达两年无所产出,但是很幸运没有自我放弃也没有被放弃。顺便以此现身说法鼓舞一下处在低谷期的同学们吧,「玉经琢磨多成器,剑拔沉埋便倚天」。

这次的工作我们付出了很多心血和精力,但是肯定也有不少瑕疵。欢迎大家批评指正,也希望感兴趣的同学能持续关注,多多 follow。

分享概要

视频中的动作理解一直是计算机视觉领域的热点研究方向。原有的工作一般都是面向粗粒度的动作识别与分析,在许多现有数据集上相关研究已经遇到了瓶颈。我们这篇工作则独树一帜,提出了一个大规模、高质量、层级化标注的细粒度人体动作数据集:FineGym。

在这一数据集上,我们对现有的各类动作识别方法从多个层级多个角度进行了分析,得了很多有趣的结果,对领域一些固有结论产生了挑战,也为未来的研究带来了一些启发。值得注意的是,除了支持动作识别任务,FineGym 丰富的标注内容还可以支持其他动作相关的研究,如时域动作检测、动作质量评估、动作生成、动作属性识别等。基于这些特点,我们的工作在 CVPR2020 中,也获得了 3 strong accept 的「满分」成绩。

  • 论文链接:https://arxiv.org/abs/2004.06704

  • 项目地址:https://sdolivia.github.io/FineGym/


  • 直播时间:北京时间 5 月 20 日,20:00——21:00


CVPR 2020 机器之心线上分享

在 CVPR 2020 收录的大量优秀论文中,我们将选出数篇优质论文,邀请论文作者来做线上分享。整场分享包括两个部分:论文解读和互动答疑。

线上分享将在「CVPR 2020 交流群」中进行,加群方式:添加机器之心小助手(syncedai4),备注「CVPR」,邀请入群。入群后将会公布直播链接。