查看原文
该头条内容由程序员导航网提供:达摩院快速动作识别TPS ECCV论文深入解读
内容简介:
一、论文&代码
论文:https://www.ecva.net/papers/eccv_2022/papers_ECCV/papers/136630615.pdf
模型&代码:https://modelscope.cn/models/damo/cv_pathshift_action-recognition/summary
二、背景
高效的时空建模(Spatiotemporal modeling)是视频理解和动作识别的核心问题。相较于图像的Transformer网络,视频由于增加了时间维度,如果将Transformer中的自注意力机制(Self-Attention)简单扩展到时空维度,将会导致时空自注意力高昂的计算复杂度和空间复杂度。许多工作尝试对时空自注意力进行分解,...
暂无评论...