内容简介:
文章目录
摘要
1 简介
2 相关工作
3 全卷积掩码自编码器
4 全局响应归一化
5 ImageNet实验
6 迁移学习实验
7 结论
摘要
论文链接:ConvNeXt V2 在改进的架构和更好的表示学习框架的推动下,视觉识别领域在21世纪20年代初实现了快速现代化和性能提升。例如,以ConvNeXt[52]为代表的现代ConvNets在各种场景中都表现出了强大的性能。虽然这些模型最初是为使用ImageNet标签的监督学习而设计的,但它们也可能受益于自监督学习技术,如蒙面自编码器(MAE)[31]。然而,我们发现,简单地结合这两种方法会导致性能不佳。在本文中,我们提出...
查看原文
暂无评论...