城市直播房产教育博客汽车
投稿投诉
汽车报价
买车新车
博客专栏
专题精品
教育留学
高考读书
房产家居
彩票视频
直播黑猫
投资微博
城市上海
政务旅游

SwinTransformer为主干,清华等提MoBY自监督

10月2日 囍孤女投稿
  作者:ZhendaXie等
  机器之心编译
  机器之心编辑部
  来自清华大学、西安交大、微软亚研的研究者提出了一种称为MoBY的自监督学习方法,其中以VisionTransformer作为其主干架构,将MoCov2和BYOL结合,并在ImageNet1K线性评估中获得相当高的准确率,性能优于MoCov3、DINO等网络。
  近两年来,计算机视觉领域经历了两次重大转变,第一次是由MoCo(MomentumContrast)开创的自监督视觉表征学习,其预训练模型经过微调可以迁移到不同的任务上;第二次是基于Transformer的主干架构,近年来在自然语言处理中取得巨大成功的Transformer又在计算机视觉领域得到了探索,进而产生了从CNN到Transformer的建模转变。
  不久前,微软亚研的研究者提出了一种通过移动窗口(shiftedwindows)计算的分层视觉SwinTransformer,它可以用作计算机视觉的通用主干网络。在各类回归任务、图像分类、目标检测、语义分割等方面具有极强性能。
  而在近日,来自清华大学、西安交通大学以及微软亚洲研究院的研究者也在计算机视觉领域发力,提出了名为MoBY自监督学习方法,以VisionTransformers作为其主干架构,将MoCov2和BYOL结合在一起,在ImageNet1K线性评估中获得相当高的准确率:通过300epoch训练,分别在DeiTS和SwinT获得72。8和75。0的top1准确率。与使用DeiT作为主干的MoCov3和DINO相比,性能略好,但trick要轻得多。
  更重要的是,使用SwinTransformer作为主干架构,还能够评估下游任务中(目标检测和语义分割等)的学习表征,其与最近的ViTDeiT方法相比,由于ViTDeiT不适合这些密集的预测任务,因此仅在ImageNet1K上报告线性评估结果。研究者希望该结果可以促进对Transformer架构设计的自监督学习方法进行更全面的评估。
  论文地址:https:arxiv。orgpdf2105。04553。pdfGitHub地址:https:github。comSwinTransformerTransformerSSL
  方法介绍
  自监督学习方法MoBY由MoCov2和BYOL这两个比较流行的自监督学习方法组成,MoBY名字的由来是各取了MoCov2和BYOL前两个字母。MoBY继承了MoCov2中的动量设计、键队列、对比损失,此外MoBY还继承了BYOL中非对称编码器、非对称数据扩充、动量调度(momentumscheduler)。MoBY架构图如下图1所示:
  MoBY包含两个编码器:在线编码器和目标编码器。这两个编码器都包含一个主干和projectorhead(2层MLP),在线编码器引入了额外的预测头(2层MLP),使得这两个编码器具有非对称性。在线编码器采用梯度更新,目标编码器则是在线编码器在每次训练迭代中通过动量更新得到的移动平均值。对目标编码器采用逐渐增加动量更新策略:训练过程中,动量项值默认起始值为0。99,并逐渐增加到1。
  学习表征采用对比损失,具体而言,对于一个在线视图(onlineview)q,其对比损失计算公式如下所示:
  式中,为同一幅图像的另一个视图(view)的目标特征;i是键队列(keyqueue)中的目标特性;是temperature项;是键队列的大小(默认为4096)。
  在训练中,与大多数基于Transformer的方法一样,研究者还采用了AdamW优化器。
  MoBY伪代码如下所示:
  实验
  在ImageNet1K上的线性评估
  在ImageNet1K数据集上进行线性评估是一种常用的评估学得的表征质量的方式。在该方式中,线性分类器被用于主干,主干权重被冻结,仅训练线性分类器。训练完线性分类器之后,使用中心裁剪(centercrop)在验证集上取得了top1准确率。
  表1给出了使用各种自监督学习方法和主干网络架构的预训练模型的主要性能结果。
  1。与使用Transformer架构的其他SSL方法进行比较
  MoCov3、DINO等方法采用ViTDeiT作为主干网络架构,该研究首先给出了使用DeiTS的MoBY的性能结果,以便与该研究的方法进行合理比较。经过了300个epoch的训练,MoBY达到了72。8top1的准确率,这比MoCov3和DINO(不含多次裁剪(multicrop))略胜一筹,结果如表1所示。
  2。SwinTVSDeiTS
  研究者还比较了在自监督学习中各种Transformer架构的使用情况。如表1所示,SwinT达到了75。0top1的准确率,比DeiTS高出2。2。值得一提的是,这一性能差距比使用监督学习还大(1。5)。
  该研究进行的初步探索表明,固定patch嵌入对MoBY没有用,并且在MLP块之前用批归一化代替层归一化层可以让top1准确率提升1。1(训练epoch为100),如表2所示。
  在下游任务上的迁移性能
  研究者评估了学得的表征在COCO目标检测实例分割和ADE20K语义分割的下游任务上的迁移性能。
  1。COCO目标检测和实例分割
  评估中采用了两个检测器:MaskRCNN和CascadeMaskRCNN。表3给出了在1x和3x设置下由MoBY学得的表征和预训练监督方法的比较结果。
  2。ADE20K语义分割
  研究者采用UPerNet方法和ADE20K数据集进行评估。表4给出了监督和自监督预训练模型的比较结果。这表明MoBY的性能比监督方法稍差一点,这意味着使用Transformer架构进行自监督学习具有改进空间。
  消融实验
  研究者又进一步使用ImageNet1K线性评估进行了消融实验,其中SwinT为主干网络架构。
  1。不对称的droppathrate是有益的
  对于使用图像分类任务和Transformer架构的监督表征学习来说,droppath是一种有效的正则化方法。研究者通过消融实验探究了该正则化方法的影响,实验结果如下表5所示。
  2。其他超参数
  第一组消融实验探究了键队列大小K从1024到16384的影响,实验结果如表6(a)所示。该方法在不同K(从1024到16384)下都能够稳定执行,其中采用4096作为默认值。
  第二组消融实验探究了温度(temperature)的影响,实验结果如表6(b)所示。其中为0。2时性能最佳,0。2也是默认值。
  第三组消融实验探究了目标编码器的初始动量值的影响,实验结果如表6(c)所示。其中值为0。99时性能最佳,并被设为默认值。
投诉 评论 转载

纽约时报拜登对中国发动了文明战争,如果输了人类未来就不美好据美国媒体近日报道,美国《纽约时报》的专栏作家戴维布鲁克斯发表文章《美国的身份认同危机》,指出美军从阿富汗狼狈撤军代表着美国背弃了过往从邪恶中拯救全人类的英雄主义理想。当拜登在……一口气砸下3000亿,同时开建2艘航母,美国真能撑得住吗?图为美军航母难道美国军方被惹毛了吗?狂砸3000亿,同时在本土建造两艘航母,得知这一消息之后,俄罗斯网友立刻就酸了,果然有钱就是太任性,相比起航母维修都难以完成的俄罗斯,……地球四季可能错乱?专家提醒夏季也许将达到180天,冬季快没了引言现在全球气候变暖的问题也是越来越严重,而且现在的夏天要比70年前的时候还要长很多,预计到2100年,将会到达半年都是夏季的情况,由此看来,地球上的四季也许会出现错乱的……难以忽视的真相,全球二氧化碳的浓度已达400二氧化碳(CO2),一种我们看不见,摸不着,隔离起来,也无法独善其身的生态化合物;又称温室气体。它的弥漫与扩散,不分空间与地域。在地球这个大气球内,正在持续演绎着它的故事。它的……华北,东北,华南多地遭遇强对流天气根据中央气象台监测数据显示6月2日白天内蒙古东南部,吉林中南部,辽宁北部,河北东南,山东西北部,福建南部,湖南南部,江西中东部广西和广东部分区域遭遇了短时强降雨天气和强对流天气……SwinTransformer为主干,清华等提MoBY自监督作者:ZhendaXie等机器之心编译机器之心编辑部来自清华大学、西安交大、微软亚研的研究者提出了一种称为MoBY的自监督学习方法,其中以VisionTran……老公,小姑子结婚,你凭啥拿我的十万嫁妆给她买房当陪嫁?我和老公结婚五年了,两个人还算相敬如宾。我和他是相亲认识的,第一次见面就看对了眼,两个人很快就在一起了。大概相处了一年,我们就谈婚论嫁结婚了。结婚那会,婆婆给了我3万彩礼,婚房……刘强东被释放已回国解密事件真相近两天,最火爆的人物非刘强东莫属!于美国当地时间8月31日晚间,在参加商务活动时,刘强东被美国警方以涉嫌构成犯罪的性行为带走调查,9月1日下午被释放,没有被要求缴纳任何保释金。……爱尔兰HSE的医生说,重新开放室内接待有可能导致超级传播者事根据HSE东南地区公共卫生主管的说法,在Delta变体的传播和许多人口未接种疫苗的情况下,室内接待重新开放有可能导致超级传播者事件。CarmelMullaney博士对新冠……参加奥运就要吃福岛核食?日本犯下众怒了,韩国炸锅你们疯了?虽然距离福岛发生核事故已经过去了10年,但是谁也无法保证核污染已经彻底消失,核电站仍然在源源不断产生核废水。然而就是在这样的情况下,日本政府为了挽救福岛的经济,竟选择在奥运会这……蚂蚁集团被四部门再次约谈?阿里巴巴最近是怎么了?最近阿里巴巴的负面新闻层出不穷,引起了不少的关注。4月12日,人民银行、银保监会、证监会、外汇局等金融管理部门再次联合约谈蚂蚁集团。央行副行长潘功胜表示,整改内容主要包括……汉中市城固县积极应对阴雨天气全力迎战三秋生产文化艺术网文化艺术报讯(通讯员丁淼刘衡)时下正是三秋大忙时节,城固县抓早快动、提前准备,及时组织调运500余台收割机帮助农民抢收水稻,力保粮食颗粒归仓。截至9月6日,全县已收获……
终于!穆里尼奥开始有变化了他的棱角被磨平了?陈梦刘诗雯的试金石,就是朱雨玲,直通赛还会有伤病吗?新消息!辽宁U19两连败,广东王薪凯训练状态出色,杜锋都笑了谁才是后仰跳投的集大成者?德国的有钱人都住在哪里?他曾是英格兰国门,却被瓜迪奥拉扫地出门,如今合同到期无球可踢2020江苏高考语文作文题,再次引领潮流,独领风骚特别的暑假天河首期暑期托管班开班林忆莲做小三也要嫁的男人三婚歌手李宗盛歌好人渣,嫩妻小27岁17年的勇士,如果遇到96年的公牛,谁的赢面更大?恋恋剧中人热播,吴宣仪与小鬼王琳凯的恋情引发关注4亿签字费!国米张康阳要买梅西,但梅西为什么不会去?

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找