城市直播房产教育博客汽车
投稿投诉
汽车报价
买车新车
博客专栏
专题精品
教育留学
高考读书
房产家居
彩票视频
直播黑猫
投资微博
城市上海
政务旅游

微软浙大研究者提出剪枝框架OTO,无需微调即可获得轻量级架构

12月12日 夜未央投稿
  机器之心报道
  作者:HecateHe
  来自微软、浙江大学等机构的研究者提出了一种oneshotDNN剪枝框架,无需微调即可从大型神经网络中得到轻量级架构,在保持模型高性能的同时还能显著降低所需算力。
  大型神经网络学习速度很快,性能也往往优于其他较小的模型,但它们对资源的巨大需求限制了其在现实世界的部署。
  剪枝是最常见的DNN压缩方法之一,旨在减少冗余结构,给DNN模型瘦身的同时提高其可解释性。然而,现有的剪枝方法通常是启发式的,而且只针对特定任务,还非常耗时,泛化能力也很差。
  在一篇标题为《OnlyTrainOnce:AOneShotNeuralNetworkTrainingAndPruningFramework》的论文中,来自微软、浙江大学等机构的研究者给出了针对上述问题的解决方案,提出了一种oneshotDNN剪枝框架。它可以让开发者无需微调就能从大型神经网络中得到轻量级架构。这种方法在保持模型高性能的同时显著降低了其所需的算力。
  论文链接:https:arxiv。orgpdf2107。07467。pdf
  该研究的主要贡献概括如下:OneShot训练和剪枝。研究者提出了一个名为OTO(OnlyTrainOnce)的oneshot训练和剪枝框架。它可以将一个完整的神经网络压缩为轻量级网络,同时保持较高的性能。OTO大大简化了现有剪枝方法复杂的多阶段训练pipeline,适合各种架构和应用,因此具有通用性和有效性。ZeroInvariantGroup(ZIG)。研究者定义了神经网络的zeroinvariantgroup。如果一个框架被划分为ZIG,它就允许我们修剪zerogroup,同时不影响输出,这么做的结果是oneshot剪枝。这种特性适用于全连接层、残差块、多头注意力等多种流行结构。新的结构化稀疏优化算法。研究者提出了HalfSpaceStochasticProjectedGradient(HSPG),这是一种解决引起正则化问题的结构化稀疏的方法。研究团队在实践中展示并分析了HSPG在促进zerogroup方面表现出的优势(相对于标准近端方法)。ZIG和HSPG的设计是网络无关的,因此OTO对于很多应用来说都是通用的。实验结果。利用本文中提出的方法,研究者可以从头、同时训练和压缩完整模型,无需为了提高推理速度和减少参数而进行微调。在VGGforCIFAR10、ResNet50forCIFAR10ImageNet和BertforSQuAD等基准上,该方法都实现了SOTA结果。
  方法及实验介绍
  OTO的结构非常简单。给定一个完整的模型,首先将可训练的参数划分为ZIG集,产生了一个结构化稀疏优化问题,通过一个新的随机优化器(HSPG)得出高度组稀疏的解。最后通过剪枝这些zerogroup得到一个压缩模型。
  团队提出的HSPG随机优化算法是针对非光滑正则化问题而设计的,与经典算法相比,该算法在保持相似收敛性的同时,能够更有效地增强群体稀疏性搜索。
  为了评估OTO在未经微调的oneshot训练和剪枝中的性能,研究者在CNN的基准压缩任务进行了实验,包括CIFAR10的VGG16,CIFAR10的ResNet50和ImagetNet(ILSVRC2012),研究者比较了OTO与其当前各个SOTA算法在Top1精度和Top5精度、剩余的FLOPs和相应的baseline参数。
  表1:CIFAR10中的VGG16及VGG16BN模型表现。
  在CIFAR10的VGG16实验中,OTO将浮点数减少了83。7,将参数量减少了97。5,性能表现令人印象深刻。
  在CIFAR10的ResNet50实验中,OTO在没有量化的情况下优于SOTA神经网络压缩框架AMC和ANNC,仅使用了12。8的FLOPs和8。8的参数。
  表2:CIFAR10的ResNet50实验。
  在ResNet50的ImageNet实验中,OTO减少了64。5的参数,实现了65。5的浮点数减少,与baseline的Top15精度相比只有1。40。8的差距。
  表3:ResNet50的ImageNet。
  总体而言,OTO在所有的压缩基准实验中获得了SOTA结果,展现了模型的巨大潜力。研究者表示,未来的研究将关注合并量化和各种任务的应用上。
投诉 评论 转载

便捷!佛山155条校园定制专线来了,途经南庄这些站点新学期开学季佛山155条校园定制专线即将开行覆盖佛山一中、石门中学等27所学校校园定制专线新学期开学季,辅助公交平台联合各大运输企业为家长和学生打造绿色安全的……天然沸石对猫砂的影响钠基膨润土结块垫料在市场上很受欢迎,因为它们可以结块猫粪,易于去除和处理。然而,膨润土的纯度因产品而异,较低的纯度会导致微生物活动和产生的气味。沸石的气味吸收特性已得到充分证明……厉害到上天!太空运动模式开启航天生活我们的征途是星辰大海!在航天员先后进入天和核心舱后为期三个月的太空生活也正式开始了这也是中国自己的空间站第一次迎来常驻居民太空生活……近期股市下跌背后的博弈以及今年走势预测春节上班后,相信很多人的心情都不太好,经常会不自觉的拿出手机偷偷看两眼,原因无它,股票又跌了,自己又成了韭菜。说实话,包括我在内,很多人心里都明白,近期可能会下跌调整一下……玛雅文明到底有多神秘,为什么科学家至今都无法破解?文明是智慧的代名词,人类是地球上唯一的智慧生命,人类通过自己的努力建立起了自己的文明,人类诞生于几百万年前,现代科学认为人类是由猿类进化而来的,因为当时环境的恶劣和生存条件的因……它绝不是一架飞机提到尼克鲍勃很多人可能不知道,可是如果你问那些UFO事件研究者或爱好者,其鼎鼎大名可以说无人不知,他就是英国国防部UFO事务局的主官。由于UFO事件在世界各国频频发生,但每每都……不愧是娘娘!孙俪的手抄字帖参展了近日,孙俪更新社交动态晒出自己的书法作品参展的照片,称:童老师的个展,我也去凑热闹了,感谢童老师的鼓励。娘娘可太谦虚了,自己的手抄字帖都能参加童老师的个展了,这是把爱好培……微软浙大研究者提出剪枝框架OTO,无需微调即可获得轻量级架构机器之心报道作者:HecateHe来自微软、浙江大学等机构的研究者提出了一种oneshotDNN剪枝框架,无需微调即可从大型神经网络中得到轻量级架构,在保持模型高性……中国牛肉市场洗牌,澳洲牛肉大幅减少,俄罗斯成最大赢家众所周知,自从中澳关系陷入僵局后,我国大幅减少对澳洲产品的进口,其中包括葡萄酒、牛肉等。根据中国网报道,在中国牛肉市场迎来大洗牌之际,俄罗斯倒成为了最大赢家。据相关数据显示,在……发现孪生素数猜想的证据,但可能在另外一个宇宙中数学家们为数学中最著名,但未被证明的猜想之一发现了一个新证据,这个猜想被称为孪生素数猜想;但这个证据的路线可能不会帮助证明孪生素数猜想本身。孪生素数猜想是关于素数(只能被自身整……你是否需要购买TPM1。2或2。0芯片安装Windows11近期微软发布Windows11新一代的操作系统,不少小伙伴想要安装,却被硬件检测软件告知不符合安装条件,需要TPM1。2或2。0,那我们到底装还是不装?要不要购买TPM模块?……德文作家萨沙斯坦尼西奇,一个有趣灵魂的告白萨沙斯坦尼西奇每每看到非日耳曼人说德语,我心中总会升起一种莫名的怜惜之情,因为德语实在是一门很难,很难掌握的语言。不知道这些人在初学的时候有着怎样的无奈,割舍,当然也有对……
富豪都热衷于太空旅行?一文带你了解布兰森和他的维珍集团张大中美国批准向日本出售宙斯盾驱逐舰的技术支持及相关设备Sussex21年硕士申请截止通知,斯特灵大学入学及申请政策扬州栖湖云庭金辉颜选3。0美好生活向上而来肝脏好不好看这个地方养护肝脏健康做新加坡最迷人度假小岛订下碳中和目标企业文化理念的重要性和意义重塑经济优势经济大咖来帮我们解读双循环新发展格局丹道与潜意识中医调理脾虚验方三孩政策要来了,引发诸多猜想1000项科学实验正排队上天宫

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找