城市直播房产教育博客汽车
投稿投诉
汽车报价
买车新车
博客专栏
专题精品
教育留学
高考读书
房产家居
彩票视频
直播黑猫
投资微博
城市上海
政务旅游

多模态匹配模型之图像预处理EfficientNet算法

4月4日 六壬会投稿
  多模态匹配
  两个商品的名称各异(如iPhone和苹果),但是它们的图像往往是相同或相似的,为此考虑引入商品的图像信息来进行辅助聚合。以计算商品相似度为例:
  将商品的名称和图像分别通过文本编码器和图像编码器得到对应的向量表示后,再进行拼接作为最终的商品向量,最后使用余弦相似度来衡量商品之间的相似度。文本编码器:使用文本预训练模型BERT作为文本编码器,将输出平均池化后作为文本的向量表示
  图像编码器:使用图像预训练模型EfficientNet作为图像编码器,提取网络最后一层输出作为图像的向量表示EfficientNet模型
  EfficientNet是一种先进的卷积神经网络,由谷歌在2019年的论文efficiententnet:RethinkingModelScalingforconvolutionalneuralNetworks中训练并发布。EfficientNet有8种可选实现(B0到B7),甚至最简单的EfficientNetB0也是非常出色的。通过530万个参数,实现了77。1的最高精度性能。
  EfficientNet作者希望找到一个可以同时兼顾速度与精度的模型放缩方法,而提高模型性能基本从下面三个维度考虑:网络深度、网络宽度、图像分辨率。如ResNet18到ResNet152是通过增加网络深度的方法来提高准确率,通过深度增加来提取更多复杂的特征,提取的信息更为丰富。GoogLeNet的Inception结构则是通过增加宽度来提高准确率。作者认为深度、宽度、分辨率这三个维度是互相影响的,三者需要达到一个平衡,要探索出三者之间最好的组合,最后提出了EfficientNet,它是第一个量化三个维度之间关系的网络。
  网络深度神经网络的层数网络宽度每层的通道数网络分辨率是指网络中特征图的分辨率(如224224)
  EfficientNet模型的调参示意图:
  图a是baseline(基础网络),图b,c,d三个网络分别对该基础网络的宽度、深度、和输入分辨率(resolution)进行了扩展,即单独对某一个维度进行扩展,而最右边的e图,就是EfficientNet的主要思想,综合宽度、深度和分辨率对网络进行扩展,平衡了三个维度,并且需要一个很好的baseline,在这样的基础网络上进行平衡效果会更好。
  重点结论:放大网络宽度、深度或分辨率中任何一个维度都可以提高准确率,但是对于更大的模型准确率的收益减少,如ResNet可以深度增加到1000层,但是准确率和101层基本相同,准确率很快饱和,准确曲线变平稳,增加很少。
  问题:既然三者是有联系的,那么如何平衡三者,让网络达到最优呢?
  在这篇文章中,我们提出了一个新的复合缩放方法,使用一个复合系数来缩放网络宽度,深度和分辨率。如下图,d、w、r表述三个复合系数,并且限制222,其中,,1,这样可以使得计算量每次增加基本相同的量,且不会增加太大。
  EfficientNetB0是用MnasNet的方法搜出来的,利用这个作为baseline来联合调整深度、宽度以及分辨率的效果明显要比ResNet或者MobileNetV2要好,由此可见强化学习搜出来的网络架构上限可能更高。
  发现了对于EfficientNetB0来说最好的值是1。2,1。1,1。15,这样就找到了baseline中三者最好的值,在这个baseline上进行平衡调整,通过调整公式中,,,并在限制222下,通过不同的放大baseline网络,得到了EfficientB1到B7,EfficientB7效果最好,如下图。
  EfficientNetB7在ImageNet上达到了最好的水平,即top1准确率84。4top5准确率97。1,然而却比已有的最好的卷积网络GPipe模型小了8。4倍,并且运算时间快了6。1倍,EfficientNetB0的总层数是237层,而EfficientNetB7的总数是813层。
  该模型的构建方法主要包括以下2个步骤:使用强化学习算法实现的MnasNet模型生成基线模型EfficientNetB0。
  采用复合缩放的方法,在预先设定的内存和计算量大小的限制条件下,对EfficientNetB0模型的深度、宽度(特征图的通道数)、图片大小这三个维度都同时进行缩放,这三个维度的缩放比例由网格搜索得到。最终输出了EfficientNet模型。MnasNet模型
  MnasNet模型是Google团队提出的一种资源约束的终端CNN模型的自动神经结构搜索方法。该方法使用强化学习的思路进行实现
  MnasNet:PlatformAwareNeuralArchitectureSearchforMobile,探讨了一种使用强化学习设计移动端模型的自动化神经架构搜索方法。为了解决移动设备的速度限制,明确地将速度信息纳入搜索算法的主要奖励函数中,以便该搜索能够识别在准确度和速度之间达到良好折中的模型。
  MnasNet其整个流程主要由三部分组成:一个基于RNN的控制器,用于学习模型架构并进行采取;一个训练器,用于构建和训练模型以获得准确度;还有一个推理引擎,可使用TensorFlowLite在真实手机上测量模型速度。我们构想出了一个多目标优化问题,以期同时实现高准确度和高速度,并且采用带有自定义奖励函数的强化学习算法来寻找帕累托最优解(例如,能够达到最高准确度但又不会拉低速度的模型)
  MNasNet的延迟是通过在实际硬件上测出来的真实值,使用的设备是谷歌的Pixel手机,而传统的方法是使用FLOPS作为性能评价标准。EfficientNet使用
  在TensorFlow的官方版本中,最新的代码里也已经合入了EfficientNetB0到EfficientNetB7的模型代码,在tf。keras框架下,可以像使用ResNet模型一样,一行代码就可以完成预训练模型的下载和加载的过程。fromtensorflow。keras。applicationsimportEfficientNetB0imageimread(test。jpg)加载预训练模型modelEfficientNetB0(weightsimagenet)输入处理imagesizemodel。inputshape〔1〕xcentercropandresize(image,imagesizeimagesize)xpreprocessinput(x)xnp。expanddims(x,0)预测及解码ymodel。predict(x)decodepredictions(y)加载EfficientNet(只是网络结构,无预训练参数)fromefficientnetpytorchimportEfficientNetmodelEfficientNet。fromname(efficientnetb0)加载预训练EfficientNetmodelEfficientNet。frompretrained(efficientnetb5)print(model)特征提取Preprocessimagetfmstransforms。Compose(〔transforms。Resize(224),transforms。ToTensor(),transforms。Normalize(〔0。485,0。456,0。406〕,〔0。229,0。224,0。225〕),〕)imgtfms(Image。open(img。jpg))。unsqueeze(0)print(img。shape)torch。Size(〔1,3,224,224〕)提取特征featuresmodel。extractfeatures(img)
  EfficientNet号称是最好的分类网络,对于单纯的端到端分类任务,EfficientNet的系列模型是最优选择。但作为更细粒度的语义分割任务,在骨干网的特征环节,如果显存有限,则EfficientNet系列模型并不是最优选择。主要原因是该系列模型对GPU的显存占有率过高。
投诉 评论 转载

煮米饭,最忌直接加水煮!大厨教你这2招,米饭香软不粘黏,好吃如果你也喜欢美食,点击关注,每天不断更新精彩内容!导语:煮米饭,最忌直接加水煮!大厨教你这2招,米饭香软不粘黏,好吃!相信大家也知道,每年到了当下这个季节的时候,天……莹智梦水光赋活膜保湿美白,全面关爱对女性来说,美白是一场持久战,坚持防晒是非常有效的办法,但做过防晒工作后还是会面临干皮暗沉等问题,这个时候就需要一款适合的面膜达到深层补水、美白亮肤的效果。下面就为大家介绍一款……夏季美搭女团风穿搭示范,小个子女生也能穿出高级感水晶帘动微风起,满架蔷薇一院香。高骈又到了一年的夏季,这是女人的季节,也是考验衣品和身材的美季,夏季美搭,风格多样,款式新奇特,色彩艳丽,你可以通过你的搭配尽情的展……手电还能减压?好玩到停不下来!ACEBEAM骑士RXAA小直说起EDC圈里的解压利器,相信大家的脑海中率先浮现出的定是指尖陀螺、啪啪币推牌等小巧精致的小玩意儿。但如若把解压二字与手电联系在一起,恐怕很多人都会纳闷,手电不是照明工具嘛。怎……坐着火车游北京,省时省力又省钱,寻找春天最美的风景作者:萧汉近几年,随着北京市郊铁路的开通,极大方便了我们的出行,尤其是去往昌平、怀柔、密云一些郊区景点,我们不必局限于自驾,而是可以坐上小火车,感受春天的味道。北京……中国科技创新取得的巨大进步让美国哈佛大学叹服《参考消息》引述美国哈佛大学的一份报告指出,中国在多个尖端技术领域已经取得巨大进步,在诸多科技创新领域居于全球领先地位,中国正逐渐成为全球的科技创新引领者。哈佛大学指出中……老鹰谷游记老鹰谷,山峦重叠,奇峰异石,鸟语花香,风景如画。一蹲活灵活现,栩栩如生,展翅高飞,硕大的老鹰雕塑,屹立在景区的广场。山势巉岩的峡谷内,林木参天,葱郁一片,散发着沁人……防守悍将到来!湖人下赛季有的看了一早醒来湖人和爵士完成了交易湖人用霍顿塔克和斯坦利约翰逊得到爵士的贝弗利60E终于不用再看着塔克的反篮要心肌梗塞了约翰逊是淘宝得到的防守尖兵……盘点那些辣眼睛的电视剧(一)影视作品千千万,总有一些角色让人感觉毁经典、辣眼睛,让人看完之后恨不能从没有看过这些作品,面对曾经的经典角色总有不忍直视的感觉。下面盘点几个我认为辣眼睛的角色。一、亮剑之……虽然低调地离开了广东队,郑智对这支球队的贡献不可磨灭大家好,我是小编帅帅望远镜,今天,我们关注的题目是:虽然低调地离开了广东队,郑智对这支球队的贡献不可磨灭。随着2022赛季中超联赛愈发临近,转会窗也将要正式关闭。广州队也……小米的市值为什么比不过农夫山泉?做水的干不过做手机的,到底什么是核心竞争力?01一道思考题我在对任何一家企业做调研的时候,都会问自己一个问题:这家公司做下去,十年后会是什么样子,到底还有没有价值?……多模态匹配模型之图像预处理EfficientNet算法多模态匹配两个商品的名称各异(如iPhone和苹果),但是它们的图像往往是相同或相似的,为此考虑引入商品的图像信息来进行辅助聚合。以计算商品相似度为例:将商品的名称……
鸟取自由行景点9选游鸟取沙丘品尝新鲜松叶蟹白玫瑰牛奶欧冠综合皇马力克切尔西AC米兰小胜那不勒斯朱单伟订婚细节曝光与大衣哥前往女方家相看,彩礼阔绰令人羡慕联结城市唤醒乡村从一杯咖啡里看舟山乡村文旅引流快评便宜肯定没好货?上海海港队客场扳倒武汉三镇,赢球竟都靠便春夏交替,不要错过南方3道传统美食,口味绝妙,营养丰富!穿性感穿搭大尺度写真曝光网友才17岁怎么就变成这样了?捧杀高瓴,棒杀高瓴吃糖使人心情好?这四种糖家中必备,吃法用法不一样,不要选错容易汗出手脚凉,必须内外同调03年邓肯1人掀翻OK组合,鲨鱼场均2514,科比呢?球迷难超过库里!净效率勇士第一!这就是怀斯曼无缘首发中锋的原因
牛皮影评精选巡回检察组德不配位,剧中最让人反感的角色,她实至名归轰动全国的真实案件改编的扫黑风暴,这剧保熟细雨鱼儿出,微风燕子斜。意思翻译、赏析说话的自由与责任阅读答案CSGO完美平台再次对外G重拳出击!10W悬赏打击作弊,从根店面租赁合同童年的故事科学家发现地球最小爬行动物,最大体长仅29毫米下第次姚公绶春兴杂咏韵九首其浣溪沙送女归,代人作【歌词】美国NBC电视台冠军主题曲歌手:索契冬奥会热议聚热点

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找江西南阳嘉兴昆明铜陵滨州广东西昌常德梅州兰州阳江运城金华广西萍乡大理重庆诸暨泉州安庆南充武汉辽宁