城市直播房产教育博客汽车
投稿投诉
汽车报价
买车新车
博客专栏
专题精品
教育留学
高考读书
房产家居
彩票视频
直播黑猫
投资微博
城市上海
政务旅游

改进卷积神经网络你需要这种设计模式

11月27日 先锋客投稿
  深度学习领域近来已经发展出大量的新架构,而如何选择使用这些新架构提升卷积神经网络的性能就显得越发重要了。机器之心之前报道过提交ICLR2017的论文:解析深度卷积神经网络的14种设计模式也正是关注于此。而本文在描述14种设计模式之余更加注重于阐述构建和训练卷积网络的小技巧。
  自从2011年深度卷积神经网络(CNN)在图像分类任务中优于人类开始,它们就成为了计算机视觉任务中的行业标准,这些任务包括图像分割、目标检测、场景标记、跟踪以及文本检测等等。卷积神经网络
  然而,训练神经网络的技巧并不容易掌握。与之前的机器学习方法一样,细节是最恐怖的地方,然而在卷积神经网络中有更多的细节需要去管理:你所用的数据和硬件的限制是什么?你应该以哪种网络作为开始呢?AlexNet、VGG、GoogLeNet还是ResNet呢?甚至ResNet里面还有ResNet分支选项。你应当建立多少与卷积层相对应的密集层?你使用哪种激活函数?即使你选择了广为流行的ReLU,你也还要选择是不是使用普通的ReLU、VeryLeakyReLU、RReLU、PReLU或通用版本的ELU。
  最难优化的参数之一就是学习率(learningrate),它是调节神经网络训练的最重要的超参数。学习率太小,可能导致你永远不会收敛到一个解决方案,学习率太大,可能导致你刚好跳过了最优解。即便是适应性学习率的方法,也可能在计算上过于昂贵,这取决于你的硬件资源。
  设计的选择和超参数的设定会严重地影响CNN的训练和表现,然而对于刚进入深度学习领域的人而言,建立一种设计架构的直觉所需要的资源是稀缺的,而且是分散的。
  每个人都知道VGG是缓慢而庞大的,但是,倘若你正确地调节它,你仍然可以生成最先进的结果以及高性能的商用应用。
  着重于实际调节的主要书籍是《神经网络:权衡技巧(NeuralNetworks:TricksOfTheTrade)》,作者:OMuller,最初出版于2003年,再版于2012年。关于深度学习的热潮始于2012年《纽约时报》报导的GeoffreyHinton的团队在MerckDrugDiscoveryChallenge上的惊人成功,所以最近几年先进的研究是缺失的。
  幸运的是,美国海军研究室的研究员LeslieSmit等人已经发表了关于卷积神经网络架构改进和技术提升的系统性研究。下面列举一些他所强调的最重要的一些设计模式。
  关于图像分类的卷积神经网络设计模式
  根据Smith的观点,这14种原创设计模式可以帮助没有经验的研究者去尝试将深度学习与各种新应用相结合。尽管高级人工智能研究员可以依靠直觉、经验以及针对性的实验,但这些建议对于剩下的没有机器学习博士学位的人来说是一个很好的起点。
  1)架构要遵循应用
  你也许会被GoogleBrain或者DeepMind这些奇特的实验室所发明的那些耀眼的新模型所吸引,但是其中许多在你的用例或者业务环境中要么是不可能实现,要么是实现起来非常不现实。你应该使用对你的特定应用最有意义的模型,这种模型或许比较简单,但是仍然很强大,例如VGG。
  较新的架构可能在学术性的基准测试上会更加准确,但是你应该选择你自己理解的并且最适合你的应用的架构。
  2)网络路径的激增
  每年的ImageNetChallenge的冠军都会使用比上一届冠军更加深层的网络。从AlexNet到Inception,再到ResNet,Smith注意到了网络中路径数量倍增的趋势,并且ResNet可以是不同长度的网络的指数集合。
  3)争取简单
  然而,更大的并不一定是更好的。在名为Biggerisnotnecessarilybetter的论文中,Springenberg等人演示了如何用更少的单元实现最先进的结果。
  4)增加对称性
  无论是在建筑上,还是在生物上,对称性被认为是质量和工艺的标志。Smith将FractalNet的优雅归功于网络的对称性。
  5)金字塔式的形状
  你也许经常在表征能力和减少冗余或者无用信息之间权衡。卷积神经网络通常会降低激活函数的采样,并会增加从输入层到最终层之间的连接通道。
  6)过度训练
  另一个权衡是训练准确度和泛化能力。用类似dropout或者droppath的方法进行正则化可以提高泛化能力,这是神经网络的重要优势。请在比你的实际用例更加苛刻的问题下训练你的网络,以提高泛化性能。
  7)全面覆盖问题空间
  为了扩展你的训练数据和提升泛化能力,请使用噪声和数据增强,例如随机旋转、裁剪和一些图像操作。
  8)递增的特征构造
  随着网络结构越来越成功,它们进一部简化了每一层的工作。在非常深层的神经网络中,每一层仅仅会递增的修改输入。在ResNets中,每一层的输出和它的输入时很相似的,这意味着将两层加起来就是递增。实践中,请在ResNet中使用较短的跳变长度。
  9)标准化层的输入
  标准化是另一个可以使计算层的工作变得更加容易的方法,在实践中被证明可以提升训练和准确率。批量标准化(batchnormalization)的发明者认为原因在于处理内部的协变量,但是Smith认为,标准化把所有层的输入样本放在了一个平等的基础上(类似于一种单位转换),这允许反向传播可以更有效地训练。卷积神经网络
  10)输入变换
  研究表明,在WideResNets中,性能会随着连接通道的增加而增强,但是你需要权衡训练代价与准确度。AlexNet、VGG、Inception和ResNets都在第一层使用了输入变换以让输入数据能够以多种方式被检查。
  11)可用的资源决指引着层的宽度
  然而,可供选择的输出数量并不是显而易见的,这依赖于你的硬件能力以及期望的准确度。
  12)SummationJoining
  Summation是一种常用的合并分支的方式。在ResNets中,使用总和作为连接的机制可以让每一个分支都能计算残差和整体近似。如果输入跳跃连接一直存在,那么summation会让每一层学到正确地东西(例如与输入的差别)。在任何分支都可以被丢弃的网络(例如FractalNet)中,你应该使用这种方式类保持输出的平滑。
  13)下采样变换
  在池化的时候,利用级联连接(concatenationjoining)来增加输出的数量。当使用大于1的步长时,这会同时处理连接并增加连接通道的数量。
  14)用于竞争的Maxout
  Maxout被用在你只需要选择一个激活函数的局部竞争网络中。使用求和以及平均值会包含所有的激活函数,所以不同之处在于maxout只选择一个胜出者。Maxout的一个明显的用例是每个分支具有不同大小的内核,而Maxout可以包含尺度不变性。
  提示与技巧
  除了这些设计模式之外,还出现了几个最新的技巧和诀窍,以减少架构的复杂性和训练时间,并且可以使用有噪声的标签。
  1)使用调优过的预训练网络
  如果你的视觉数据和ImageNet相似,那么使用预训练网络会帮助你学习得更快,机器学习公司Diffbot的CEOMikeTung解释说。低水平的卷积神经网络通常可以被重复使用,因为它们大多能够检测到像线条以及边缘这些模式。将分类层用你自己的层替换,并且用你特定的数据去训练最后的几个层。
  2)使用freezedroppath
  Droppath会在训练的迭代过程中随机地删除一些分支。Smith测试了一种相反的方法,它被称为freezepath,就是一些路径的权重是固定的、不可训练的,而不是整体删除。因为下一个分支比以前的分支包含更多的层,并且正确的内容更加容易近似得到,所以网络应该会得到更好的准确度。
  3)使用循环的学习率
  关于学习率的实验会消耗大量的时间,并且会让你遇到错误。自适应学习率在计算上可能是非常昂贵的,但是循环学习率不会这样。使用循环学习率(CLR)时,你可以设置一组最大最小边界,在边界范围内改变学习率。Smith甚至还在论文《CyclicalLearningRatesforTrainingNeuralNetworks》中提供了计算学习率的最大值和最小值的方法。
  4)在有噪声的标签中使用bootstrapping
  在现实中,很多数据都是混乱的,标签都是主观性的或者是缺失的,而且预测的对象可能是训练的时候未曾遇到过的。Reed等人在文章《TRAININGDEEPNEURALNETWORKSONNOISYLABELSWITHBOOTSTRAPPING》中描述了一种给网络预测目标注入一致性的方法。直观地讲,这可以奏效,通过使网络利用对环境的已知表示(隐含在参数中)来过滤可能具有不一致的训练标签的输入数据,并在训练时清理该数据。
  5)采用有Maxout的ELU,而不是ReLU
  ELU是ReLU的一个相对平滑的版本,它能加速收敛并提高准确度。与ReLU不同,ELU拥有负值,允许它们以更低的计算复杂度将平均单位激活推向更加接近0的值,如果您使用具有全连接层的Maxout,它们是特别有效的。卷积神经网络
投诉 评论

哺乳背心实用吗随着人们生活水平的提高,人们开始关注自身的健康问题,哺乳期女性主要注重的是乳房健康,因此哺乳文胸背心首当其冲成为新妈妈们竞相选购的孕婴产品之一了。但是哺乳背心实用吗?下面本站就……愤怒!拿中国女孩尸体赚大钱你真的够了01hr最近,豆瓣电影有一篇帖子在全网发酵,引起了众多网友的关注和讨论:《吃人血馒头,侮辱尸体,牺牲复活者导演郭景泽及制片方侵犯逝者权益!!!》据发帖的网友反映,韩……姐姐专访丨胡静姐姐2让我体验了前半生从来没有体验过的苦钱江晚报小时新闻记者何晓婷近年来,演员胡静在荧幕上的作品鲜少产出,但《人民名义》里风情万种的高小琴,《橙红年代》里蛇蝎美人丽莎,也都成了经典。当观众以为胡静已经把事业心留……我和张果的故事二(二)几天后,我又在休息室碰到了那个女孩儿。当时,我正要去休息室,她从里面出来了。女孩儿看到我,优雅地扬起了自己的手臂,说道:嗨!我一怔,心说:她在跟谁打招呼呢?看……健康之行始于足下中医告诉你足疗魅力足疗的好处有哪些防治风湿性关节炎能加强血液循环,通络活血,祛寒消炎,对风湿性关节炎有较好的理疗效果。防治腿脚麻木通过中药泡脚,可以激活腿神经末稍,使神经……新民晚报张恒被处罚,经纪业当自清赵红玲昨天,税务部门处罚一名艺人经纪人张恒。作为郑爽参演《倩女幽魂》的经纪人,他因帮助郑爽掩盖天价片酬,规避行业主管部门监管,逃避履行纳税义务,被依法处以3227万元罚款……改进卷积神经网络你需要这种设计模式深度学习领域近来已经发展出大量的新架构,而如何选择使用这些新架构提升卷积神经网络的性能就显得越发重要了。机器之心之前报道过提交ICLR2017的论文:解析深度卷积神经网络的14……baby陪闺蜜出海,照片一角却意外曝光蔡徐坤身影!被发现后秒正所谓一波未平一波又起,Angelababy和宋雨琦之间的关系才刚刚有所缓和,没想到却因为一张照片,导致她再次陷入了舆论之中!事情的起因还要从一张照片说起,baby的闺蜜……酸烧伤急救办法酸烧伤后,除皮肤灼伤外,呼吸道吸入这些酸类的挥发气、雾点(如硫酸雾、铬酸雾),还引起上呼吸道的剧烈刺激,严重者可发生化学性支气管炎、肺炎、肺水肿等。下面就一起随本站小编来了解一……星落凝成糖开机,李兰迪不符合仙侠审美,田曦薇同事出演男三9月29号仙侠剧《星落凝成糖》和现代剧《打火机与公主裙开机》举行开机发布会,这两电视剧关注度很高,都是由高人气的年轻演员领衔主演。仙侠剧《星落凝成糖》在开机之前经历了一场……医院能打鼠疫疫苗吗鼠疫俗名黑死病(死于鼠疫的人一般都有皮下出血,全身呈青黑色),是一种严重威胁人类生命的急性传染病,是中国法定的甲类传染病,又称一号病,所以很多人都会提前打疫苗预防,那么医院能打……世界四大村落消失之谜其中两个发生在中国世界上的未解之谜不少,今天,我们就来说一说世界历史中四个村落离奇失踪的故事,其中两个还是在中国发生的,一起来看看吧。在加拿大北极圈内的安吉魁尼湖边的一个小村庄里,生活着1……
什么是大姨妈每个月大姨妈是怎么来的最好的心境是静心和沉稳用找对象的思维来做招聘熊猫眼不全因睡眠不足或是妇科病在作祟这些道理不懂你注定就是穷打工的命朗朗妻子吉娜网上频频晒照,算不算浪费公共资源?女性月经期间能吃水果吗晒晒我们班的牛人贱笑那过去最伤感的繁体字网名从扶贫到环保,这档宝藏综艺一回归观众老爷举双脚点赞宋佳蒋欣是女演员林心如大S只能叫女艺人对待角色大不同小升初考试结束后,提前学习物理和化学成流行,超前教育隐患大中医大家治胃肠失眠的奇方!胃肠通,阴阳就。。。王青县懿颂同年去秋惠余沧酒一番茄蜂蜜面膜的做法跟功效家长注意,别再坑娃娃的名字要避开这三类字,真的不是迷信快乐的童年杭州旅游推荐新学期必须和孩子谈的个问题食物冷冻储存会长虫吗分享给幼师的年终工作总结妈妈将孩子高考准考证当废品卖了网友支招补办高考准考证民间借贷合同在深山田野中寻宝,她为水稻育种提供宝藏基因

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找