从PyTorch到Mxnet,对比这些Python深度学习框架。选择什么深度学习框架一直是开发者非常关心的一个话题,而且深度学习框架之间的战争也越来越激烈。过去一段时间,机器之心发过多篇机器学习框架的对比文章,但随着Python逐渐成为机器学习社区最受欢迎的语言,支持Python的深度学习框架的性能也值得关注。IndicoDataSolutions的CTOMadisonMay根据他们公司在产品和开发过程中的经验对Python深度学习框架进行了对比,希望这篇文章能对机器之心的读者有所帮助。 Python深度学习生态系统在这几年中的演变实属惊艳。pylearn2,已经不再被积极地开发或者维护,大量的深度学习库开始接替它的位置。这些库每一个都各有千秋。我们已经在indico的产品或者开发中使用了以下列表中的大部分的技术,但是对于剩下一些我们没有使用的,我将会借鉴他人的经验来帮助给出Python深度学习生态系统的清晰的、详尽的理解。 确切地说,我们将会关注: Theano Lasagne Blocks TensorFlow Keras MXNet PyTorch 下面是对这7大Python深度学习框架的描述以及优缺点的介绍。 Theano 描述:Theano是一个Python库,允许你定义、优化并且有效地评估涉及到多维数组的数学表达式。它与GPUs一起工作并且在符号微分方面表现优秀。 概述:Theano是数值计算的主力,它支持了许多我们列表当中的其他的深度学习框架。Theano由FrdricBastien创建,这是蒙特利尔大学机器学习研究所(MILA)背后的一个非常优秀的研究团队。它的API水平较低,并且为了写出效率高的Theano,你需要对隐藏在其他框架幕后的算法相当的熟悉。如果你有着丰富的学术机器学习知识,正在寻找你的模型的精细的控制方法,或者想要实现一个新奇的或者不同寻常的模型,Theano是你的首选库。总而言之,为了灵活性,Theano牺牲了易用性。 优点: 灵活 正确使用时的高性能 缺点: 较高的学习难度 低水平的API 编译复杂的符号图可能很慢 Lasagne 描述:在Theano上建立和训练神经网络的轻量级库 概述:因为Theano致力于成为符号数学中最先且最好的库,Lasagne提供了在Theano顶部的抽象,这使得它更适合于深度学习。它主要由当前DeepMind研究科学家SanderDieleman编写并维护。Lasagne并非是根据符号变量之间的函数关系来指定网络模型,而是允许用户在层级思考,为用户提供了例如Conv2DLayer和DropoutLayer的构建块。Lasagne在牺牲了很少的灵活性的同时,提供了丰富的公共组件来帮助图层定义、图层初始化、模型正则化、模型监控和模型训练。 优点: 仍旧非常灵活 比Theano更高级的抽象 文档和代码中包含了各种PastaPuns 缺点: 社区小 Blocks 描述:用于构建和训练神经网络的Theano框架 概述:与Lasagne类似,Blocks是在Theano顶部添加一个抽象层使深度学习模型比编写原始的Theano更清晰、更简单、定义更加标准化。它是由蒙特利尔大学机器学习研究所(MILA)编写,其中一些人为搭建Theano和第一个神经网络定义的高级接口(已经淘汰的PyLearn2)贡献了自己的一份力量。比起Lasagne,Blocks灵活一点,代价是入门台阶较高,想要高效的使用它有不小的难度。除此之外,Blocks对递归神经网络架构(recurrentneuralnetworkarchitectures)有很好的支持,所以如果你有兴趣探索这种类型的模型,它值得一看。除了TensorFlow,对于许多我们已经部署在indico产品中的API,Blocks是其首选库。 优点: 仍旧非常灵活 比Theano更高级的抽象 易于测试 缺点: 较高的学习难度 更小的社区 TensorFlow 描述:用于数值计算的使用数据流图的开源软件库 概述:TensorFlow是较低级别的符号库(比如Theano)和较高级别的网络规范库(比如Blocks和Lasagne)的混合。即使它是Python深度学习库集合的最新成员,在GoogleBrain团队支持下,它可能已经是最大的活跃社区了。它支持在多GPUs上运行深度学习模型,为高效的数据流水线提供使用程序,并具有用于模型的检查,可视化和序列化的内置模块。最近,TensorFlow团队决定支持Keras(我们列表中下一个深度学习库)。虽然TensorFlow有着自己的缺点,但是社区似乎同意这一决定,社区的庞大规模和项目背后巨大的动力意味着学习TensorFlow是一次安全的赌注。因此,TensorFlow是我们今天在indico选择的深度学习库。 优点: 由软件巨头Google支持 非常大的社区 低级和高级接口网络训练 比基于Theano配置更快的模型编译 完全地多GPU支持 缺点: 虽然Tensorflow正在追赶,但是最初在许多基准上比基于Theano的慢。 RNN支持仍不如Theano Keras 描述:Python的深度学习库。支持Convnets、递归神经网络等。在Theano或者TensorFlow上运行。 概述:Keras也许是水平最高,对用户最友好的库了。由FrancisChollet(GoogleBrain团队中的另一个成员)编写和维护。它允许用户选择其所构建的模型是在Theano上或是在TensorFlow上的符号图上执行。Keras的用户界面受启发于Torch,所以如果你以前有过使用Lua语言的机器学习经验,Keras绝对值得一看。由于部分非常优秀的文档和其相对易用性,Keras的社区非常大并且非常活跃。最近,TensorFlow团队宣布计划与Keras一起支持内置,所以很快Keras将是TensorFlow项目的一个分组。 优点: 可供选择的Theano或者TensorFlow后端 直观、高级别的端口 更易学习 缺点: 不太灵活,比其他选择更规范 MXNet 描述:MXNet是一个旨在提高效率和灵活性的深度学习框架。 概述:MXNet是亚马逊(Amazon)选择的深度学习库,并且也许是最优秀的库。它拥有类似于Theano和TensorFlow的数据流图,为多GPU配置提供了良好的配置,有着类似于Lasagne和Blocks更高级别的模型构建块,并且可以在你可以想象的任何硬件上运行(包括手机)。对Python的支持只是其冰山一角MXNet同样提供了对R、Julia、C、Scala、Matlab,和Javascript的接口。如果你正在寻找最佳的性能,选择MXNet吧,但是你必须愿意处理与之相对的一些MXNet的怪癖。 优点: 速度的标杆 非常灵活 缺点: 最小的社区 比Theano更困难的学习难度 PyTorch 描述:Python中的张量(Tensors)和动态神经网络,有着强大的GPU加速。 概述:刚刚放出一段时间,PyTorch就已经是我们Python深度学习框架列表中的一个新的成员了。它是从Lua的Torch库到Python的松散端口,由于它由Facebook的人工智能研究团队(ArtificialIntelligenceResearchteam(FAIR))支持且因为它用于处理动态计算图(Theano,TensorFlow或者其他衍生品没有的特性,编译者注:现在TensorFlow好像支持动态计算图),它变得非常的有名。PyTorch在Python深度学习生态系统将扮演怎样的角色还不得而知,但所有的迹象都表明,PyTorch是我们列表中其他框架的一个非常棒的选择。 优点: 来自Facebook组织的支持 完全地对动态图的支持 高级和低级API的混合 缺点: 比其他选择,PyTorch还不太成熟 结语 感谢您的观看,如有不足之处,欢迎批评指正。 对大数据感兴趣的同学关注我的头条号,并在后台私信发送关键字:大数据即可获取免费的大数据学习资料。 知识体系已整理好(源码,笔记,PPT,学习视频),欢迎大家来领取!还有面试题可以免费获取。