矩阵乘法无需相乘，速度提升100倍MIT大佬的新研究引发热议

汽车报价
买车新车
博客专栏
专题精品
教育留学
高考读书
房产家居
彩票视频
直播黑猫
投资微博
城市上海
政务旅游

矩阵乘法无需相乘，速度提升100倍MIT大佬的新研究引发热议

12月12日终不悔投稿

　　机器之心报道
　　机器之心编辑部
　　在一篇被ICML2021接收的论文中，MIT的一位计算机科学博士生及其业界大佬导师为矩阵乘法引入了一种基于学习的算法，该算法具有一个有趣的特性需要的乘加运算为零。在来自不同领域的数百个矩阵的实验中，这种学习算法的运行速度是精确矩阵乘积的100倍，是当前近似方法的10倍。
　　矩阵乘法是机器学习中最基础和计算密集型的操作之一。因此，研究社区在高效逼近矩阵乘法方面已经做了大量工作，比如实现高速矩阵乘法库、设计自定义硬件加速特定矩阵的乘法运算、计算分布式矩阵乘法以及在各种假设下设计高效逼近矩阵乘法（AMM）等。
　　在MIT计算机科学博士生DavisBlalock及其导师JohnGuttag教授发表的论文《MultiplyingMatricesWithoutMultiplying》中，他们为逼近矩阵乘法任务引入了一种基于学习的算法，结果显示该算法显著优于现有方法。在来自不同领域的数百个矩阵的实验中，这种学习算法的运行速度是精确矩阵乘积的100倍，是当前近似方法的10倍。这篇论文入选了机器学习顶会ICML2021。
　　此外，在一个矩阵提前已知的常见情况下，研究者提出的方法还具有一个有趣的特性需要的乘加运算（multiplyadds）为零。
　　这些结果表明，相较于最近重点进行了大量研究与硬件投入的稀疏化、因式分解和或标量量化矩阵乘积而言，研究者所提方法中的核心操作哈希、求平均值和byteshuffling结合可能是更有前途的机器学习构建块。
　　论文链接：https：arxiv。orgabs2106。10860代码链接：https：github。comdblalockbolt
　　对于研究者提出的无需相乘的矩阵乘法，各路网友给出了极高的评价。有网友表示：这是一篇不可思议且具有基础性意义的论文。训练ML来寻找快速做ML的方法。
　　也有网友表示：这篇论文为实现更高效的AI打开了一扇门。
　　对于有网友提到的该研究在硬件实现方面似乎很有发展前景，一作本人现身reddit并给出了回复：我们的编码表示是密集矩阵，所以布局和访问模式看上去基本与GEMM内核相同，也就意味着可以很容易地使用脉动阵列或修正张量核心来实现。在x86上，一般只需要一个vpshufbadd指令和一个4bit解包指令就可以了。
　　下面来看这篇论文的技术细节和实验结果。
　　技术细节
　　具体来说，该研究专注于AMM任务，并假设矩阵是高的（tall），并且相对密集，存在于单个机器内存中。在这种设置下，研究者遇到的主要挑战是在给定保真度水平下最小化近似线性运算所需的计算时间。这种设置会很自然地出现在机器学习和数据挖掘中，当一个数据矩阵A的行是样本，而一个线性算子B希望应用这些样本，B可以是一个线性分类器、线性回归器，或嵌入矩阵，以及其他可能性。
　　举例来说，考虑一个近似softmax分类器的任务，以预测来自神经网络嵌入的图像标签。在这里，A的行是每个图像的嵌入，B的列是每个类的权值向量。分类是通过计算乘积AB并在结果的每一行中取argmax来执行的。图1结果表明，在CIFAR10和CIFAR100数据集上，使用该研究的方法及其最佳性能竞争对手的方法近似AB的结果。
　　该研究所用方法与传统方法背离，传统的AMM方法构造矩阵VA，VBR（Dd），dD，如下所示：
　　通常，VA、VB是稀疏的，包含某种采样方案，或者具有其他结构，使得这些投影操作比密集矩阵乘法更快。简而言之，这些方法使用线性函数对A和B进行预处理，并将问题简化为低维空间中的精确矩阵乘法。
　　该研究提出MADDNESS方法，该方法采用非线性预处理函数，将问题简化为查表。此外，在B提前已知的情况下，即将训练好的线性模型应用于新数据等情况时，MADDNESS不需要任何乘加运算。该方法与用于相似性搜索的矢量量化方法密切相关。然而，该研究没有使用太多的乘加量化函数，而是引入了一系列不需要乘加的量化函数。
　　本文的贡献总计如下：一个高效的学习矢量量化函数族，可以在单个CPU线程中每秒编码超过100GB的数据。一种用于低位宽整数（lowbitwidthintegers）的高速求和算法，可避免upcasting、饱和和溢出。基于这些函数的近似矩阵乘法算法。数百个不同矩阵的实验表明，该算法明显优于现有替代方案。并且还具有理论质量保证。
　　实验结果
　　为了评估MADDNESS的有效性，研究者用c和Python实现了该算法和其他几个现有算法。评估结果如下。
　　MADDNESS到底有多快？
　　研究者首先分析了MADDNESS的原始速度。在图3中，他们为各种矢量量化方法计算g（A）函数的时间，结果表明，MADDNESS比现有方法快两个数量级，其吞吐量随行的长度而增加。
　　从上图可以看出，Bolt（蓝色虚线）是与MADDNESS最接近的竞争对手。研究者还使用与Bolt相同的基线分析了聚合函数f（，）的速度。如图4所示，他们基于average的、matrixaware的聚合方法明显快于Bolt基于upcasting的方法。
　　Softmax分类器
　　前面说过，研究者在广泛使用的CIFAR10和CIFAR100数据集上近似线性分类器。如图5所示，MADDNESS显著优于所有现有方法，几乎达到了与精确乘法相同的准确率，但比精确乘法快了一个数量级。而且，MADDNESS是在硬件支持较差的情况下实现了这种性能。
　　基于kernel的分类
　　为了评估该方法在更大、多样性更强的数据集上的表现，研究者在来自UCRTimeSeriesArchive的数据集上训练了kernel分类器。结果如下图6所示，MADDNESS在给定准确率的情况下明显快于替代方案。
　　图像滤波
　　为了测试MADDNESS的极限，研究者对将小滤波器应用于图像的各种技术能力进行了基准测试。结果如下图7所示，只有MADDNESS比精确矩阵乘积更有优势。
　　作者简介
　　DavisBlalock
　　个人主页：https：dblalock。github。ioabout
　　DavisBlalock是麻省理工学院的博士生，由JohnGuttag教授指导。他的主要研究方向是设计高性能的机器学习算法，以减少人们在机器学习速度、准确性、隐私和安全性之间的妥协。他于2014年获得弗吉尼亚大学学士学位，2016年获得麻省理工学院硕士学位。他是QualcommInnovationFellow、NSFGraduateResearchFellow和BarryM。GoldwaterScholar。
　　JohnGuttag
　　JohnGuttag是麻省理工学院计算机科学与电气工程教授、ACMFellow。他领导着麻省理工学院计算机科学和人工智能实验室（CSAIL）的临床与应用机器组。该小组负责开发和应用先进的机器学习和计算机视觉技术，以解决各种临床相关问题，目前的研究项目包括预测和减少不良医疗事件，帮助患者匹配治疗方法和治疗者，以及医学成像。
　　他是《Python编程导论》一书的作者，其在MIT的课程已全部公开，在B站上也可以搜到。
　　参考链接：https：www。reddit。comrMachineLearningcommentspffoo8rmultiplyingmatriceswithoutmultiplying

投诉评论转载

中国首家农业产业资产管理服务平台在京成立中联兴农（北京）科技股份有限公司在京成立2020年6月6日，中国首家农业产业资产管理服务平台中联兴农（北京）科技股份有限公司（以下简称中联兴农）成立仪式发布会在京举行。……长跑后可以吃巧克力吗在跑步运动中，喉咙可能因吸入空气中的灰尘、颗粒等异物而受到刺激，从而产生瘙痒、疼痛的症状。如果是雾霾天气仍坚持跑步，这时嗓子很容易受到灰尘等外来物刺激，很容易产生瘙痒、疼痛等症……坐火车可以带白酒吗春节很多在外地的旅客回家时总想带点外地的土特产回家，也有的旅客想带点家里的特产去探亲。那么坐火车可以带白酒吗？下面和本站了解下车站安全知识吧。一、其实坐火车是可以带酒的，……学校政治工作总结多篇导读：学校政治工作总结多篇为好范文网的会员投稿推荐，但愿对你的学习工作带来帮助。政治课每周仅两节，时间紧、任务重，因此有限的45分钟里抓基础、提能力、在课堂上要合理组织好……厨房蟑螂怎样除？相信有很多朋友一定都感到很困扰，蟑螂的生命力墙，繁殖速度快，到底该如何消灭它们呢？今天小编就来教大家三种方法灭蟑螂，一起来看看吧！方法1：大蒜灭蟑螂大蒜有着一股特殊……声临其境为声音存在声临之前我们曾谈过声音可以从主观的角度分成两种，一种是乐音，另一种是噪音。人的身体本能的接受乐音而抗拒噪声，也就决定了我们面对噪音要治理，对乐音则是欣赏更多。《声临……晶体结构的分割思想均摊法切割法比例法晶胞是物质结构中的一大难点，学生们往往很难进行空间想象。有些学生问我，学习晶体的知识有什么技巧。我告诉他一个字画。不管有没有绘画基础，将晶胞或者是其他结构特征画出来，便能更细致……矩阵乘法无需相乘，速度提升100倍MIT大佬的新研究引发热议机器之心报道机器之心编辑部在一篇被ICML2021接收的论文中，MIT的一位计算机科学博士生及其业界大佬导师为矩阵乘法引入了一种基于学习的算法，该算法具有一个有趣的……关于长五遥一之前YF故障分析来源微博海权社该博主创作于长五遥三复飞那天。Q：遥一之前YF77一共试车多久啊A：一共试车时间是38000s，这个试车时间仅仅比J2和RS25短，远远长于欧美……618值得剁手的时尚单品OPPO手环活力版，拯救你的睡眠与身一年一度的618年中购物节正火热进行中，想必第一波买买买的剁手党们，已经在享受拆快递的喜悦了。但需要说明的是，很多商家的优惠政策依然有效，就以OPPO手环活力版来说，它原价19……前沿低轨卫星网络路由技术研究分析文吴署光、王宏艳、王宇、钱克昌、李海滨、万颖（航天工程大学等）摘要：低轨卫星由于其轨道高度较低，在与地面节点进行通信时，存在双程时延低、星地链路损耗小、数据传输速率……洛伦兹变换的数学错误洛伦兹变换是狭义相对论中两个作相对匀速运动的惯性参考系（S和S）之间的坐标变换，是观测者在不同惯性参照系之间对物理量进行测量时所进行的转换关系，在数学上表现为一套方程组。由荷兰……

<<<<<<－>>>>>>

华硕2020新品发布会来啦！新品外设哪款是你的菜？招教你放松大脑职场健康西红柿裂果畸形，影响产量，老农用4个措施，让人刮目相看一个时期造句用一个时期造句大全为什么带戴尔XPS159500回家，性能实力属实吸引人空腹跑步不利于健康吗什么是地震海啸官宣外星人存在？新研究有2000颗外星球或看到人类让孩子有耐心的方法燃气灶电池安装在哪里高通855Plus4500mAh电池4800万四摄，iQOO 为什么电子产品中会有许多像海绵和布的材料？有什么作用？

海底两万里练习题（练习题精选及答案！）贵阳哪里风景比较好，适合旅游？《姜子牙》的三个彩蛋是什么意思？官宣了三个新人物我国已有养老服务机构和设施近22万个初三学生寒假学习计划指导曹雪芹把自己的生活体验融入了《红楼梦》？越吻越想要的接吻招式厌学孩子怎么心理疏导小孩厌学心理怎么疏导老年人吸氧机吸氧度数多少合适西游记读书笔记300字（通用18篇）物质奖励交换学习成绩能行吗？后果严重，家长应该知道的真相雪掩不住浓浓相思意散文欣赏

友情链接：中准网聚热点快百科快传网快生活快软网快好知文好找江西南阳嘉兴昆明铜陵滨州广东西昌常德梅州兰州阳江运城金华广西萍乡大理重庆诸暨泉州安庆南充武汉辽宁