城市直播房产教育博客汽车
快传网
汽车报价
买车新车
博客专栏
专题精品
教育留学
高考读书
房产家居
彩票视频
直播黑猫
投资微博
城市上海
政务旅游

参数少量提升,性能指数爆发!谷歌大语言模型暗藏神秘技能

8月20日 观潮阁投稿
  编辑:Cris【新智元导读】谷歌的这项研究,很可能是我们迈向AGI的一大步。
  由于可以做一些没训练过的事情,大型语言模型似乎具有某种魔力,也因此成为了媒体和研究员炒作和关注的焦点。
  当扩展大型语言模型时,偶尔会出现一些较小模型没有的新能力,这种类似于创造力的属性被称作突现能力,代表我们向通用人工智能迈进了一大步。
  如今,来自谷歌、斯坦福、Deepmind和北卡罗来纳大学的研究人员,正在探索大型语言模型中的突现能力。
  解码器提示的DALLE神奇的突现能力
  自然语言处理(NLP)已经被基于大量文本数据训练的语言模型彻底改变。扩大语言模型的规模通常会提高一系列下游NLP任务的性能和样本效率。
  在许多情况下,我们可以通过推断较小模型的性能趋势预测大型语言模型的性能。例如,规模对语言模型困惑的影响已被验证跨越超过七个数量级。
  然而,某些其他任务的性能却并没有以可预测的方式提高。
  例如,GPT3的论文表明,语言模型执行多位数加法的能力对于从100M到13B参数的模型具有平坦的缩放曲线,近似随机,但会在一个节点造成性能的飞升。
  鉴于语言模型在NLP研究中的应用越来越多,因此更好地理解这些可能意外出现的能力非常重要。
  在近期发表在机器学习研究(TMLR)上的论文大型语言模型的突现能力中,研究人员展示了数十个扩展语言模型所产生的突现能力的例子。
  这种突现能力的存在提出了一个问题,即额外的缩放是否能进一步扩大语言模型的能力范围。
  某些提示和微调方法只会在更大的模型中产生改进突现提示任务
  首先,我们讨论在提示任务中可能出现的突现能力。
  在此类任务中,预先训练的语言模型会被提示执行下一个单词预测的任务,并通过完成响应来执行任务。
  如果没有任何进一步的微调,语言模型通常可以执行训练期间没有看到的任务。
  当任务在特定规模阈值下不可预测地从随机性能飙升至高于随机性能时,我们将其称为突现任务。
  下面我们展示了三个具有突现表现的提示任务示例:多步算术、参加大学水平的考试和识别单词的预期含义。
  在每种情况下,语言模型的表现都很差,对模型大小的依赖性很小,直到达到某个阈值它们的性能骤升。
  对于足够规模的模型,这些任务的性能只会变得非随机例如,算术和多任务NLU任务的训练每秒浮点运算次数(FLOP)超过10的22次方,上下文任务中单词的训练FLOP超过10的24次方。突现提示策略
  第二类突现能力包括增强语言模型能力的提示策略。
  提示策略是用于提示的广泛范式,可应用于一系列不同的任务。当它们对小型模型失败并且只能由足够大的模型使用时,它们被认为是可突现的。
  思维链提示是突现提示策略的一个典型示例,提示模型在给出最终答案之前生成一系列中间步骤。
  思维链提示使语言模型能够执行需要复杂推理的任务,例如多步数学单词问题。
  值得一提的是,模型无需经过明确培训即可获得思维链推理的能力,下图则显示了一个思维链提示的示例。
  思维链提示的实证结果如下所示。
  对于较小的模型,应用思维链提示并不会优于标准提示,例如当应用于GSM8K时,这是一个具有挑战性的数学文字问题基准。
  然而对于大型模型,思维链提示在GSM8K上达到了57的解决率,在我们的测试中性能显著提升。研究突现能力的意义
  那么研究突现能力,又究竟有什么意义呢?
  识别大型语言模型中的突现能力,是理解此类现象及其对未来模型能力的潜在影响的第一步。
  例如,由于突现小样本提示能力和策略没有在预训练中明确编码,研究人员可能不知道当前语言模型的小样本提示能力的全部范围。
  此外,进一步扩展是否会潜在地赋予更大的模型突现能力,这个问题同样十分重要。为什么会出现突现能力?当某些能力出现时,语言模型的新现实世界应用会被解锁吗?由于计算资源昂贵,能否在不增加扩展性的情况下通过其他方法解锁突现能力(例如更好的模型架构或训练技术)?
  研究人员表示,这些问题尚且不得而知。
  不过随着NLP领域的不断发展,分析和理解语言模型的行为,包括由缩放产生的突现能力,是十分重要的。
  参考资料:
  https:ai。googleblog。com202211characterizingemergentphenomenain。html
  https:thedecoder。comgoogleexploresemergentabilitiesinlargeaimodels
  https:thedecoder。comdeeperinsightsforailanguagemodelschainofthoughtpromptingasakeyfactor
投诉 评论 转载

京圈名媛朱珠的坎坷情史一生爱过四个男人,最终嫁给普通人文白面书誏编辑白面书誏摇曳生姿的步伐,自信明媚的笑容,还有极富女人味的穿搭。。。有这样的女秘书在律所,你选择几点下班?电视剧《精英律师》中的栗娜,标准的……摘抄本月亮与六便士摄影JJoooe他正满怀热情地试图摆脱禁锢他的力量获取自由。那股力量是什么,自由又是什么,却依然晦涩难懂。我们每个人在世上都是孤身一人。每个人都被封闭在一座铁塔里,我们痛……环游海南岛2022年5月7日再游海南岛5月7日(周六)海口,谦哥家,5月8日(周日)海花岛,东方市,5月9日(周一)海东方,东方市,5月10日(周二)三亚大树酒店……参数少量提升,性能指数爆发!谷歌大语言模型暗藏神秘技能编辑:Cris【新智元导读】谷歌的这项研究,很可能是我们迈向AGI的一大步。由于可以做一些没训练过的事情,大型语言模型似乎具有某种魔力,也因此成为了媒体和研究员炒作和关注……还是说一声再见吧我的2022年终总结2022年最后一天,清早起床拉开窗帘的瞬间照例看到了太阳。早餐吃鸡蛋面条,里面加两根火腿肠,再撒上一大把切得细碎的葱花。一碗五彩的汤面摆上餐桌,让人味……三个不起眼的冬季配饰,精致又百搭,让你的造型更加出彩冬日生活打卡季冬季穿搭想要不出错很简单,但想要出彩却很困难,因为大部分冬季服饰都是黑白灰三种色调,不管怎么搭配都索然无味,想要色彩多变一些又怕自己掌握不好分寸。解决这个问……3800万,下场狂胜19分!放下豪言,却沦为勇士卧底,库里拯在早些时候结束的一场NBA季后赛中,勇士主场以10788战胜了凯尔特人,抛开上半场对裁判判罚的争议,这场比赛勇士下半场展现出了他们的豪门底蕴,勇士在第三节轰出了3514的超级攻……又一种海洋生物被发现美丽的如同精灵这个具有透明外衣和发光内脏的神奇生物最近在探索檀香山东南部太平洋偏远岛屿时被发现。当时它正在大约7221英尺(2201米)深的金曼礁和巴尔米拉环礁的一座未开发的海底山脉上优雅的……学会元歌这几个英雄技巧,让你轻松上手元歌元歌的血量在众多脆皮英雄中也能排在倒数,傀儡脆,可以靠着手法快速收回来打控制,自身脆有大招和闪现,却也过分依赖这两个技能。身板脆这里我们可以利用突进比较强的爆发高的来找到……Qt无边框窗体模拟模态窗体抖动效果一、概述用Qt开发windows客户端界面确实是一大利器,兼顾性能的同时,速度相对来说也不错。再加上qss的辅助,那么一个漂亮的界面就不在话下了。想要做出漂亮的界面……2022年买了一台两年前的老款华为P40Pro,真是让我欢喜想买一部3000左右的华为手机,可是看来看去,都没有合适的,确实Mate50系列和P50系列都太贵了,基本都要5000往上,Nova系列又有点看不上,最终在朋友推荐下入了一部P……三星S22U跳水7k以下,真香程度与同价位iPhone14和虽然现在三星手机在国内市场没什么优势,但只要是涉及到高端旗舰机,大部分用户还是会把它纳入其中的,像三星S系列一直是安卓阵营的高端旗舰机的代表,也是苹果iPhone最有力的竞争对……
全球超算最新排名发布,美国重回第一,日本跌到第二,中国怎么样双喜临门!顶级大外援宣布重返辽篮,考辛斯接近联手郭艾伦使用激光技术测量分子离子与电子碰撞的旋转冷却水上活动注意事项正式告别!广东宏远老臣离开国家队,或加盟辽宁男篮,出任教练菜鸟赛季场均2055有多难?史上仅5人能完成,4人成超巨1人神秘女子五人八日泰国自由行之无名艳遇4042岁的转折打破日企垄断?中国芯再传捷报,倪光南院士说得很对人生感悟我是一个空瓶子科技新突破!美国造出迄今跳跃最高的机器人,将被用于行星探测LG发布全新32SQ780S智能显示器配备Ergo支架,内置
童年的朋友单位消防安全责任书趟过雨中的忧伤散文4队4签约完成,美媒建议湖人凯尔特人2换1交易方案出炉哪个星座最合适当妻子或老公?生辰八字算感情婚姻的方法纪梵希哪款面膜好用使用感很好的面膜推荐天山雪莲有什么之称天山雪莲在什么地方生长的白术祛斑的危害是什么白术如何祛斑天天酷跑皇家狮鹫和冰魄狼王对比分析小龙虾养殖改底的方式何晟铭解锁新身份,出任启牛学堂品牌体验官

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找江西南阳嘉兴昆明铜陵滨州广东西昌常德梅州兰州阳江运城金华广西萍乡大理重庆诸暨泉州安庆南充武汉辽宁