城市直播房产教育博客汽车
投稿投诉
汽车报价
买车新车
博客专栏
专题精品
教育留学
高考读书
房产家居
彩票视频
直播黑猫
投资微博
城市上海
政务旅游

CVPR一次中66篇,大装置一天训练完GPT3,商汤准备迎战

12月12日 飞虹塔投稿
  机器之心原创
  作者:张倩
  商汤的既要又要还要
  6月19日,CVPR2021在线上拉开帷幕。作为计算机视觉三大顶会之一,本届CVPR大会一共接收了7039篇有效投稿,最终有1366篇被接收为poster,295篇被接收为oral,接收率大概为23。6。
  在前段时间公布的最佳论文候选名单中,我们发现,华人一作论文占据了半壁江山(1632)。当然,这一现象并非偶然。其实,早在九年前,华人学者就已经凭借其创新精神在国际CV顶会上大放异彩,比如香港中文大学的汤晓鸥团队:2012年CVPR大会仅有的两篇深度学习文章均出自其实验室。20112013年间,该实验室又在ICCV和CVPR上发表了14篇深度学习论文,占据全世界在这两个会议上深度学习论文总数(29篇)的近一半。
  2014年,汤晓鸥等人创办了商汤科技,这种创新精神也被刻入商汤的基因并延续至今。
  在今年的CVPR大会上,商汤共有66篇论文被接收,远高于业界平均水平。此外,在同期举办的挑战赛中,商汤南洋理工联合实验室(SLab)团队一举斩获CVPR2021NTIRE视频理解挑战赛三项冠军,包括视频超分辨率、重度压缩视频质量增强(固定量化参数,保真度)和重度压缩视频质量增强(固定比特率,保真度)赛道。商汤研究院团队则摘得CVPR2021ActivityNet时序动作检测任务弱监督学习赛道冠军。
  AI领域发展到今天,如何保持创新活力、加快产业落地是所有企业面临的共同问题。在这一点上,商汤的态度是明确的既要又要还要,即既要保持技术创新的领先,又要加快产业落地,同时还要建设面向整个生态、整个社区的AI基础设施,推动AI进入工业化发展阶段。
  从今年的CVPR和商汤最近的一些动向中,我们可以看出这家公司为实现上述愿景所做的努力。在这篇文章中,我们就来聊聊这一话题。
  技术创新不能落下
  对于商汤今年在CVPR中取得的成绩,该公司联合创始人、香港中文大学商汤科技联合实验室主任林达华评价说,对商汤来说,AI的研究和创新是刻在基因里的。从公司建立的第一天开始,甚至在建立之前,我们的创始团队就一直把AI的基础研究作为持续追求的理想。所以,尽管商汤的整个发展经历了很多阶段,我们也把AI落地到了越来越多的产业中去,但我们始终没有忘记,整个AI产业发展的最初原动力来自于技术的突破和创新。
  商汤的这种理念在历年AI顶会中得到了很好的体现,今年的CVPR也不例外。从研究方向来看,该公司今年入选的论文分布在多个领域,包括长尾目标检测、轨迹预测、3D点云补全、3D场景重建、激光雷达3D目标检测等,其中的3D点云补全、3D场景重建等相关论文还被收录为Oral论文。
  3D点云是3D场景和目标的一种直观表示。然而,由于遮挡等问题的存在,扫描得到的3D点云通常是不完整的。因此,利用不完整的点云预测目标的完整3D形状成为一个重要问题。但是,现有的点云补全方法倾向于生成全局形状骨架,缺乏局部细节。而且,它们大多会学习一个确定性的部分到整体的映射,忽视人造物体中的结构关系。
  商汤的研究者认为,点云补全应从残缺点云中学习关系性结构属性来恢复可信且高质量的完整点云形状。为了实现这一点,他们在论文中提出了一个两阶段的网络:首先对残缺点云做概率重建以恢复一个粗略的完整点云,再结合残缺点云做关系性结构增强达到高质量的补全。实验显示,该方法显著提高了生成的完整点云质量。这份研究可以结合很多单目深度感知传感器(如激光雷达或深度相机)完成对未知形状部分的恢复和预估。预估出的完整形状可以有效辅助很多下游任务,如3D形状分类、姿态检测、避障和交互。
  论文链接:https:arxiv。orgpdf2104。10154。pdf
  3D场景重建是3D计算机视觉的一个核心任务。例如在增强现实(AR)应用中,为了在AR效果和周围的物理环境之间形成自然、沉浸式的互动,3D重建需要非常精确、连贯,还要保持实时性。虽然使用SOTA视觉惯性SLAM系统可以精确跟踪摄像机运动,但由于重建质量低、计算要求高,基于图像的实时密集重建仍然是一个具有挑战性的问题。
  在一篇CVPR最佳论文候选论文中,商汤的研究者提出了一种新的基于神经网络的单目实时场景3D重建系统NeuralRecon。不同于以往基于深度图估计与融合的方法,NeuralRecon直接基于图像特征预测用TSDF表示的局部3D表面,并创新地提出了一个联合TSDF重建与融合的框架。实验结果表明,该方法在准确率和速度方面都优于SOTA方法。
  论文链接:https:arxiv。orgpdf2104。00681。pdf
  NeuralRecon的预训练模型在办公区域场景实时重建的结果
  在被CVPR接收的众多论文中,我们发现,很多研究其实都是由应用场景驱动的,比如3D点云补全可能用于自动驾驶、机器人,3D场景重建可以用于增强现实(AR)等。这也解释了商汤能够长期保持创新活力的重要原因。
  林达华在采访中表示,商汤拥有一个业务跟学术连接的环境,是产生新的学术问题的肥沃土壤,这些问题带给商汤很多激动人心的研究机会,牵引着我们的技术创新。
  产业落地步伐加快
  积累了那么多技术,终究是要拿出来用的。在前段时间举办的上海国际汽车工业展览会上,商汤将多年积累的AI技术打包,一股脑地呈现在了多款智能汽车上。
  这个打成的包就是SenseAuto智能汽车解决方案,包括SenseAutoPilot智能驾驶和SenseAutoCabin智能车舱。
  在SenseAutoPilot智能驾驶方案中,最引人关注的SenseAutoPilotP驾驶领航方案可实现高速公路场景下的车道跟随、超车自动变道、导航自动变道、自动上下匝道、匝道通行等多种L2级高级辅助驾驶功能;已装在多个量产车型中的SenseAutoPilotV前视视觉感知方案可以提供200m前向有效探测,支持自动紧急制动、车道保持辅助、双预警功能,还能有效应对近距离行人非机动车横穿等复杂场景。此外,车道分离汇合点、路面标识、交通灯形状、施工区域锥形筒等长尾场景元素的感知也在这套系统的能力范围之内。
  整套系统背后涉及的技术包括激光雷达高精3D感知、点云噪声识别、轨迹预测、长尾目标检测等,这些都出现在了今年的CVPR接收论文中。商汤表示,该系统能够在最大程度上发挥摄像头、毫米波雷达、激光雷达等传感器的感知优势,显著提升3D目标的检测和跟踪性能,提供智能的道路动态目标轨迹预测,支撑系统安全可靠地拓展至城市工况场景。
  SenseAutoPilotP驾驶领航方案可以精准识别道路分离、合并点,帮助车辆在匝道内进行合理决策,实现自动上下匝道的L2级高级辅助驾驶功能
  SenseAutoCabin智能车舱解决方案同样令人眼前一亮,涵盖SenseAutoCabinD驾驶员感知系统、SenseAutoCabinO座舱感知系统、SenseAutoCabinK智能进入、SenseAutoCabinV座舱域视觉控制器等模块。这些功能可以为驾驶员提供无接触的车舱交互,减少点触操作频率;对疲劳、分心以及接打手机等危险行为进行提醒;还能自动感知是否有儿童被独自遗留在车内等。这背后离不开成熟的目标检测、跟踪、识别等视觉算法。
  目前,商汤在智能车舱领域已经和全球超过30家头部企业展开合作,定点量产项目数超过30个,覆盖车辆总数超过1300万辆。
  搭载了商汤SenseAutoCabin智能车舱解决方案的WEY全新旗舰车型摩卡首次亮相上海车展。
  从智能驾驶到智能车舱,可以看到商汤落地的步伐正在加快。这不仅得益于其与生俱来的创新能力,也离不开丰富的算力资源和算法、数据等方面的积累。这些成果共同构成了商汤正在建设的AI基础设施SenseCore商汤AI大装置。林达华透露,这个AI大装置不仅帮助商汤缩短了创新验证的周期,还将成为未来十年重要的AI基础设施,逐渐提供开放服务,演变成一个面向整个生态、整个社区的具有公共性质的设施。
  AI大装置蓄势待发
  在上海临港新片区,一座宛如芯片的建筑群将在今年年底投入使用。这是商汤正在建设的人工智能计算中心(ArtificialIntelligenceDataCenter,AIDC),全部建成后AI计算峰值速度将达到3740Petaflops(1petaflop等于每秒1千万亿次浮点运算),可以在一天之内把人类石器时代到现在所有时间录成的视频计算完成,也能在一天之内完整训练OpenAI的千亿参数模型GPT3。
  但是,AIDC仅仅是商汤AI大装置的一部分,而远非全部。从结构上看,整个大装置共分为三层:一是算力层。该层以AIDC为基础,兼容AI芯片和AI传感器的强大能力。二是平台层。这一层融合了商汤的数据平台、高性能计算引擎、深度学习训练框架(SenseParrots)以及模型生产平台等,打造了创新的人工智能通用算法开发平台,实现从数据存储、标注到模型训练、生产、部署、测试的全链路、批量化过程。三是算法层。这一层包含各种算法工具箱,不仅有城市交通、园区等高频应用场景算法,还有火灾、垃圾检测等长尾低频的算法。截止目前,商汤已经推出13000多个技术模型,以及17000多个商业模型。同时他们也推出了OpenMMLab开源算法体系,该体系已在Github上获得3万多颗星。
  建设这么一个AI大装置需要投入大量的精力(AIDC总投资高达56亿元),但在商汤看来,这是面向未来必须迈出的一步。
  在经历了几年的产业化之后,AI已经到了一个全新的阶段,可以说一些简单的问题已经基本上被解决了。下一步就是要深入到更广泛的行业里面,需要新一轮的突破和创新。林达华说道。
  GPT3等超大模型的出现让商汤看到了实现下一个突破的希望:以前我们都是针对一些具体的问题或者高度定制化的场景去生产一些中小模型。但随着AI落地推演到越来越广的领域,成千上万的具体问题(长尾问题)开始涌现。如果每个问题都有很多的研究人员投入进去,那么我们就很难深化AI的进一步落地。这个时候,整个行业需要通用性更强的模型,用一个模型支撑更多的任务。一方面,这种模型能够让AI的研发、落地效率得到一个质的提升;另一方面,它们能够更好地去回应综合场景的问题,比如智慧城市、智慧医疗等。这些任务都需要通过多个任务综合解决。
  但是,模型的通用性越强,需要的数据、算力往往也越多,这便是商汤建设AI大装置的底层逻辑。
  当然,AI大装置也不是一朝一夕就建成的。其实早在2018年4月,商汤就已经开始布局人工智能计算原型机研制项目,虽然当时并不被看好。但好在,后续出现的一些大模型已经显示出了解决长尾问题的巨大潜力。
  如今,这个AI大装置已经开始发挥它的作用。林达华透露说,我们几乎所有的研究工作都是在这个大装置的基础上进行的。它为做算法研究的同学提供了充足的算力,使他们能够快速地进行实验试错。此外,大装置中所积累的实用工具也缩短了创新的验证周期。
  借助大装置,商汤已经在超大模型技术研究方面取得一定成绩。例如在计算机视觉的卷积神经网络(CNN)领域,通常模型参数都在1亿以下,但商汤的AI框架SenseParrots能支持50亿参数超大视觉模型的训练。AIDC完全投入使用后,计划支持的超大视觉模型训练参数可达更高的数量级。
  由于可以显著降低AI落地的门槛,商汤的AI大装置对于推动整个人工智能行业的发展也有着重要的战略意义。林达华表示,从整个社会的角度来说,AI基础设施将逐渐从一个企业内部的平台,发展为逐渐提供开放服务,并最终演变成一个面向整个生态、整个社区的具有公共性质的设施。这些设施的构建能够有效地支撑整个生态,最终使得整个AI人才的基础变得更加宽广,从而进一步推动AI产业的深化。
投诉 评论 转载

支付宝红包怎么用(支付宝红包怎么使用?)支付宝红包怎么用(支付宝红包怎么使用?)支付宝作为国内最大的第三方支付平台,拥有的客户群相当庞大,而且支付宝经常会做活动,所以经常有红包可以领。那么,支付宝红包怎么使用呢……文言虚词(文言文虚词个用法归纳)文言虚词(文言文虚词个用法归纳)在文言文之中分为实词和虚词,实词是具有很直接的意思,相对比较固定,但是虚词往往在不同的语境之中,有着不同的意思,所以难度非常大。初中……刺猬的拼音(孩子拼音学不好)刺猬的拼音(孩子拼音学不好)昨晚有位家长问我:孩子读一年级,课本的音节读完就忘记了。返校后,发了第二单元的试卷,考了42分,比第一单元少了50分。……小饰品店装修(饰品店如何设计装修)小饰品店装修(饰品店如何设计装修)饰品在人们生活中随处可见,不仅是家居装饰品,还是穿衣装饰。爱美之心人皆有之,从古至今,在追求美的路上,饰品占据了很重要的位置。时代在发展……房屋常识房产证未办理的如何卖房其中要注意什么很多朋友们现在对于房产方面的知识了解的偏少,不管是从购房的角度,或者是装修房子的角度,我们都需要对房产方面的一些知识进行了解,所以小编今天就在网上搜集了一些房产方面相关的知识来……四轮定位多少钱(四轮定位价格一降再降)四轮定位多少钱(四轮定位价格一降再降)四轮定位是汽车轮胎检测经常要做的项目,许多汽服门店已经配有四轮定位服务。但是,近年来许多门店的四轮定位价格从几百降到了几十,这让很多……隋唐好汉排名(隋唐十八条好汉排行榜)隋唐好汉排名(隋唐十八条好汉排行榜)第一条:西府赵王李元霸。兵器一对擂鼓瓮金锤是当年汉朝时马超的先祖浮波将军马芫使的。共重800斤。历史上就只有这两个人使得动。锤震……CVPR一次中66篇,大装置一天训练完GPT3,商汤准备迎战机器之心原创作者:张倩商汤的既要又要还要6月19日,CVPR2021在线上拉开帷幕。作为计算机视觉三大顶会之一,本届CVPR大会一共接收了7039篇有效投稿,……生活知识科普后槽牙怎么用牙线棒在我们的生活当中有很多的常识性的知识大多数人都是不知道的,就好比最近就有很多小伙伴咨询小编问小编关于后槽牙怎么用牙线棒的这些知识点,这就说明了现在人们也开开渐渐关注起了后槽牙怎……我国这项技术为什么这么成熟?快进来看看新一代智能AI的重要性将人工智能AI传到各大中小城市才是未来35年中国人工智能发展的主题与核心。中国经济发展已经进入了新的阶段,而这个新的含义可以理解为从追求高速增长变成……比特币基金控股触及四个月低点一位观察者表示:ETF和基金持有的BTC是网络需求的重要和可衡量的样本。在美联储出人意料的鹰派倾向之后,比特币基金一直在流血。数据由ByteTree资产管理公司显示,上周……53。7亿!杭州西站枢纽中心出让!杭州第一高楼来了正式出让杭州西站南北广场综合体,7栋摩天塔楼,最高399米,未来杭州城市新地标,正式出让。其中站城综合体北地块,有最高楼的YH18F04地块由融创西站枢纽以2503……
永州史话萌渚岭剿匪记重要提醒!乘坐高铁出行请注意!乾隆在路旁吃瓜夸赞西瓜甜,走出百米后突然下令处死瓜农2位主播在潮汕蹭饭失败,批评当地人冷漠,如何看待这种行为?DNF韩服史诗改版,B套七宗罪全面增强,能否成为全职业首选?为什么沈阳本地大学生75以上毕业去了国企?有哪些你觉得在母乳喂养前应该知道的,却没有告诉你的事?每日GIF动图有这样队友还翻脸这样的男人不值得交啊街头穿和服被抓应平衡主观情绪与规范执法的天平阿富汗塔利班最高领导人呼吁海外阿富汗商人回国投资郑庄公掘地见母这名与学生关系不当的教授,没做好自己的生涯规划!

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找