城市直播房产教育博客汽车
投稿投诉
汽车报价
买车新车
博客专栏
专题精品
教育留学
高考读书
房产家居
彩票视频
直播黑猫
投资微博
城市上海
政务旅游

干起了实时翻译我们离跨越语言的鸿沟还有多远

4月8日 碎骨族投稿
  AI已经运用到了实时翻译的领域中,那么我们是否离无障碍的语言沟通越来越近了?
  1954年,美国成功研制出了世界首个机器翻译系统,实现了俄英两种语言之间的简单转化。但由于人类语言本身的复杂性和多样性,半个多世纪以来,计算机系统对于人类语言的理解一直处于相对较低的阶段,投入实际应用的研究成果寥寥无几。
  直到近10年,以深度学习为代表的人工智能技术在语音识别、自然语言处理等基础应用领域与产业结合的业务中取得了较大突破,能够识别语音的机器翻译逐渐从实验室走向普罗大众。
  在AI机器翻译这条赛道上,互联网巨头都在虎视眈眈
  自去年乌镇互联网大会上,百度、搜狗相继亮相人工智能同声传译技术之后,又一次引发机器翻译是否会取代同声传译的激烈争论。
  尽管专业人工翻译公司依然看衰AI对翻译产业的颠覆性,但包括Google、Facebook、微软、百度、腾讯、搜狗在内的各大技术巨头却在不遗余力地推进深度学习在机器翻译领域的研发和应用。
  2016年9月,Google发布谷歌神经机器翻译(GNMT:GoogleNeuralMachineTranslation)系统,声称该系统利用神经网络技术,模仿人脑的神经思考模式,产出媲美人工翻译的高质量译文,并将误差降低了5585。谷歌公司己经将该技术应用于网页翻译与手机应用,译文质量明显提升。
  腾讯、百度、阿里巴巴等国内互联网公司将深度学习理念应用到机器翻译,在智能翻译领域持续发力,推出多款基于神经网络技术的在线翻译和手机应用。甚至在手机浏览器的升级战争中,智能翻译也被当作重要功能革新,搜狗手机浏览器推出智能翻译,集合了语音对话翻译、AR实时翻译、拍照翻译等常用功能。
  智能翻译架起了不同语种间人们便利沟通的桥梁,已经成为日常交流、出国旅游、外文学习等方面不可或缺的助手。笔者就简要梳理一下AI实现文字和口语翻译的基本原理、结合实例介绍智能口语翻译难点以及智能翻译有哪些需要解决的问题。
  各种花哨的技术概念,核心仍然是AI处理人类语言的三种方法
  实现让计算机处理人类自然语言是人工智能领域的一个重要课题,与句法分析、语义理解和自然语言生成等计算语言学核心理论密切相关。目前,AI主要有三种方法翻译人类自然语言。
  1、基于规则的机器翻译方法。早期机器翻译的主流方法。基于规则的机器翻译系统依靠人工编纂的双语词典和专家总结的各种形式的翻译转化规则,但在通用领域中的应用性不强,往往被限制在了专有应用上,逐渐被新的方法取代。
  2、基于实例的机器翻译方法。从已有的翻译经验知识出发,将源语言句子切分为翻译知识中见过的短语片段,通过对已有翻译资源进行自动总结,得出双语对照的实例库,并设计规则处理双语对照实例库中的歧义性等问题,实现对新的源语言句子进行翻译。
  3、基于统计的翻译方法。统计机器翻译方法将任何目标语言句子都看成源语言句子的可能翻译候选,从语料自动学习翻译模型,然后基于此翻译模型,对输入源语言句子寻找一个评价分数最高的目标语言句子作为翻译结果。目前谷歌、搜狗等基本采用的是这种。
  深度学习能够自动学习抽象特征表示、建立源语言与目标语言之间复杂的映射关系,给统计机器翻译的实现提供新途径,目前已经在词对齐、语言模型训练、解码等模块的优化应用方面取得较多成果。
  例如,2006年谷歌发布基于短语的机器学习(PBMT)系统,该系统将句子分解成词和短句,进行逐个翻译。它的弱点在于忽略了上下文,因此译文质量不佳。2016年谷歌发布的神经机器翻译GNMT,将句子视为基本单元,不再对词和短句逐个翻译,明显改善了译文质量。
  作为智能翻译的制高点,AI口语翻译难在哪?
  与普通文字翻译相比,AI口语翻译难度更大,原因有二:
  一、想要译的准,首先要能听得清。
  AI要准确判断出指令发出者的语音、停顿,并在极短时间内进行语音断句,在涉及一些模糊音时能够根据上下文进行及时调整,这需要有深度学习的模型自动更换为一个语义通顺、更符合作者指令的句子,然后才能进行文字翻译处理。
  二、想要译的准,还要包容口语的4个任性
  基于神经网络技术的智能翻译系统越来越多,翻译质量确有较大提高,但是能不能很好地包容口语的各种任性,我们来做几项测试,检验一下人工智能翻译的水平。为便于说明,选取了具有代表性的谷歌翻译和搜狗手机浏览器自带的智能翻译进行比对。
  1、日常口语具有不连贯的特性。在口语交谈中,经常会出现一些不连贯的成分,如:重复、次序颠倒、冗余和语句残缺。下文是一个典型的兼有语句残缺和发音重复的句子。
  原文:那六楼呢?咱们咱们,下午谈一谈吧?
  谷歌翻译:Thesixthfloor?Let’stalkaboutusintheafternoon?
  搜狗手机浏览器智能翻译:Whataboutthesixthfloor?Let’sLet’stalkthisafternoon。
  谷歌翻译在重复的处理上未真实体现原文,搜狗手机浏览器智能翻译如实还原。但是,两个翻译结果在表达上都不同程度地存在错误。
  2、语法约束相对较弱。口语中很少会有严格符合语法约束的结构完整、正确的句子,而大量存在的是语法规则难以处理的现象。一方面是由于系统的语法知识对语言现象的覆盖程度不足;而更主要的则是口语本身的特性所决定的,例如口语中存在大量的代词,人类口语比较容易理解,但是AI不能结合上下文,缺乏背景知识,难以区分指代对象,导致翻译结果偏离原意。
  原文:Look,man,youdon’tgottodoanything。Thisonemeansalottome。
  谷歌翻译:看,男人,你什么都不做。这对我来说意义重大。
  搜狗手机浏览器智能翻译:听着,伙计,你什么都不用做,这对我意义重大。
  翻译的关键在于两个词:look和man。谷歌的翻译也对,而看起来,搜狗手机浏览器的翻译结果更符合生活实际。
  3、没有明确的句子边界。口语中没有标点符号来标志句子,也基本没有传统意义上的句子,缺少了必要的声调和停顿,很容易造成句子的歧义。
  例如:这苹果不大好吃。那么该句有两种不同的理解结果:这苹果不大好吃(苹果不大,但是味道好),这苹果不大好吃(苹果味道不好)。两家AI都未能分清句子结构发音上的差别,都默认翻译为苹果味道不好。
  4、非正式语体材料多。中英口语中都存在较多随意性的口语或网络用语,生活化气息浓厚,多为非正式的语体材料,智能翻译需要庞大的基础词汇库支撑。
  原文:近期我们注意到国际上有一种看法,认为中国已经成为世界上最大的经济体,一方面挑战了美国的领导地位,另一方面在很多国际事务上中国仍在搭便车。请问您怎么看待这样的看法?(总理记者会上中国日报记者的现场提问)
  谷歌翻译:WehaverecentlynoticedthatthereisaviewthatChinahasbecometheworld’slargesteconomy,ontheonehandchallengestheleadershipoftheUnitedStates,ontheotherhandinmanyinternationalaffairs,Chinaisstillfree。Whatdoyouthinkofthisview?
  搜狗手机浏览器智能翻译:RecentlywehavenoticedaninternationalviewthatChinahasbecometheworld’slargesteconomy。Ontheonehand,itchallengestheleadershipoftheUnitedStates。Ontheotherhand,theChinesearehitchhikinginmanyinternationalaffairs。Iwouldliketoaskwhatyouthinkofthisview。
  专家译文:RecentlywehavenoticedthatthereisaviewintheinternationalcommunitythatChinahasbecometheworld’slargesteconomy,ontheonehandchallengestheleadershipoftheUnitedStates,ontheotherhandinmanyinternationalaffairsinChinaisstillafreeride,howdoyouthinkofthisview?
  可以说,两家AI对这段话的翻译,虽然都有些许瑕疵,但是总体都还是比较到位的,搜狗手机浏览器对于搭便车这个典型口语化词汇翻译相对更准确。
  中国古诗英译一直是文化翻译的一个难题,甚至被认为是可译性最小的文学形式。我们来试验一下两家AI对王维《九月九日忆山东兄弟》的理解和翻译能力。
  独在异乡为异客,每逢佳节倍思亲。遥知兄弟登高处,遍插茱萸少一人。
  谷歌翻译:Aloneinaforeignlandforthestranger,everyfestivetimes。
  Distinguishedbrotherascendedthethrone,whowasfullofcornelia。
  搜狗手机浏览器智能翻译:Aloneinaforeignland,Imissmyrelativesmorethananythingelseduringtheholidays。Iknowmybrotherhasclimbeduptothetopandplanteddogwoodeverywhere,butonepersonismissing。
  参考译文:Alone,alonelystrangerinaforeignland,Idoublypineformykinsfolkonholiday。Iknowmybrotherswould,withdogwoodsprayinhand,Climbingupthemountainandmissmesofaraway。
  翻译古诗词,确实非常难为两家AI。不过,翻译的结果很有趣,搜狗手机浏览器对前两句翻译尚可,后两句翻译成了我的兄弟在高处到处种植茱萸,谷歌对最后两句完全是进行了想象性的拓展。
  要跨越语言不通的鸿沟,智能翻译还需往哪加油
  智能翻译确实取得了令人惊喜的进展,拿着手机和老外进行日常交流已经基本没有问题。但是智能翻译还存在短板,会有词不达意的时候,AI要想更进一步发展,和有着数十年积淀的高水平翻译员进行竞争,可能还需要从以下几个方面进行努力。
  1、大量补充口语化语料
  智能翻译对于口语化文本处理能力还不强,一是由于翻译语料库口语化语料不足,二是针对口语词汇与口语表达多采取直译方式,因此出现较多误译。该问题的解决应该从扩大对应部分语料库入手,增加口语类文本语料库,包括常见口语化词汇、表达与生活用语。
  2、提高语境理解能力
  智能翻译对于中文复杂含义句式中的时态辨别能力还不够,往往需要充分理解整句话的意思才能准确把握时态。智能翻译并非基于理解,而是基于统计学与语料库,只能做到将这句话意思大致翻译准确,在识别感情色彩方面,还有欠缺。
  将神经网络学习的抽象表示和传统符号语义方法结合,建立新的基于语义的机器翻译系统,或许可以大幅提高AI对组合语义、复杂的递归语言结构的处理能力。
  但,我们依然满怀期待AI让我们摆脱语言鸿沟的那一天。
投诉 评论

猫狗斗系之五黄狗聪明误黄狗在与黑猫的争斗中着实吃了亏,心里不服气,过了一个月又开始想道道了。它收集了死鼠的残缺肢体骨架藏起来,只要黑猫出去,就拿出一块放锅台上,或者在碗柜里。主人清理出去它再捡回来,……怎么去掉皱纹七种方法全面去除脸部皱纹每个女性都不希望自己脸部有皱纹,因而会采取很多的措施积极的去保养脸部,那么对于怎么去掉皱纹,你真的理解吗?事实上,去皱纹的最好方式就是根据不同的皱纹种类采取不同的方法,下面小编……偷懒与取巧的不等式懒字由竖心旁加赖字构成,因此,要追索懒字的由来,先要知晓赖字的本义。赖字原本不赖,而是赢利不菲的意思。从字源上说,束象形为囊袋,负象形为驮着贝壳,而贝壳曾为早期货币,驮着满袋贝……呈报造句用呈报造句大全【呈报chngbo】:1。呈文上报;上报。1、不必惊讶的原因是自愿呈报系统,当医疗差错频发时,自愿呈报系统会通过许多漏洞降低差错率。2、注释:每一滥用药物者可被呈报……建筑工人意外伤害保险适合那些人购买建筑工人意外伤害保险对于很多从事相关工作的朋友来说是和你重要的,那么具体建筑工人意外伤害保险适合那些人购买呢?专注于研究相关职业保险小知识的本站来大家介绍一下,我们不妨一起来了……和郭麒麟暧昧聊天的女网红,被人扒出空降只要8888滴滴滴,伴随着杀猪姐孙一宁的全盘胜利,网络上的一些女网红,越来越不安分了,总想着和男星撩点暧昧的信息,爆一爆料、名利双收。这不,前几天就有一个名字叫做安珀wang的美丽女……挽回感情的短信对一段感情依依不舍,那么怎么样挽回?这里有挽回老公感情的短信和挽回女友最感人的留言,助你顺利留住感情。一、挽回感情的短信句子:1、其实我一直都在,只差你一个回头。……周深新歌江湖缘起,戏腔令人惊艳,说说我的看法吧周深的出歌速度,一直没得说,不过我最想和大家聊的还是这首才出的歌曲:《江湖缘起》。由于周深是VOCAL向歌手,所以大部分时候,没法定做歌曲演唱的OST、商业歌曲大都是柔情……梦想城上星将播,阵容奢华,杨烁成泰燊王自健周放领衔《梦想城》上星将播,阵容奢华,杨烁、成泰燊、王自健、周放领衔近段时间,北京卫视2022年的大剧片单公布,不少备受关注的好剧都在其中,《输赢》《繁花》以及《幸福到万家》等重……疯了!小鲜肉杀害无辜母女,却因太帅获全美求情别毁掉他的青春前不久布兰妮被监护权折磨的事情得到了网友的声援。但这不是这个月最热烈的网民上诉事件。最近一个叫CameronHerrin的年轻人反复出现在各大社交媒体上。伴随着一大帮网友……不倒翁小姐姐被指不配传递全运会火炬?网友怒斥或许,你还记得不倒翁小姐姐皮卡晨吧去年,大唐不夜城景区,一夜爆火成为了大众女神,在微博抖音持续刷屏的小姐姐。眼神专注而妩媚,姿态优雅又撩人,一下子就让人有种梦回大唐……干起了实时翻译我们离跨越语言的鸿沟还有多远AI已经运用到了实时翻译的领域中,那么我们是否离无障碍的语言沟通越来越近了?1954年,美国成功研制出了世界首个机器翻译系统,实现了俄英两种语言之间的简单转化。但由于人类……
五月入夏这种水果最适合吃即使女明星不怕冷,但李沁穿上雪球裙要冻坏,扯裙摆像取暖如何检测防电脑辐射眼镜章若楠任敏争光线一姐?熊磊再发小作文律师费20万是口误,舅舅偷偷录音,是在挑拨离间收视口碑双扑街,7亿投资打水漂!章子怡这个评委,还坐得稳吗?地方税务党支部专题组织生活会情况报告张大奕和董花花还在较劲?小三的下场总裁夫人没当上,公司退市朋友生命中永恒的美好一堆造句用一堆造句大全是金子总会发光繁忙上班族如何做个尽责的爸爸宴桃源(书赵伯充家上姬领巾)美丽的小竹林中了HiFi的毒,这套旗舰音响真是百听不腻!动感单车适合多大年龄动感单车适合人群更年期女性吃豆腐有什么好处爷爷的园子生肉千万不要在水龙头下冲洗汽车网站策划书范文“健”识早知道写出我心读后感字AI近年有什么技术成就表彰学生会干部通知

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找