AI已经运用到了实时翻译的领域中,那么我们是否离无障碍的语言沟通越来越近了? 1954年,美国成功研制出了世界首个机器翻译系统,实现了俄英两种语言之间的简单转化。但由于人类语言本身的复杂性和多样性,半个多世纪以来,计算机系统对于人类语言的理解一直处于相对较低的阶段,投入实际应用的研究成果寥寥无几。 直到近10年,以深度学习为代表的人工智能技术在语音识别、自然语言处理等基础应用领域与产业结合的业务中取得了较大突破,能够识别语音的机器翻译逐渐从实验室走向普罗大众。 在AI机器翻译这条赛道上,互联网巨头都在虎视眈眈 自去年乌镇互联网大会上,百度、搜狗相继亮相人工智能同声传译技术之后,又一次引发机器翻译是否会取代同声传译的激烈争论。 尽管专业人工翻译公司依然看衰AI对翻译产业的颠覆性,但包括Google、Facebook、微软、百度、腾讯、搜狗在内的各大技术巨头却在不遗余力地推进深度学习在机器翻译领域的研发和应用。 2016年9月,Google发布谷歌神经机器翻译(GNMT:GoogleNeuralMachineTranslation)系统,声称该系统利用神经网络技术,模仿人脑的神经思考模式,产出媲美人工翻译的高质量译文,并将误差降低了5585。谷歌公司己经将该技术应用于网页翻译与手机应用,译文质量明显提升。 腾讯、百度、阿里巴巴等国内互联网公司将深度学习理念应用到机器翻译,在智能翻译领域持续发力,推出多款基于神经网络技术的在线翻译和手机应用。甚至在手机浏览器的升级战争中,智能翻译也被当作重要功能革新,搜狗手机浏览器推出智能翻译,集合了语音对话翻译、AR实时翻译、拍照翻译等常用功能。 智能翻译架起了不同语种间人们便利沟通的桥梁,已经成为日常交流、出国旅游、外文学习等方面不可或缺的助手。笔者就简要梳理一下AI实现文字和口语翻译的基本原理、结合实例介绍智能口语翻译难点以及智能翻译有哪些需要解决的问题。 各种花哨的技术概念,核心仍然是AI处理人类语言的三种方法 实现让计算机处理人类自然语言是人工智能领域的一个重要课题,与句法分析、语义理解和自然语言生成等计算语言学核心理论密切相关。目前,AI主要有三种方法翻译人类自然语言。 1、基于规则的机器翻译方法。早期机器翻译的主流方法。基于规则的机器翻译系统依靠人工编纂的双语词典和专家总结的各种形式的翻译转化规则,但在通用领域中的应用性不强,往往被限制在了专有应用上,逐渐被新的方法取代。 2、基于实例的机器翻译方法。从已有的翻译经验知识出发,将源语言句子切分为翻译知识中见过的短语片段,通过对已有翻译资源进行自动总结,得出双语对照的实例库,并设计规则处理双语对照实例库中的歧义性等问题,实现对新的源语言句子进行翻译。 3、基于统计的翻译方法。统计机器翻译方法将任何目标语言句子都看成源语言句子的可能翻译候选,从语料自动学习翻译模型,然后基于此翻译模型,对输入源语言句子寻找一个评价分数最高的目标语言句子作为翻译结果。目前谷歌、搜狗等基本采用的是这种。 深度学习能够自动学习抽象特征表示、建立源语言与目标语言之间复杂的映射关系,给统计机器翻译的实现提供新途径,目前已经在词对齐、语言模型训练、解码等模块的优化应用方面取得较多成果。 例如,2006年谷歌发布基于短语的机器学习(PBMT)系统,该系统将句子分解成词和短句,进行逐个翻译。它的弱点在于忽略了上下文,因此译文质量不佳。2016年谷歌发布的神经机器翻译GNMT,将句子视为基本单元,不再对词和短句逐个翻译,明显改善了译文质量。 作为智能翻译的制高点,AI口语翻译难在哪? 与普通文字翻译相比,AI口语翻译难度更大,原因有二: 一、想要译的准,首先要能听得清。 AI要准确判断出指令发出者的语音、停顿,并在极短时间内进行语音断句,在涉及一些模糊音时能够根据上下文进行及时调整,这需要有深度学习的模型自动更换为一个语义通顺、更符合作者指令的句子,然后才能进行文字翻译处理。 二、想要译的准,还要包容口语的4个任性 基于神经网络技术的智能翻译系统越来越多,翻译质量确有较大提高,但是能不能很好地包容口语的各种任性,我们来做几项测试,检验一下人工智能翻译的水平。为便于说明,选取了具有代表性的谷歌翻译和搜狗手机浏览器自带的智能翻译进行比对。 1、日常口语具有不连贯的特性。在口语交谈中,经常会出现一些不连贯的成分,如:重复、次序颠倒、冗余和语句残缺。下文是一个典型的兼有语句残缺和发音重复的句子。 原文:那六楼呢?咱们咱们,下午谈一谈吧? 谷歌翻译:Thesixthfloor?Let’stalkaboutusintheafternoon? 搜狗手机浏览器智能翻译:Whataboutthesixthfloor?Let’sLet’stalkthisafternoon。 谷歌翻译在重复的处理上未真实体现原文,搜狗手机浏览器智能翻译如实还原。但是,两个翻译结果在表达上都不同程度地存在错误。 2、语法约束相对较弱。口语中很少会有严格符合语法约束的结构完整、正确的句子,而大量存在的是语法规则难以处理的现象。一方面是由于系统的语法知识对语言现象的覆盖程度不足;而更主要的则是口语本身的特性所决定的,例如口语中存在大量的代词,人类口语比较容易理解,但是AI不能结合上下文,缺乏背景知识,难以区分指代对象,导致翻译结果偏离原意。 原文:Look,man,youdon’tgottodoanything。Thisonemeansalottome。 谷歌翻译:看,男人,你什么都不做。这对我来说意义重大。 搜狗手机浏览器智能翻译:听着,伙计,你什么都不用做,这对我意义重大。 翻译的关键在于两个词:look和man。谷歌的翻译也对,而看起来,搜狗手机浏览器的翻译结果更符合生活实际。 3、没有明确的句子边界。口语中没有标点符号来标志句子,也基本没有传统意义上的句子,缺少了必要的声调和停顿,很容易造成句子的歧义。 例如:这苹果不大好吃。那么该句有两种不同的理解结果:这苹果不大好吃(苹果不大,但是味道好),这苹果不大好吃(苹果味道不好)。两家AI都未能分清句子结构发音上的差别,都默认翻译为苹果味道不好。 4、非正式语体材料多。中英口语中都存在较多随意性的口语或网络用语,生活化气息浓厚,多为非正式的语体材料,智能翻译需要庞大的基础词汇库支撑。 原文:近期我们注意到国际上有一种看法,认为中国已经成为世界上最大的经济体,一方面挑战了美国的领导地位,另一方面在很多国际事务上中国仍在搭便车。请问您怎么看待这样的看法?(总理记者会上中国日报记者的现场提问) 谷歌翻译:WehaverecentlynoticedthatthereisaviewthatChinahasbecometheworld’slargesteconomy,ontheonehandchallengestheleadershipoftheUnitedStates,ontheotherhandinmanyinternationalaffairs,Chinaisstillfree。Whatdoyouthinkofthisview? 搜狗手机浏览器智能翻译:RecentlywehavenoticedaninternationalviewthatChinahasbecometheworld’slargesteconomy。Ontheonehand,itchallengestheleadershipoftheUnitedStates。Ontheotherhand,theChinesearehitchhikinginmanyinternationalaffairs。Iwouldliketoaskwhatyouthinkofthisview。 专家译文:RecentlywehavenoticedthatthereisaviewintheinternationalcommunitythatChinahasbecometheworld’slargesteconomy,ontheonehandchallengestheleadershipoftheUnitedStates,ontheotherhandinmanyinternationalaffairsinChinaisstillafreeride,howdoyouthinkofthisview? 可以说,两家AI对这段话的翻译,虽然都有些许瑕疵,但是总体都还是比较到位的,搜狗手机浏览器对于搭便车这个典型口语化词汇翻译相对更准确。 中国古诗英译一直是文化翻译的一个难题,甚至被认为是可译性最小的文学形式。我们来试验一下两家AI对王维《九月九日忆山东兄弟》的理解和翻译能力。 独在异乡为异客,每逢佳节倍思亲。遥知兄弟登高处,遍插茱萸少一人。 谷歌翻译:Aloneinaforeignlandforthestranger,everyfestivetimes。 Distinguishedbrotherascendedthethrone,whowasfullofcornelia。 搜狗手机浏览器智能翻译:Aloneinaforeignland,Imissmyrelativesmorethananythingelseduringtheholidays。Iknowmybrotherhasclimbeduptothetopandplanteddogwoodeverywhere,butonepersonismissing。 参考译文:Alone,alonelystrangerinaforeignland,Idoublypineformykinsfolkonholiday。Iknowmybrotherswould,withdogwoodsprayinhand,Climbingupthemountainandmissmesofaraway。 翻译古诗词,确实非常难为两家AI。不过,翻译的结果很有趣,搜狗手机浏览器对前两句翻译尚可,后两句翻译成了我的兄弟在高处到处种植茱萸,谷歌对最后两句完全是进行了想象性的拓展。 要跨越语言不通的鸿沟,智能翻译还需往哪加油 智能翻译确实取得了令人惊喜的进展,拿着手机和老外进行日常交流已经基本没有问题。但是智能翻译还存在短板,会有词不达意的时候,AI要想更进一步发展,和有着数十年积淀的高水平翻译员进行竞争,可能还需要从以下几个方面进行努力。 1、大量补充口语化语料 智能翻译对于口语化文本处理能力还不强,一是由于翻译语料库口语化语料不足,二是针对口语词汇与口语表达多采取直译方式,因此出现较多误译。该问题的解决应该从扩大对应部分语料库入手,增加口语类文本语料库,包括常见口语化词汇、表达与生活用语。 2、提高语境理解能力 智能翻译对于中文复杂含义句式中的时态辨别能力还不够,往往需要充分理解整句话的意思才能准确把握时态。智能翻译并非基于理解,而是基于统计学与语料库,只能做到将这句话意思大致翻译准确,在识别感情色彩方面,还有欠缺。 将神经网络学习的抽象表示和传统符号语义方法结合,建立新的基于语义的机器翻译系统,或许可以大幅提高AI对组合语义、复杂的递归语言结构的处理能力。 但,我们依然满怀期待AI让我们摆脱语言鸿沟的那一天。