科技食谱

在接下来的10年里……人工智能翻译,达到人类水平?

google-translate_453.jpg

翻译的未来是人工智能?谷歌已经推出了一个名为GNMT(谷歌神经机器翻译)的系统,该系统使用人工智能进行自然翻译,这是该服务发布10周年。

此功能取代了PBMT系统,该系统基于谷歌翻译迄今为止使用的短语。整个句子可以被理解为单个翻译单元,而不是将句子机械地翻译成单词和短语。如果将整个句子理解为翻译单元,则可以从工程设计中轻松选择,并且可以提高翻译的准确性和速度。当时,谷歌宣布GNMT可以将翻译错误减少55%至85%。谷歌还补充说,使用GNMT可以实现一些但人性化的翻译。

google_002.gif

谷歌在这个例子中展示的另一个例子是中国人。在中国,每天有1800万英文翻译。因此,在3月14日(当地时间)关闭微软,用英语开发的人工智能翻译中文翻译技术的眼睛技能已达到与人工翻译相同的水平(见链接: https:// blogs。 microsoft.com/ai/machine-translation-news-test-set-human-parity/ )。

根据该报告,它通过一项名为News Test 2017(newstest2017)的测试进行评估,以确认微软开发的系统的翻译质量,并在2017年秋季举行的研究员会议WMT17上宣布。微软也表示使用外部翻译评估员将翻译结果与人工翻译进行比较,确认人工智能翻译的准确性和质量水平与人类相当。

microsoft_XD2.jpg

微软表示,机器翻译达到与人类相同质量的结果将成为翻译中最困难的语言处理工作的一个重要里程碑。

然而,仍然有许多任务要做,以便将实际的AI翻译实现到与人类相同的水平。微软还表示,实时新闻翻译技术还有很多遗留问题。即使在一般新闻中,也需要努力确保翻译质量处于同一水平。我们需要提供多种语言的翻译,这些语言更易于阅读和收听。

虽然预测人工智能将发展并且机器将代表人类工作,但值得参考2015年科学家调查的结果。在352名科学家在学术会议上发表AI相关公告的调查结果中,2024年包括一台语言解释机器。在调查中,我们将高级机器智能(HLMI)定义为机器在不借用人手的情况下比人类更好地处理所有任务的能力。调查发现,这些HLMI在未来45年内达到50%的可能性在未来9年内达到10%。其他结果预测,机器将能够在2027年驾驶卡车,在2031年取代销售人员,以及能够在2053年成为外科医生的机器。

无论如何,即使您查看这些结果,预计在未来10年左右,人工智能将能够超越业余翻译人员。然而,正如微软所说,要克服许多山峰,仍然需要学习数据来翻译数百万篇文章,以通过神经网络提高翻译率。去年,谷歌宣布了一项新技术,该技术允许神经网络学习与翻译相关的学习,而无需进行此类翻译。

传统的人工智能翻译应该有很多充当数据的文档。因此,许多语言(如英语和法语)的翻译率更高。另一方面,在次要语言的情况下,翻译准确性是不可避免的。

直到现在,如果机器学习需要人类首先告知人工智能的教学,谷歌新公布的方法是不同的。人类不能教人工智能,人工智能制作字典。语言之间存在相似之处,例如“桌面”和“椅子”这两个词经常一起使用,并且可以在基于这些共同点进行映射时制作字典。接下来是完成翻译词典,同时学习和指导几次。

与此相关的一些技术研究已经发表。这些研究涉及反向翻译或消除过程中的噪音。反向翻译将粗略翻译成另一种语言的句子翻译成原始语言。此时,如果要翻译的文档与原始文本不匹配,则神经网络执行调整处理。这样,您可以在同一文档中看到两种语言。
噪声消除类似于翻译,但是当使用反向翻译来减去或重新组织单词时,我们尝试重现原始句子。这种反向平移和噪声消除过程允许神经网络更深入地学习字符结构。

当然,即使您使用此技术,翻译准确性也不如Google翻译。然而,即使没有丰富的数据,这些技术也可能有助于翻译率的长期增长。

事实上,这些和反向翻译之间已经发表了有趣的结果。在将人工智能引入谷歌的翻译之后,例如谷歌推出的GNMT,Zero-Shot,通过尚未学习的语言组合翻译水平的能力,翻译是可能的。

GNMT基于结构化语言信息学习翻译,结构化语言信息是通过语料库的自然语言句子,语言学中的自然语言处理研究的大规模集成来构建的。这自然地转换为多种语言。当您了解这一点时,您将学会从一种语言翻译成另一种语言,但您还没有准备好任何尚未学习的语言组合。

google_006.png

但谷歌宣布,人工智能本身就可以创建语言处理的中间语。中间语言不是单词之间的1:1匹配,而是维护接近抽象概念的信息。例如,这样。英语和韩语翻译学习。如果您已学会将英语翻译成韩语,将韩语翻译成英语,那么您将学习如何将英语翻译成日语,然后再翻译。这意味着日语和韩语翻译可以在某种程度上完成。即使精度很低,也会显示平移速率。即使你没有学习翻译日语和韩语,你也可以翻译零片,因为中级语言。这使得可以认识到使用诸如GNMT的神经网络的人工智能翻译识别类似位置中的单词或句子的含义或概念。翻译人工智能的能力正变得比以往任何时候都更接近人类大脑。

谷歌还宣布它开发了一种名为Transformer的新神经网络结构,它比回归神经网络(RNN)更好,后者是一种很好的语言理解方法,如语言建模,机器翻译和查询响应。有一个酒吧。

RNN首先,用于图像识别和语音识别的常用技术是深度神经网络。您可以在特定时间点进行估算,但这还不足以了解视频的状态或理解语音的含义。为此,已经开发了能够处理战后时间序列信息的RNN。

RNN使用先前的时区中点来进行下一次输入的学习。考虑时间序列信息的网络结构。 RNN是维护时间序列信息的网络,DNN是连接时区的大型网络。这就是为什么RNN可以用于语言预测。

google_003.gif

变形金刚,谷歌的神经网络架构,据说更善于理解语言,他说学习所需的计算量远远小于其他神经网络。谷歌表示,除了提高计算性能和准确性外,变形金刚还可以在翻译或翻译某些单词时可视化句子的不同部分,并深入了解信息的传播方式。基于变压器的开发使用张量流库,并且可以通过调用一些命令来配备变压器网络作为学习环境。

围绕人工智能翻译的技术发展正如火如荼。虽然它是微软宣布的特定语言,但可以说机器翻译具有与人工翻译相同的质量,但它具有重要意义。正如专家预测的那样,人工智能翻译的时代将在未来10年内开启,随着语言的壁垒将被打破,人们将会聚集兴趣。

lswcap

lswcap

通过每月的AHC PC和HowPC杂志时代,他在网络IT媒体上观看了“技术时代”,如ZDNet,电子报互联网经理,Consumer Journal Ivers的编辑,TechHolic出版商和Venture Square的编辑。 我很好奇这个仍然充满活力的市场。

Add comment

Follow us

Don't be shy, get in touch. We love meeting interesting people and making new friends.

Most discussed

%d 블로거가 이것을 좋아합니다: