所谓的“神经网络机器翻译”(neural machine translation,NMT),就是通过使用计算机神经网络技术,利用人工智能模仿大脑神经元进行语言翻译。NMT依赖于基于短语的统计机器翻译(phrase-based statistical machine translation,PbSMT)系统。
神经机器翻译(NMT)是一种机器翻译方法,它使用人工神经网络来预测单词序列的可能性,通常在单个集成模型中对整个句子进行建模。它们仅需要传统统计机器翻译(SMT)模型所需内存的一小部分。此外,与常规翻译系统不同,神经翻译模型的所有部分都经过(端到端)联合训练,以最大化翻译性能。
NMT使用基于神经网络的技术来实现更多上下文精确的翻译,而不是一次翻译一个单词的破碎句子。使用大型人工神经网络计算单词序列的概率,NMT将完整的句子放入一个集成模型中。
NMT的神经元可以学习和收集信息,旨在模仿人类大脑的神经元,建立联系,并将输入评估为整个单元。NMT分两个阶段进行分析:编码和解码。在编码阶段,来自源语言的文本被输入到机器中,随后被分类到语言向量中。在上下文中相似的单词将被放置在可比较的单词向量中。接下来,解码阶段有效且无缝地将矢量发送到目标语言。在整个翻译过程中,技术不仅仅是翻译单词和短语; 相反,它正在翻译上下文和信息。
特点1.
NMT“学习”语言的方法和人类并不一样。NMT依赖于统计关联性(即PbSMT)。NMT出众的点也是在于其对于语句中关联性的处理,从而根据context来判断如何给出更为具体的翻译。
特点2.
看待翻译内容的角度不同。早期MT系统关注名词、词段。但这种方法在处理“long-distance dependency”的语言时就会出现问题。而NMT系统查看的是句子的整体,甚至整个段落或文章。这让NMT能对于上下文更加敏感。
特点3.
NMT采用基于词组(phase-based)的方法,因此更有利于翻译“形态丰富的语言”(morphologically rich languages),比如德语或匈牙利语。并且能够通过词语单词构成来预测词性。
特点4.
NMT可以跨多种语言进行外推,填补训练数据的空白(zero-shot translation)。比如在MT训练中已有英语<>德语和英语<>中文的语言对,但是没有德语<>中文的语言对,那么,在没有事先训练的情况下,NMT能自动完成新语言对翻译。虽然结果可能不如训练后的成绩,但至少可以完成从不能翻译到可以翻译的进步。