神经机器翻译Networked Media Tank(NMT) - Lin Huiming (Aaron)
lin huiming
因上努力,果上随缘

神经机器翻译Networked Media Tank(NMT)

  • Lin Huiming
  • 4分钟阅读 4min read

所谓的“神经网络机器翻译”(neural machine translation,NMT),就是通过使用计算机神经网络技术,利用人工智能模仿大脑神经元进行语言翻译。NMT依赖于基于短语的统计机器翻译(phrase-based statistical machine translation,PbSMT)系统。

神经机器翻译(NMT)是一种机器翻译方法,它使用人工神经网络来预测单词序列的可能性,通常在单个集成模型中对整个句子进行建模。它们仅需要传统统计机器翻译(SMT)模型所需内存的一小部分。此外,与常规翻译系统不同,神经翻译模型的所有部分都经过(端到端)联合训练,以最大化翻译性能。

NMT使用基于神经网络的技术来实现更多上下文精确的翻译,而不是一次翻译一个单词的破碎句子。使用大型人工神经网络计算单词序列的概率,NMT将完整的句子放入一个集成模型中。

NMT的神经元可以学习和收集信息,旨在模仿人类大脑的神经元,建立联系,并将输入评估为整个单元。NMT分两个阶段进行分析:编码和解码。在编码阶段,来自源语言的文本被输入到机器中,随后被分类到语言向量中。在上下文中相似的单词将被放置在可比较的单词向量中。接下来,解码阶段有效且无缝地将矢量发送到目标语言。在整个翻译过程中,技术不仅仅是翻译单词和短语; 相反,它正在翻译上下文和信息。

特点1.

NMT“学习”语言的方法和人类并不一样。NMT依赖于统计关联性(即PbSMT)。NMT出众的点也是在于其对于语句中关联性的处理,从而根据context来判断如何给出更为具体的翻译。

特点2.

看待翻译内容的角度不同。早期MT系统关注名词、词段。但这种方法在处理“long-distance dependency”的语言时就会出现问题。而NMT系统查看的是句子的整体,甚至整个段落或文章。这让NMT能对于上下文更加敏感。

特点3.

NMT采用基于词组(phase-based)的方法,因此更有利于翻译“形态丰富的语言”(morphologically rich languages),比如德语或匈牙利语。并且能够通过词语单词构成来预测词性。

特点4.

NMT可以跨多种语言进行外推,填补训练数据的空白(zero-shot translation)。比如在MT训练中已有英语<>德语和英语<>中文的语言对,但是没有德语<>中文的语言对,那么,在没有事先训练的情况下,NMT能自动完成新语言对翻译。虽然结果可能不如训练后的成绩,但至少可以完成从不能翻译到可以翻译的进步。

该内容有帮助吗?Was this helpful?

评论 Comment

已有0人参与,点击查看更多评论